NIUHE

日々私たちが过ごしている日常というのは、実は奇迹の连続なのかもしれんな

深入理解聚类算法

聚类分析(英语:Cluster analysis)是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。

决策树 & 随机森林中的公式推导

决策树学习的生成算法主要有三种: * ID3 * Iterative Dichotomiser * C4.5 * CART * Classification And Regression Tree

决策树建立就是从特征中选择一个作为分类条件把样本划分为两个子集,然后对每个子集做同样的事情直到每个子集都属于相同的标签。所以建立决策树的关键在于每次划分子集的时候选择哪个特征,这也是上面三种算法的最主要区别,下面将一一探讨。

Powered by Hexo and Theme by Hacker
© 2019 NIUHE