聚类算法
聚类算法KMeansKmeans算法,也被称为K-平均或K-均值,是一种得到最广泛使用的聚类算法,主要思想是:首先将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,然后把每个数据点划分到最近的类别中,使得评价聚类性能的准则函数达到最优,从而使同一个类中的对象相似度比较高,而不同类之间的对象的相似度较小
算法优点:理论清晰,算法简单,算法收敛速度很快,仅需20次以内的迭代就能得出最终聚类结果,适用于发现球形聚类簇
算法缺点:算法结果依赖初始中心的选取,如果算法初值选取不当,会陷入局部最优解,不能发现非球形聚类簇,不能发现差别很大的类,对噪声和孤立点很敏感
EM最大期望算法是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。最大期望经常用在机器学习和计算机视觉数据聚类领域,最大期望算法经过两个步骤交替计算,第一步是计算期望,利用对隐藏变量的现有估计值,计算最大似然估计值,第二步最大化,最大化在计算期望上求得的最大似然值计算参数的值,最大化上找的参数估计值被用于下一个计算期望的步骤中,两个步骤交替进行。
算法优点:最大期望算法计算结构稳定,准确,算法可以给出 ...