- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 Mahout Canopy源码分析
Canopy Clustering Canopy算法介绍: 1.选择简单,计算代价低的方法计算对象相似性,将相似的对象放在一个Canopy子集下通过计算得到若干Canopy, Canopy之间可以重叠,不存在某个对象不属于任何Canopy。 2.Canopy算法一般做为数据预处理。通过计算得到的几个簇,从每个簇中选取一个理中心点最近的点(中心点)作为其他聚类(k-means)的初始中心。
2014-07-26 14:06:17 616
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人