[1]ANAND R,JEFFREY D U.大数据:互联网大规模数据挖掘与分布式处理[M].王斌,译.北京:人民邮电出版社,2012.
[2]陆嘉恒.Hadoop实战[M].2版.北京:机械工业出版社,2012.
[3]WHITE T.Hadoop权威指南[M].周敏奇,钱卫宁,金澈清,等,译.北京:清华大学出版社,2011.
[4]ZHANG T,RAMAKRISHNAN R,LIVNY M.BIRCH:an efficient data clustering method for very large databases[C].Proc.ACM SIGMOD Intl.Conf.on Management of data,1996:103-114.
[5]GUHA S,RASTOGI R,SHIM K.CURE:An efficient clustering algorithm for large databases[C].Proc.ACM SIGMOD Intl.Conf.on Management of Data,1998:73-84.
[6]汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304.
[7]陈光平,王文鹏,黄俊.一种改进初始聚类中心选择的K-means算法[J].小型微型计算机系统,2012,33(6):1320-1323.
[8]张玉芳,毛嘉莉,熊忠阳.一种改进的K-means算法[J].计算机应用,2003,23(8):31-33,60.
[9]赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程应用,2008,44(10):147-149.
[10]袁方,周志勇,宋鑫.初始聚类中心优化的K-means算法[J].计算机工程,2009,32(8)65-66. |