摘要:谱聚类算法是一种可有效学习数据流形分布和非凸状分布的聚类算法,但其过程涉及构建相似图、特征分解等高计算复杂度步骤,难以直接用于大规模聚类.提出一种基于二部图的快速聚类算法(fast clustering based on bipartite graph,FCBG),通过对数据采样降低原有数据结构规模,然后基于二部图学习采样数据和原有数据关系.通过对二部图对应的拉普拉斯矩阵施加秩约束,FCBG算法可在优化二部图的边的权重的同时,保持二部图的类簇结构,最终直接给出聚类结果,不依赖构图时每条边的初始权重分配.算法计算复杂度与数据大小呈线性关系.实验表明,FCBG算法可有效学部图的权重,并在较少的时间消耗下获得高质量的聚类结果.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社。
深圳大学学报·人文社会科学版杂志, 双月刊,本刊重视学术导向,坚持科学性、学术性、先进性、创新性,刊载内容涉及的栏目:文明对话与文化比较、创意经济与文化产业、经济增长与金融创新、政治空间与法治社会、城乡建设与社会治理、人文天地与中国精神等。于1984年经新闻总署批准的正规刊物。