摘要:孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Marketbasket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社。
深圳大学学报·人文社会科学版杂志, 双月刊,本刊重视学术导向,坚持科学性、学术性、先进性、创新性,刊载内容涉及的栏目:文明对话与文化比较、创意经济与文化产业、经济增长与金融创新、政治空间与法治社会、城乡建设与社会治理、人文天地与中国精神等。于1984年经新闻总署批准的正规刊物。