基于信息增益和基尼不纯度的K近邻算法

作者:孙傲; 赵礼峰 南京邮电大学理学院; 江苏南京210023

摘要:传统K近邻算法忽略每个属性对分类的不同重要程度,将每个属性同等看待,在计算样本间距离时赋予每个属性相同的权重,影响样本分类的正确性。利用单一指标来确定属性重要性过于片面,无法全面反应属性对分类的重要程度。针对这一问题,利用信息增益和基尼不纯度的综合指标作为判断属性重要程度的指标,该综合指标越大,属性对分类的重要程度越高。并依据综合指标构造属性权重,计算样本间的加权距离进行分类。为验证该方法的有效性,分别基于UCI数据库中Iris数据集和Wine数据集对基于信息增益和基尼不纯度综合指标的加权K近邻算法进行仿真实验,并与传统K近邻算法和基于信息增益加权K近邻算法进行对比,基于信息增益和基尼不纯度综合指标的加权K近邻算法错误率均低于传统K近邻算法和基于信息增益加权K近邻算法。结果表明该方法比传统K近邻法和基于单一指标加权K近邻算法能更有效地对样本进行分类。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机技术与发展

统计源期刊 下单

国际刊号:1673-629X

国内刊号:61-1450/TP

杂志详情
相关热门期刊

服务介绍LITERATURE

正规发表流程 全程指导

多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。

保障正刊 双刊号

推荐期刊保障正刊,评职认可,企业资质合规可查。

用户信息严格保密

诚信服务,签订协议,严格保密用户信息,提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。