摘要:随机森林算法是一类在机器学习中较为常见的算法,其在数据的分类以及非参数回归中都有重要的作用。如何更好地处理数据,进行特征选择是随机森林的重点研究领域。自编码神经网络在深度学习中有着不可替代的作用,其在数据压缩、特征提取等方面有着优异的性能。结合两者优点,提出一种基于使用稀疏降噪自编码器对原始数据进行特征提取的随机森林算法。采用多种常用数据集进行实验分析,对原始数据分别采用不同的特征提取方法,并利用随机森林将提取后的特征进行分类。实验结果表明,利用稀疏降噪自编码神经网络进行特征提取所得到的特征,能够使随机森林的分类精度得到一定程度的提高。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社。
统计与信息论坛杂志, 月刊,本刊重视学术导向,坚持科学性、学术性、先进性、创新性,刊载内容涉及的栏目:统计理论与方法、经济统计、财政与金融统计、资源与环境统计、社会与管理统计等。于1986年经新闻总署批准的正规刊物。