摘要:本文对新浪微博的博文一周后受到的转发、评价、点赞的次数进行了分析及预测.首先采用聚类分析法,从训练集横向和纵向、微博特征及用户行为特点三个角度做了分析,得出了三种用户行为与微博数量的关系、三种用户行为之间的关系及用户行为具有均值的特点,然后结合分析结果,提出使用计算类别集合代替传统的求距离,使用双层对象代替单层对象的改进的KNN算法,使传统KNN算法成为可预测模型.最后的实例仿真表明改进后的KNN算法相对于其他传统预测方法 F1评估值平均提高了5.15%.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社