摘要:目的应用不同机器学习算法预测男男性行为(MSM)人群HIV感染状况的比较。方法将四种机器学习算法(logistic回归、神经网络、随机森林和支持向量机)的预测结果和实验室的检测结果相比较,分类性能的评价指标采用ROC曲线下面积(AUC)、灵敏度、特异度和准确度(PRE)。结果四种算法在训练集和测试集上均具有较理想的分类效能,训练集的结果略好于测试集。和logistic回归分析相比较,其他几种算法均提高了分类预测效能:神经网络提高18.4%(AUC:0.909,95%CI:0.903~0.915),随机森林提高19.7%(AUC:0.922,95%CI:0.920~0.924),支持向量机提高22.3%(AUC:0.948,95%CI:0.947~0.949)。其中支持向量机的分类性能最好,分类的灵敏度为97.5%,特异度为99.1%,准确度(PRE)为98.9%。结论机器学习算法显著地提高了MSM人群中HIV感染的预测效能,可以较准确地识别MSM人群中HIV感染者与未感染者,为及时地提供预防与治疗服务提供了依据,同时避免了医疗资源的浪费。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社