论文部分内容阅读
近年来糖尿病患病率逐年攀升,国际糖尿病联盟在2017年第八版糖尿病概览中显示,全球成年糖尿病患者数量已经达到4.25亿,我国更是占了约1/4。在严峻的糖尿病防控形势中,血糖检测技术起到了关键作用。无创血糖检测技术因其无创伤、无感染等诸多优势,引起了国内外学者与医院媒体等广泛关注。在基于能量代谢守恒法的无创血糖检测方法的研究中,因无创生理参数相对血糖真值更容易获取,病理数据库中未有血糖真值标记的样本数量远大于具有标记的样本,若能将这些未标记病例数据用于无创血糖算法性能的提升,将提高血糖检测准确率、降低样本采集要求,对今后无创血糖检测算法的进一步研究具有重要意义。 本研究将半监督学习的方法引入无创血糖检测算法中用以解决上述问题。首先以支持向量机算法为基本模型,讨论了分类问题中 TSVM 技术与协同训练技术对原支持向量机算法性能的提升作用,通过合适的参数设置使得TSVM与协同训练SVM分别提高了原算法在 Arrhythmia 数据集上的分类能力,研究了不同标记率设置对性能提升的影响。另外,同样以支持向量机为基本模型,在回归问题中研究了Co-SVR算法对原算法性能的提升作用,直观地展现了数据的流形假设对算法性能优化起到的关键作用,并结合Tri-training的优势提出了一种改进协同训练SVR算法,与Co-SVR相比在保证准确率的情况下极大地降低了算法时间复杂度。最后,利用无创血糖检测中关键参数的天然视图分割,提出了一种基于多视图的半监督无创血糖检测算法,该算法可以有效利用未标记数据,在标记率较低的无创血糖数据集上有明显的性能提升作用。 结果表明,相比仅利用有标记样本的有监督学习,利用了未标记无创血糖样本的半监督学习在Arrhythmia数据集、自建数据集、无创血糖数据集上均能有效提升模型的泛化能力。半监督学习的引入使无创血糖检测中未标记样本得以有效利用,降低了对无创血糖样本的要求,充分利用了已有数据,为无创血糖检测算法的进一步研究提供了新思路。