论文部分内容阅读
基于二元相似性度量的图半监督学习算法研究
【摘 要】
:
数据分析的一项重要任务是对样本类别进行划分及预测,这就要求有足够的包含代表其类别信息的标签数据来训练学习器,然而数据标注需要耗费巨大的人力物力,大大增加了标记数据的获取成本。相反,无标记数据的获取相对便捷,通过一些简单的信息技术工具就可采集到大量无标记数据。遗憾的是,仅利用无标记数据又会产生对数据分类不精确的问题。因此,人们提出了半监督学习这一技术,通过在少量的标记数据中引入大量无标记数据来降低数
【机 构】
:
山西财经大学
【出 处】
:
山西财经大学
【发表日期】
:
2021年01期
【基金项目】
:
其他文献
数据不平衡问题是目前的研究热点之一,其广泛存在于疾病检测、金融欺诈、入侵检测等众多领域。不平衡数据的主要特点为少数类样本少且难以识别,但往往又具有较高的价值。所以,解决数据不平衡问题应在不影响总体准确率的前提下提高少数类样本的识别率。目前数据不平衡问题的处理方法主要为数据层面方法和算法层面方法,数据层面的欠采样和过采样是有效的不平衡数据处理方法,但单独的欠采样方法易丢失有价值信息,单独的过采样方法
学位