迁移学习研究及其在心理特征预测中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:moovent_chrisx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中,经常存在测试集(目标集)和训练集(辅助集)的数据分布或特征空间不一致的情况,不满足机器学习的独立同分布假设,传统监督学习方法表现不佳。为了解决这类问题,迁移学习研究逐渐发展起来,并引起越来越多的关注。由于因特网的普遍使用,利用网络行为预测用户的心理特征可以帮助我们及时了解用户的心理特征,逐渐成为跨学科的研究热点。但是同样存在网络行为测试集(目标集)与训练集(辅助集)分布或特征空间不同的情况,需要利用迁移学习改进心理特征预测的模型。本文开展如下工作:  针对同构迁移条件下数据分布不同的情况,本文提出了局部迁移学习回归方法和基于位移的Kernel Mean Match(KMM)迁移方法。局部迁移学习回归方法包括基于聚类估计法和k-NN估计法的迁移学习回归方法,通过以局部方法估计训练集数据在测试集分布下的权重,结合回归学习以加权误差的形式训练模型,其中基于k-NN估计法的迁移学习回归比传统的监督学习方法在人格预测中提高了预测精度,均方误差(MSE)最高可降低30%。基于位移的KMM偏移方法,将协变量偏移扩展到领域偏移,实验结果表明预测精度比监督学习和KMM方法分别最大提高约9%和10%。  针对特征空间不同的异构迁移学习情况,本文提出了基于线性核和基于平移不变核的异构迁移学习方法。使用核方法来进行异构转换并采用图正则项在转换中保持原数据的拓扑性质。其中基于线性核的方法,简单易用,在人格预测中精度最高可达88%。基于平移不变核的方法能够有效处理非线性异构变换并保持数据的平移不变性,在实验中目标集样本较少的情况时,预测精度比监督学习最多可提高12%。  针对网络行为预测心理特征中存在的测试集(目标集)和训练集(辅助集)的数据分布和特征空间不一致问题,本文提出了心理预测的迁移学习流程框架,利用迁移学习对微博数据集上跨性别和跨地区用户进行人格和抑郁预测,以及在微博和人人网的异构数据集上对人格预测等进行了方法应用,结果表明,迁移学习方法能够有效提高预测精度,改善心理特征预测模型的性能。
其他文献
CMM (the Capability Maturity Model),软件能力成熟度模型,是美国卡耐基梅隆大学(CMU)的软件工程学院(SEI)的一项著名研究成果,该模型可用来评估软件开发机构的软件成熟度级别,
随着企业信息化、网络化的逐步深入,企业内部的网络基础设施与工作组计算环境日益完善,这为工作流技术在企业中的应用、实施提供了可能的条件.工作流技术作为一种实现企业过
该文在总结归纳C2体系结构风格对软件重用所具有的指导性意义基础之上,提出了把C2体系结构风格引入到分布式应用系统开发和企业应用系统开发中,并提出了基于J2EE技术实现C2体
政府信息化建设的重点已经从政府机关内部的办公自动化系统以及政府对外信息发布和反馈平台建设向政府部门间的信息共享和通信系统建设转移,系统建设更侧重于信息的充分共享
互联网络技术的飞速发展,网络管理的地位也越来越重要.如何保证网络高效、安全而且稳定的运行是网络管理所要达到的目的.该文首先介绍了网络管理的发展趋势和重要性.然后介绍
随着数据库应用的不断深化,数据库的规模急剧膨胀,但是数据库管理系统却没有提供有效的工具和方法来利用这些数据,因此充分利用数据进行决策支持成为当今最需要深入研究的领域。
XML是一种承诺创建定制的标记集合以对特定类型信息编码的元语言。它不是一种具体的解决方案,而是一个用来设计标记的schema。XML关注内容,它使数据和数据的表示形式分开。用XM
网络应用中内容主导的系统需要管理海量的多维数据,比如新闻网页中的标题、图片、作者、时间等多维信息;拼接成网页地址的多个字符串片段;视频分发系统中描述一个片段的多个特
该文详细介绍了对支持预测模型构造的面向对象软件设计度量系统OODMS(Object-Oriented Design Metrics System)的系统设计和部分实现工作.该系统由软件设计度量和预测模型构
该文以模糊数学的理论为基础研究演化算法求解模糊多目标优化问题.该文首先为多目标优化问题的演化求解作了一些理论上的准备工作,将可行性、最优性、占优的概念拓宽到模糊数