【摘 要】
:
用户基础属性的预测主要是对用户的性别、年龄、职业、地理位置和文化程度等基本信息的分类。用户的基础属性的预测研究是机器学习领域的热门问题之一,也是大数据应用的研究热
论文部分内容阅读
用户基础属性的预测主要是对用户的性别、年龄、职业、地理位置和文化程度等基本信息的分类。用户的基础属性的预测研究是机器学习领域的热门问题之一,也是大数据应用的研究热点。 本文研究的主题是通过分析影评网站中用户对电影的打分行为数据预测出用户的基本属性信息。通过深度学习理论、矩阵分解技术和多任务学习方法多种理论方法解决用户属性分类问题,提出了基于深度神经网络的用户属性预测的单任务学习方法和多任务学习方法,本文主要包括以下几个方面的工作: 基于矩阵分解技术,研究并提出一种对稀疏的用户打分数据进行填充的方法。将用户对电影的打分数据作为用户的属性特征,为克服输入数据的稀疏性问题,基于隐语义模型,对稀疏的输入数据进行填充。 提出了一种基于矩阵分解的深度神经网络单任务模型。将填充后的用户行为数据作为网络的输入,结合深度学习技术和多标签学习,对用户行为打分数据进行特征提取,实现数据深层特征的学习。通过常用分类算法的对比分析,证明该算法的有效性。 提出了一种基于深度神经网络的多任务学习方法。通过对用户属性的分析研究,发现用户不同属性之间的相关性,基于用户属性之间的相互联系,提出了一种同时对多个属性进行学习预测的多任务模型。在原有的基于深度学习的单任务学习方法的基础上,提出一种多任务学习模型,将样本标签表征为结构化数据,通过不同属性任务之间的模型参数共享实现对多个属性的同时预测。并对各种方法进行实验对比分析,证明了本文提出方法的有效性。
其他文献
离群点识别和聚类分析是数据挖掘研究的重要方面,基于离群点分析的各种数据挖掘算法的研究已经成为研究热门方向。但是目前大多数的离群点分析算法只是针对于静态数据集的操
搜索引擎是人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前随着Internet信息的爆炸增长以及信息多元化的发展,快速有效地获取需要的相关信息变得越来越困
计算机技术的迅猛发展,给人们的工作和生活带来了前所未有的便利和效率,网络技术的普及又使其如虎添翼,走进社会生活的各个领域,成为人类社会不可或缺的一部分。然而网络攻击
随着语义网的提出和相关技术的发展与成熟,该领域吸引了学术界、政府部门和工业界的广泛关注和积极参与。关联数据作为语义网的最佳实践,越来越成为研究的热点。资源描述框架
无线传感器网络(WSNs)作为物联网的重要组成部分之一,已经被广泛地应用于环境监控、医疗检测和军事部署等相关领域。然而传感器节点存在诸多的资源限制,这给wSNs地大规模部署
序列图像的运动分析是诸多学术领域,如计算机视觉、人工智能、模式识别等广泛关注的一个课题,指从静态序列图像中获得关于运动物体以及运动本身的特征,包括运动目标是否存在,运动
随着生物信息学的发展和对RNA研究的深入,RNA已经不仅是从DNA到蛋白质的信息传递者,在RNA病毒和某些动物细胞中,RNA还是遗传信息的载体,控制蛋白质的合成,甚至在某些癌细胞和
税务机关是关系国计民生的一个重要的管理机构,它与企业的发展息息相关,每一个企业发生的业务都会在税务系统数据库中留下记录。因此税务系统数据库中积累了大量的企业数据,
自2004年以来,一种新型的网络攻击平台引起了人们的重视,它就是僵尸网络。一个僵尸网络控制的计算机数量众多,并且被控制计算机分布于不同的网络。它可以造成包括拒绝服务攻击、
随着World Wide Web(WWW)的飞速发展,整个Web信息已经被各种各样可搜索的在线数据库所深化。这些信息被隐藏在Web查询接口之后,由站点后台数据库动态产生,而传统搜索引擎受技