融合辅助信息的推荐系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wwwhyhvcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,各种终端的普及,尤其是移动设备,网络中的数据不再是线性的增加,而是以指数的趋势在猛增。每天各种各样不同来源的数据充斥着网络。用户在这巨大的数据洪流中眼花缭乱,无法快速的获取有效的数据。如何行之有效的从这些嘈杂数据中找到用户需要的信息,成为了一个迫切的问题。而推荐系统正是解决这个问题的一个重要手段。通过推荐系统,用户可找到迎合他们兴趣的相关物品。本文主要的研究重点,就是融合辅助信息(用户的年龄、地点等,物品的文本主题信息)到推荐系统中,从而更好的给用户推荐感兴趣的物品。相比较于其他推荐方法,协同过滤因为其简单、高效、易实现等特点被广泛的运用在工业界,尤其在电影、电商领域。可是只单纯地利用户对于物品的评分进行推荐,不能够全面的反映用户,从而不利于更好的给用户做准确的推荐。而且现实中,考虑到安全、隐私等相关因素很难确定用户真实的社交关系,然而一些基本的用户信息可以通过相关方法获得。针对此问题,本文在传统算法的基础上,提出了一种融合用户信息的矩阵分解方法。主要融入了一些基本用户信息(比如,用户的地点、年龄等)到矩阵分解中。当然该方法同样也适用于其他的信息。本文通过聚类方法发现这些基本信息下用户潜在的关联,并且按照这种潜在关系的强弱程度定义了用户关系矩阵,随后将这个矩阵融入到传统的矩阵分解方法中。利用可获取的用户信息,按照这些信息的特点推理出用户之间潜在的关系,并把它融入到推荐系统中。本文通过两个真实的数据集进行实验,以均方根误差与平均绝对误差这两个指标评估预测的准确性。最终的结果表明,该方法比没有考虑到用户基本信息的方法有更好的推荐效果。物品的文本(文档)描述,作为物品一个重要的因素,而文本的主题又反应文本的主要思想。以往进行推荐时,往往没有考虑到文本的主题这个信息。本文提出了一种融合主题信息的Deep FM模型。本文利用数据采集的相关手段,获取这些文档数据。并利用机器学习有关技术,提取出文档的主题,将文档主题信息这个重要的元素融入到Deep FM模型中。同时也探究了主题的数量对于系统性能的影响。融合主题信息的Deep FM模型的优点是,不仅缓解了大规模稀疏数据中的特征组合问题,让因子分解机去充分学习低阶特征组合,又能够利用神经网络去学习高阶特征组合。为了验证该模型,本文在三个数据集上,计算了均方根误差与平均绝对误差的值,并与其他的几个模型进行了对比。从实验的结果来看,融合主题信息的Deep FM模型在提高推荐系统的性能上是有利的。最后,分析并总结了融合辅助信息的推荐系统。为了验证辅助信息对于推荐系统是有帮助的,本文设计了一个论文推荐系统,并将上述所提到的方法加入到这个论文推荐系统中,将对应的方法应用于实践。
其他文献
本论文研究的C公司是一家致力于手机等移动信息终端产品的研发、设计、制造、销售和服务的现代化高科技企业,在过去的三年里,C公司整合了旗下数十家子公司的系统,由原来的多套不同的ERP系统整合成一套集中的SAP系统,由集团信息科技部统一管理。由于系统的集中管理,IT人员每天疲于处理来自IT用户的散状问题,但仍受到业务部门的各种抱怨和压力,IT管理层充分意识到存在的IT服务管理问题已经制约了IT的继续转型
随着信息技术和移动设备的发展,特别是4G的普及以及5G的商用,视频等网络资源呈现爆发式增长。大规模的网络流量存在于网络中尤其在高峰期会造成网络回程拥挤,使得用户的请求延迟增大,降低量用户的上网体验。如何解决网络拥挤的问题是当下网络结构优化的重点。为了缓解网络拥塞和降低请求延迟,D2D缓存技术成为了一个现代通信网络重要的组成部分。人们总是在网上浏览他们感兴趣的内容。D2D缓存技术可以缓存人们比较感兴
我国的机械行业飞速发展使得XZS研究院公司不得不采取预算控制措施来达到“减支增效”的目的,以维护自己的经济利润。对成本进行有效控制可以提高重型机械制造企业与整个社会的利益,而预算控制作为一项提高利润的有效措施,更是被广泛的运用在研究院所中,财务人员可以通过成本预测、成本核算等成本管理环节对企业的预算进行控制,不仅降低了企业经营成本,还提高了工程施工企业的财务管理能力。XZS研究院是一个主要从事重型
近年来,多智能体系统(MASs)的协同控制理论研究在国内外取得了显著的成果,其成果广泛的应用于实际工程领域中,例如无人机编队飞行、军事防空部署、航天器姿态控制等领域。一致性、编队与包围控制是MASs协同控制中重要的研究方向。相比于一阶系统来讲,二阶系统更具有实际的研究意义,更进一步考虑了速度。引入事件触发机制,可以大幅度的减少控制器的更新频率。在此基础上,进一步考虑通信带宽的有限性,智能体之间通讯
人口老龄化给全球带来劳动力短缺以及政府财政负担加重等现实问题,为了应对和解决这种问题,世界各国的政策制定者试图通过对养老金制度进行改革,来确保个人工作寿命的扩大,以此来开发老年人力资源。我国政府也越来越热衷于提高中老年人的劳动参与率,政策关注点在于对退休年龄进行延迟,考虑如何促进中老年这一群体的就业。当今社会,年轻女性劳动参与率不断提高,这就使得由她们照料孩子的责任转移到了孩子的(外)祖父母一代,
说话人识别,作为生物特征识别的重要组成部分,广泛应用于军队安全系统、公安司法、生物医学工程等领域。目前,在安静的实验室环境下以及语音数据充足的条件下,说话人识别技术已经达到令人满意的效果。然而,实际应用环境无法预测,导致说话人识别系统鲁棒性差。因此,本文以提升说话人识别方法在噪声情况下的鲁棒性为出发点,针对说话人识别中特征表达能力不足、模型区分性不够、传统方法中各个模块相互独立训练的问题,提出以下
随着无线通信技术的蓬勃发展,种类繁多的无线通信设备的使用使得稀缺的无线频谱资源愈发拥挤。电磁环境异常检测方法可以为监管并规范大量用频设备合规使用频谱资源提供技术支持。另外,网络安全已成为一个全球性的问题,无线物理层的电磁环境安全检测是网络安全防御的重要内容。现有的通信方式产生的电磁信号很容易被拦截或渗透,如果能够检测出异常电磁信号的种类,将提升通信系统对异常电磁信号的主动防御能力。因此如何有效地把
随着科学技术的发展以及时代的进步,移动机器人不仅在工业领域得到广泛的应用,在人们的日常生活中也扮演着各种重要的角色。路径规划作为移动机器人导航任务中的重要一环引起了众多学者的关注。蚁群算法由于本身的并行性更加利于分布式计算,并且具有较高的鲁棒性,含有启发式的结构特点使其易与其他方法结合。这些优势使其在解决复杂环境下的路径规划有一定的优越性。但蚁群算法在寻优过程中仍有搜索效率低、搜索停滞、易陷入局部
知识型员工在当今知识经济时代发挥着重要的战略资源作用。随着科技技术的不断发展和大部分新生代知识型员工的步入职场,生长在新时代的一代人,成为当今时代发展的主军力量,
随着流动儿童群体的日益扩大,流动儿童的人际交往问题成为社会工作研究的一个重点领域。流动儿童跟随父母进入城市,面临着教育模式转变、离开原生文化和社会环境的一些问题。