面向异构社交网络的个性化推荐技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:yinhongtao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及与Web2.0技术的日益成熟,网络数据爆炸式增长,人们被淹没在浩如烟海的数据汪洋中而难以获取有用价值的信息。个性化推荐系统作为帮助人们获取有用信息、有效解决信息过载问题的工具,受到业界广泛关注。与此同时,随着社交网络的迅速发展与普及,基于社交网络的推荐算法成为推荐系统中一个新的研究热点。传统个性化推荐系统大多关注于只含单一物品类型、单一用户-物品关系的应用,无法适用于社交网络这一具有多种物品类型以及多种用户行为关系的复杂异构信息网络。因此,如何有效利用社交网络的异构性信息成为推荐系统领域的研究热点。与此同时,传统推荐系统大多致力于改进基于评分预测的推荐算法性能,然而推荐系统的真实目的是找到用户最有可能感兴趣的Top-N个推荐对象,而不是预测用户对推荐对象打多少分,因而基于评分预测的推荐内容不具有排序性。因此,面向排序的Top-N的推荐算法正受到越来越多的研究者们的关注。此外,由于基于评分预测的推荐算法采用的是显式用户反馈的数据,而显式用户反馈在实际生活中要比诸如用户历史购买、浏览记录等的隐式反馈少的多,因而基于评分预测的推荐算法常常存在数据稀疏、冷启动等问题,如何利用隐式用户反馈来改善、避免由数据稀疏、冷启动引起的问题也是推荐系统领域重要的研究方向。论文在分析和总结现有个性化推荐技术的基础上,对隐式用户反馈下的异构社交网络的Top-N推荐问题进行了研究。针对异构社交网络,论文在分析主流的基于路径间语义的相似度测量算法以及这些方法优缺点的基础上,对不同类型对象之间的相似度测量进行了研究,提出了以量化、集成同一路径不同位置的相似度为途径,利用路径间(inter-path)和路径内(intra-path)的相似度语义信息的相似度测量算法HybSim。进一步的,论文以HybSim为相似度测量算法,以贝叶斯排序优化为学习方法,在隐式用户反馈下的异构社交网络中,量化、集成多条元路径的相似度语义,进而建立了基于贝叶斯排序优化的Top-N推荐算法HybRec。该推荐算法通过利用社交网络中的异构性信息以及隐式用户反馈,能有效解决数据稀疏、冷启动等问题,进而提升推荐系统的性能。论文工作的主要创新性成果如下:1.针对现有异构社交网络的相似度测量算法的不足,论文对异构社交网络中不同类型对象之间的相似度语义进行了研究,提出了基于异步双向随机游走的相似度测量算法HybSimo该算法能够充分挖掘异构社交网络中的路径间(inter-path)和路径内(intra-path)的相似度语义信息,有效提高相似度测量的准确性。2.针对传统推荐系统无法利用社交网络的异构性以及隐式用户反馈数据而导致的数据稀疏、冷启动等问题以及进而造成推荐性能下降的问题,论文对隐式用户反馈下的Top-N推荐问题进行了研究。论文首先将隐式用户反馈以及社交网络组织成一个异构社交网络,然后通过HybSim相似度测量算法量化元路径的相似度语义。在此基础上,利用面向排序的贝叶斯排序优化(Bayesian Personalized Ranking)[44]方法集成不同元路径的相似度,提出了一个基于异构社交网络中多种混合信息的Top-N推荐算法HybRec,有效解决了数据稀疏等问题,进而提升了推荐系统的性能。3.论文利用DouBan和RT-IMDb两个真实数据集,对相似度算法HybSim和推荐算法HybRec进行实验评估。实验分别从相似度测量准确度和推荐算法分类准确度验证了算法的有效性,证实了通过综合路径间与路径内的相似度语义能够提升推荐系统的质量。
其他文献
随着高性能微处理器、计算机分布式软件、高速互联网络、移动通信等技术的飞速发展,集群服务器、网格计算系统的潜在重要性已凸现出来,成为学术和工业界共同关注的一个研究热
该文试图实现一个以SSL为基础,灵活使用HASH和RSA(或DSS)数字签名技术以满足身份鉴别和交易信息认证的不同需要,提供数字签名及双方的不可否认等功能的电子支付系统.并且通过
随着计算机的不断发展,人们对软件质量和可靠性要求也不断提高,带动了软件测试的发展。软件测试不仅贯彻开发过程的始终,在整个开发过程中所占的比例也逐渐加大,同时,围绕软件测试
双目立体视觉是计算机视觉领域的一个重点热点研究问题,它由左右两台摄像机拍摄同一场景,通过计算空间点在左右图像中成像点的位置视差,然后结合摄像机标定参数和三角视差原
该文所研究的面向环绕智能的家庭网络,是将家庭环境置身于环绕智能的领域之中,建立包括传感器网络、数据网络、视频A/V网络以及控制网络等为一体的情境感知家庭环境,研究家庭
随着互联网的普及,互联网上的信息成爆炸式的增长。为了应对信息爆炸,需要某种自动化的工具帮助人们从海量的电子文档中找到真正需要的信息。正是在这样的背景下,信息抽取(In
该文从数据挖掘的概念出发,对数据挖掘与信息处理、数据挖掘与分析处理、数据挖掘与数据库中的知识发现、数据挖掘与客户关系管理进行了分析和对比.围绕商业数据挖掘中的核心
该文的引言描述了Web服务这一新的分布式计算模型产生的背景,简单介绍了Web服务和它的特点以及它作为下一代分布式系统核心的原因.在DCOM和CORBA中客户进程与对象服务器之间
大屏幕显示系统具有高分辨率、超大物理尺寸、沉浸感的特点,在众多领域都有实际的应用需求,比如虚拟现实,工业设计,娱乐等。但是传统的大屏幕显示系统是使用多个光学屏幕拼接
该课题在设计并实现了一种先进的网络视频监控系统——WitNET-VideoSystem的基础上,针对视频监控系统中的核心——音视频传输技术进行了详细的研究,着重分析了RTP协议、RTCP