【摘 要】
:
近年来,随着网络发展的多元化,信息过载问题日益严重。分类目录和搜索引擎是早期出现的解决信息过载问题的两类主流方案。但是随着互联网规模的不断扩大,分类目录网站只能覆盖有限的热门网站,而搜索引擎则需要用户主动提供关键词来寻找信息,在用户不清楚自己需求的情况下具有很大的局限性。这时,个性化推荐技术应运而生。个性化推荐技术可以分析和挖掘用户潜在偏好,是解决大数据时代信息冗余问题、提高人们信息获取的效率和质
论文部分内容阅读
近年来,随着网络发展的多元化,信息过载问题日益严重。分类目录和搜索引擎是早期出现的解决信息过载问题的两类主流方案。但是随着互联网规模的不断扩大,分类目录网站只能覆盖有限的热门网站,而搜索引擎则需要用户主动提供关键词来寻找信息,在用户不清楚自己需求的情况下具有很大的局限性。这时,个性化推荐技术应运而生。个性化推荐技术可以分析和挖掘用户潜在偏好,是解决大数据时代信息冗余问题、提高人们信息获取的效率和质量的重要手段。本项研究工作研究了基于评分预测的个性化推荐算法,并从基于邻域和基于学习两个方面进行算法的优化。这里的“评分”指广义的评分,即用户对物品的偏好分值,不只是狭义的用户打分。实验结果表明,对比优化前的算法,本项研究工作实现了更高精度和鲁棒性的个性化推荐。本论文的研究内容和贡献包括以下方面:1.在基于邻域的评分预测推荐中,针对传统的基于用户的推荐算法中存在的不足,如忽略用户评分归一化的必要性、以及用户相似度计算中加权用户属性而导致推荐不准确等问题,本项研究工作以用户相似度计算的改进为中心,进行用户评分归一化、用户评分的Jaccard相似性计算方法改进、加入用户属性相似度,并与用户评分相似度线性结合,最终提出了一个优化的基于用户的协同过滤推荐算法O-recommend。并通过实验,验证了用户综合相似度计算中用户评分归一化和评分相似度计算方法优化以及加权用户属性三点改进的必要性,并证明改进算法提高了推荐精度。2.在基于学习的评分预测推荐中,针对传统推荐算法主要基于显式反馈信息,即用户对商品的独立选择进行预测的方法中存在的不足,本项研究工作提出了一种基于多类型隐式反馈的推荐系统MIF,将商品对而非单个商品作为用户兴趣建模的基础,引入商品比较信息这一重要的隐式反馈信息,基于贝叶斯的排序模型来建模商品间的比较关系,并对不同类型的隐式比较行为赋予不同的置信度,最后通过实验验证了改进算法的有效性。
其他文献
在软件工程领域,学者们对代码克隆检测技术的研究从来未停止过。代码克隆检测的目的是为了找出软件系统中存在的克隆,通过分析克隆对软件质量的影响来利用有益克隆,同时对软件质量造成威胁的有害克隆进行规避或重构,从而提升软件系统的质量,提高软件人员的开发效率并减少软件维护成本。到目前为止,在克隆检测领域不同方法和技术的积累,主流检测技术分为基于代码语法结构的检测和非语法结构检测。基于非语法结构检测又分为基于
同步协同搜索系统是指支持两个或两个以上的具有类似信息需求的用户进行实时交互以执行协同搜索的系统。通常,同步协同搜索系统会提供一个社交引擎以允许同一组内的用户进行通信。但是,当社交引擎中的用户人数不足时,社交引擎就会遇到冷启动问题,无法很好地执行协同搜索。在本文中,我们提出了一种新颖的基于智能问答的同步协同搜索系统。我们在社交引擎中加入智能问答引擎Infobot以支持用户和搜索引擎之间的实时交互,同
相对基于光强、光谱等信息的传统光学成像与测量技术而言,偏振成像和偏振测量技术利用光的偏振特性获取目标场景的偏振信息实现多维尺度的目标识别与探测,是一种高效的光学探测、识别技术。特别地,偏振成像技术与数字处理技术相结合可有效解决传统光学在目标检测和识别领域无法解决的问题,拓宽偏振光学的研究领域和应用场景。在各类偏振成像系统中,基于分焦平面(Division of Focal Plane,DoFP)线
目前在工业生产和制造领域,大量的零件X光影像数据都是以实体胶片的形式存放,而不是数字影像,不仅导致管理成本的不断增高,且无法挖掘存在的数据价值,造成了巨大的浪费。随着生产的推进和发展有更多的X光实体胶片产生,给企业的数据存储以及管理带来了较高的成本以及资源浪费,且经实体胶片转化后的数字影像也无法得到有效的管理和利用。最近几十年以来,计算机技术及其应用的高速发展,工厂使用计算机进行数字化信息管理的优
随着定位、导航、轨迹分析和轨迹预测等基于位置服务(LBS)的广泛应用,越来越多的智能手机用户安装基于位置服务的APP,这类APP产生的位置数据能够为交通研究者带来大量信息。如今,基于位置的服务已经成为广大交通研究者不断研究和突破的技术课题,而智能手机产生的位置数据与电子地图的校准则成为这些技术的核心环节。利用智能手机获取位置信息有三种方式,分别为手机GPS、手机基站以及利用Wi-Fi进行定位。然而
逼真的声音传播效果可以提高虚拟现实系统的沉浸感和交互性,声音传播模拟技术现已成为计算机图形学领域的一个重要分支。目前计算机图形学领域的声音传播模拟技术较少甚至没有考虑水下声传播的特殊性,因此难以直接应用于水下场景。本文提出了一个针对水下特殊环境的声音传播模型。将水声学领域中适用于计算水下声场的简正波方法与计算机图形学中可以捕捉场景几何信息的射线跟踪方法进行耦合。同时基于阈值参数控制射线模型的切换以
自动检测出通过一扇门的人员的身份和移动方向对于日常生活中很多的场景都具有实际意义。例如,它可以帮助跟踪多个房间的中工人分布情况,更好地确定任务分配。然而,现有的解决方案通常需要在很多的限制下才能发挥很好的效果,这在很多工业工厂是很难满足的。例如,基于计算机视觉的解决方案需要摄像机和人脸之间的视线之间不被物体遮挡;而生物识别技术需要非常干净的指纹等特征才可以发挥不错的作用。在本文中,我们利用RFID
复杂多变的光照给计算机视觉领域的研究带来了许多挑战,特别是对于实时单目视觉定位与建图算法(SLAM)。近年来,SLAM系统在普通光照环境下已经可以完成精准的定位建图任务,但在弱光照环境或者阴影环境下,前沿的SLAM系统也往往因为其视觉前端光照鲁棒性不足而导致跟踪出现问题。对于弱光照环境下的SLAM视觉前端鲁棒性问题,本文首先通过改进现有的成熟SLAM系统的视觉前端,提出了一种基于双特征算法的图像特
随着物联网、大数据和人工智能等技术的发展,视觉目标跟踪依然是计算机视觉领域热点研究方向,具有广泛的应用价值,如无人驾驶、智能监控、医疗诊断及行为分析等方面。视觉目标跟踪任务是在给定初始帧的目标位置信息的情况下,准确可靠地预测后续视频序列中目标的位置和大小。视觉目标跟踪过程中通常会面临许多挑战,如目标间遮挡、目标外观模糊、旋转及光照变化等,这些复杂的因素都对视觉目标跟踪算法的判别能力提出了更强的挑战
语言模型,尤其是神经网络语言模型,在自然语言处理和信息检索任务中至关重要。最近人们提出了量子语言模型(QLM),它使用相同的概率空间来统一单个单词和词组的表示,而不必像以前的研究那样人为地扩展词空间。神经网络类量子语言模型(NNQLM)将QLM扩展到端到端体系中,通过自下而上的方法来构建密度矩阵,替代了QLM复杂的迭代估计算法。众所周知位置信息对语言模型尤为重要,但无论是QLM还是NNQLM都仅是