基于查询网络的文档推荐策略研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhoujans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的日益普及,Web上的信息量呈爆炸性增长。由于互连网上信息资源的极大丰富,信息服务的个性化越来越引起人们的重视。人们对信息获取的目的逐渐从查全转变为查准,满足特定用户的特定信息需求成为信息服务在新的网络环境中的服务目标。智能推荐系统(Intelligent Recommendation System)就在这个背景下应运而生。它能够向客户推荐文档或产品,并可以引导客户有针对性的对文档信息或某些产品信息进行关注。推荐系统的核心是推荐的方法,也是本文研究的重点。本文以用户的查询访问日志为基础,分析用户的查询访问行为,挖掘用户的兴趣偏好,并以此构建查询网络图,提出了基于查询网络的文档推荐模型。该模型结合了传统推荐方法如基于协同过滤推荐和基于内容推荐等方法的优点,同时避免了它们的不足之处,极大的提高了在未知文档内容情况下的文档推荐效果。本文提出了一种全新的基于用户点击(Click-Through)的实体描述模型。该模型使用查询关键字作为标引词描述用户和文档。这种描述方式不但可以极大地减少了实体向量空间的维度,而且可以更好地表达用户在查询行为中的兴趣偏好和查询意图,因此该模型可以更好的应用于推荐系统中的实体描述。由于用户的访问兴趣经常改变,用户在不同时间的查询可能包含的不同的兴趣偏好,因此本文提出了行为兴趣向量的概念,用来描述用户在发出不同查询时的兴趣偏好,提高了后续推荐算法的准确度。本文以查询网络图为基础,提出了基于能量传导的推荐算法,协调用户群中每一个成员都具有相应的推荐能量,用户将能量沿查询网络分配给文档,最终将能量值高的top-k个文档推荐给用户。最后,本文通过实验评估了基于查询网络图的文档推荐策略的准确性、覆盖率、流行性和多样性等指标,验证了其有效性。
其他文献
对大多数机器学习和计算机视觉的任务来说,选择一个合适距离度量都是至关重要的。因此,以自动设定与选取合适的距离度量为目标的度量学习(DistanceMetricLearning,DML)方法引起
随着XML广泛应用,出现了大量的XML数据。为了更好的管理这些XML数据,人们设计了XML数据库。CoSQLRX系统是一个关系-XML双引擎数据库系统,可以同时处理关系-XML查询。本文着重
分类算法是当今机器学习领域中重要的研究方向之一,很多经典算法在实际问题中得到广泛的应用并取得了良好的效果。传统的分类算法假设数据分布均衡,并且以提高分类算法对数据
网络的自组织管理技术是无线传感器网络中研究的重要领域,其主要包括节点管理、资源与任务管理、数据管理、网络的节点部署、初始化与系统的维护管理等,它是保障无线传感器网络
随着信息技术的发展,环境的多样式和需求的多变性要求软件系统能够具有适应企业“面向任务”动态多变的能力,同时软件规模化生产和企业个性化需求之间的矛盾也日益增加,传统软件
随着军队信息化建设日益发展,军队内部各单位的网络系统也深入到各项事务中,网络规模越来越大,终端数量越来越多,使用和管理也日益复杂,特别是众多的非常正常工作应用软件、
维数约减已经成为当前机器学习领域的受人关注的研究热点。维数约减是将数据由高维约减到低维的过程而用来揭示数据的本质低维结构。它作为克服“维数灾难”的途径在这些相关
高层体系结构是目前分布式仿真的通用技术标准。论文对高层体系结构相关技术进行了论述,重点研究了高层体系结构的数据传输模型。针对数据传输模型中的关键部件运行支撑框架,论
目前,光纤通信技术迅猛发展。这种技术具有频带宽、损耗低、抗干扰能力强等优点,而且建网的成本在逐步降低,因此,很多企业都已经或正在组建自己的光纤通信网。同步数字系列(SDH)在
网格技术是继Web与Internet技术后的第三大技术。网格把大量的、分布式的各种软件和硬件资源组合起来,为科研人员和工程技术人员提供了统一的计算环境,来解决数据和集中计算