基于用户兴趣分析的个性化搜索引擎研究

被引量 : 10次 | 上传用户:sibsiufeuhfhkshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的迅猛发展所带来的海量数据,给用户提供了大量信息,同时也增加了用户检索信息的难度。传统信息检索工具(搜索引擎),没有考虑用户兴趣,因此搜索结果往往无法满足不同用户的特定需求。为解决传统搜索引擎个性化的局限性问题,本文提出了一个基于用户兴趣分析的个性化搜索引擎模型,通过挖掘用户兴趣信息,建立合理的模型来表示、管理用户兴趣,并通过不断更新与维护,逐步优化模型,使其能准确反映用户的兴趣需求,为后续搜索工作提供个性化的分析依据。主要工作包括以下几个方面:1.深入研究搜索引擎的体系结构,对构建搜索引擎的关键技术、实现机制进行较全面的探讨。设计了一个可配置性强、灵活的、可运用于中小型网站站内检索的搜索引擎框架,并且实现大部分功能。2.深入研究web挖掘技术,对如何运用该技术进行用户兴趣挖掘进行了探讨,并分析了如何将用户兴趣挖掘的成果运用于搜索引擎,以实现系统的性能优化和搜索服务的个性化。3.本文使用优秀的开源框架Nutch和Lucene作为开发基础,通过实例,详细介绍了搜索引擎各模块的构建及优化。4.最后本文对系统进行了功能和性能方面的测试,通过实验结果证明该系统的性能良好,可以满足中小型网站搜索需求。本文主要包含信息检索理论研究和兴趣挖掘的实践经验,对信息检索、数据挖掘和用户兴趣建模等领域的研究都有一定的参考意义。本个性化搜索引擎具有广泛的应用价值、学术价值,可以很好的应用于目前一些中小型网站的搜索引擎建设。
其他文献
简述了第四方物流的概念与竞争优势,并通过对飞利浦公司与华夏媒体的合作成果思考,探讨了在中国发展第四方物流的现实瓶颈及突破对策。
<正>信息化对于企业发展的推进作用和产生的价值是毋容置疑的,但是如何真正助力企业利润增长是摆在各类企业面前的难题。财务公司作为大型集团企业产融结合的典型代表,一方面
伴随我国的国民经济的迅猛发展。我国的民用和工业建筑物越建越高,工民建筑的施工规模也是越来越大,因而工民建施工中的施工技术和管理措施也就显得格外重要。一个工民建筑质
目的了解临床医学硕士专业学位研究生(住院医师)培养质量的现状,分析存在的问题。方法采用整群抽样的方法,运用自制的调查量表对95名2010级研究生进行问卷调查,对临床医学硕
生活于呼伦贝尔市境内的游牧鄂温克族具有悠久的历史和积累了宝贵的非物质文化遗产,已成为不可再生的具有民族精神价值的精神财富。在当今快速发展的后现代社会中,这些非物质文
经济全球化的背景下,中国加入世贸组织以来,国内外的市场竞争越来越激烈,对我们来说既是挑战也是机遇。如何把握这个机遇并在国际经济中占有一席之地,就必须突破原有落后的陈
“减法”和“加法”是汪曾祺小说结构艺术中两种相辅相成的手法。“减法”即留白手法,其效用在于形成含蓄蕴藉之美。“加法”是在故事主体之外,添加上大量看似与故事主体无关的
地方立法是我国法律渊源的重要组成部分,近年来随着地方性法规、规章数量的日益增多,地方立法与国家法律、行政法规和规章交叉、重叠甚至相矛盾等问题也越来越多。其中,地方
存在主义哲学关于教学存在的本体论承诺和价值论诉求,可以概括为:教学是精神性、体验性、关系性的存在;教学对于人道主义、自由和解放的整体诉求。基于生成论教学哲学的立场分析
C++程序设计是计算机专业的基础课程,在计算机专业教学中具有很重要的课程地位.在进行C++专业课程教学中,如何使用多媒体教学法与传统教学法,取得良好的教学效果,是做好教学