一种基于相关反馈和用户兴趣建模的网络搜索个性化服务

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:jmdjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
量的与日俱增为人们带来了信息共享的快乐,同时也带来了“信息迷航”和“知识匮乏”等问题。人们希望快速地得到自己需要的并具有个性的信息。对搜索引擎的检索结果进行个性化研究是解决该问题的有效途径之一。 本文提出利用相关反馈技术进行用户兴趣获取,然后根据用户兴趣对搜索结果进行个性化过滤与重排。即通过提取用户感兴趣的Web文本特征词及用户对初始检索结果的反馈获取用户的兴趣,并以此建立动态的用户兴趣模型,从而使搜索结果呈现个性化特征。 本文研究和分析了实现这些功能的一些关键技术,如特征提取、自动分词、遗传算法等。主要包括Web文本预处理、文本特征提取、网页特征与用户兴趣相似度计算等功能。Web文本预处理模块将Web文本进行清洗,去除内容无关项;文本特征提取将提取网页特征,形成网页向量空间模型;网页特征与用户兴趣相似度计算是分析网页与用户需求相关度的最重要的手段。 本文详细介绍了系统的设计与实现过程,讨论了提供网络搜索个性服务的途径和技术,并将之与流行的几大搜索引擎的搜索结果进行了实验比较,得出本系统在个性化方面的优势。
其他文献
随着计算机网络技术的迅速发展,针对主机以及网络的入侵行为日益猖獗。计算机和网络系统的安全问题越来越突出,各种安全手段的研究也就越来越重要,相应的,处于重要地位的入侵检测
三维地震数据场的传统解释方法是用剖面及水平切片显示二维图像,具有很大的局限性,很早以前人们就指出三维数据三维解释的方向。科学计算可视化是实现三维数据三维解释的主要
高速发展的DSP技术为语音信号处理提供强有力的工具,使得实时实现各种各样的复杂算法成为可能。针对不同的应用,国际标准组织制定了一系列的语音压缩编码标准。其中,G.729A是
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个富有挑战性的课题,是新一代计算机的三大突破口之一,正受到世界各国
在工业现场环境下将无线通信技术与Internet结合,为测控系统提供实时、可靠的远程数据传输服务,最为关键的问题是对TCP/IP协议进行实时性改进以及针对工业无线信道特征设计出
近年来,随着电子商务和计算机技术的发展,把智能计算技术和数据挖掘技术应用到电子商务,解决现有电子商务技术在个性化服务及商品信息推荐等方面的种种不足。目前的Web个性化服
本论文讨论了如何在P2P系统中通过发掘、利用资源特征,来实现基于内容的文本检索。 各类文本文件是P2P文件共享系统中共享文件的重要组成部分。作为知识的直接来源,文本文件
随着互联网的发展,计算机犯罪活动越来越猖獗,防火墙和IDS 在一定程度遏制了黑客入侵,但是高明的入侵者防不胜防,作为主动防御技术的计算机取证技术的出现弥补了传统网络安全
随着计算机技术的迅速发展,企业越来越依赖于计算机系统和网络技术,需要企业服务器为客户连续的提供服务。高可用性(HighAvailability,HA)越来越受到人们的重视。尤其近年来,全球
在本文中,我们对于基因表达谱数据的特点进行了研究,根据基因表达谱数据的特点提出了表达谱数据噪声过滤、数值规范化两个方法;然后对于k-means聚类方法在表达谱数据上的应用