基于浏览行为量化计算的用户兴趣网页分析

被引量 : 0次 | 上传用户:hzp901124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web已成为人们获取信息的一个重要途径,随着Web信息的日益增长,人们不得不花费大量的时间去搜索自己需要的信息。目前,搜索引擎已成为人们最普遍使用的信息检索的工具。然而,目前大多数的搜索引擎提供的服务还不能令用户完全满意,尤其是针对某个具体用户的个性化服务。如何准确地收集用户兴趣网页,是各种个性化服务技术或系统研发的重要基础,也是个性化服务的关键环节,并决定了系统提供个性化服务的质量。本文以一个完整的个性化搜索引擎服务的推荐系统实现为背景,完成了以下几个方面的研究工作:①从用户兴趣角度对各种浏览行为的重要性进行了细致分析。用户在浏览网页时的行为能从某种程度反映用户的浏览兴趣,将这些运用于个性化服务领域我们可以发现用户的浏览行为和用户对网页的兴趣度之间存在某种关系。本文对影响用户兴趣的浏览行为进行了分析,并针对现阶段用户行为分析中的不足之处,提出了在行为分析中考虑用户平均行为的方法。②提出了针对不同浏览行为的网页兴趣量化计算方法,并且设计了一种参数自适应的兴趣网页提取技术。提出了以自动提取为主,手工提取为辅的兴趣网页提取方法。采用参数自适应和非正常网页自动剔除技术,充分利用在提取过程获得的兴趣网页集与非兴趣网页集逐步修正提取参数,达到准确捕获用户兴趣网页的目的,为后面的WEB挖掘提供了可靠、高质量的数据。③进而,提出了利用用户搜索词判断边界兴趣网页的方法。针对常用的搜索引擎提出一种搜索词的捕获方法,并利用搜索词建立搜索词典,采用搜索词与用户浏览内容相结合的方法修正了兴趣计算公式,提高了自动提取方式中提取临界点附近兴趣网页的识别精度。④针对上面提出的几种方法,在参与开发的个性化搜索原型系统基础上进行了实验分析,验证了方法的有效性。初步实验表明兴趣网页提取的精确率和召回率都比较高,达到了预期目的,可以提高个性化搜索的服务质量。如今,个性化服务不管是在学术研究中还是在商业应用中都逐渐成为一个热点。本文研究提出的兴趣网页提取模型以及搜索引擎的扩展方法,可以应用于用户个性化信息服务领域、搜索引擎扩展、客户信息管理、电子商务、以及数据挖掘领域等不同领域。
其他文献
文章从三个方面论述了这个历史上曾一度十分重要而特殊的民族贸易形式——官营茶马贸易所产生的历史作用和意义。认为茶马贸易活动为民族融合打下了经济基础 ,并对西北边疆安
十七年电影以"文艺首先是为工农兵服务的"人民性文艺观为创作引领,从电影人物形象的新生启蒙精神、中国典范风貌、英雄乐观气概、崇高情感追求、重建家国梦想的多元视角探索
今天的焊接,正处于计算机、信息化、机器人、新材料与极端结构等现代工业的大潮流中,现实的需求不断地挑战着传统的制造模式.在数字化智能焊接装备中,智能跟踪技术作为数字化
扎什伦布寺的学经制度是随着藏族社会历史的发展变化而逐步完善和发展起来的;其学经制度和学位授予制度是其最显著的特点之一。扎什伦布寺的学经制度作为藏族和谐文化的重要
在基于通信的列车控制(CBTC)领域中,列车定位是一项重要技术,这项技术对保障行车安全,提高列车运行效率具有重要意义。使用全球卫星定位系统(GNSS)是实现列车自主定位的有效
国民经济持续快速增长,铁路的运输能力已远远不适应国民经济和社会发展的需求,必须发展高速列车来为社会发展、经济发展提供强大支撑。我国铁路既有线的不断提速,客运专线的
介绍无酸洗拉拔工艺在高碳钢丝半成品生产上的应用。无酸洗拉拔工艺与常规生产工艺进行了生产实验比较。结果显示在总压缩率不大的情况下 ,无酸洗拉拔与常规生产工艺生产钢丝
通过疏理中医藏象学说中有关脾胃的论述,结合脾胃的生理、病理特点,初步提出"脾胃为脏腑核心"之观点;认为脾胃功能正常与否决定全身各脏腑的生理、病理情况,其盛衰作为内因是
本文在回顾哲蚌寺创建、哲蚌寺管理结构与组织、学经制度与学位考试的基础上,指出哲蚌寺既有独特的历史背景,又有独具特色的宗教文化特点,加上哲蚌寺与历代达赖喇嘛间有着特
现在电子产品在车上的应用越来越多,特别是中高级轿车的出现,它们对电子控制系统(Electronic Control Unit,ECU)的依赖非常大,使得车内的电磁环境问题日益严重。而对于汽车来