基于Web日志挖掘的搜索引擎排序算法的改进

被引量 : 0次 | 上传用户:massmass
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,人们的生活发生了巨大的变化,信息极度膨胀给人类带来欣喜,但随之而来的问题就是如何更好的利用这些信息。目前,搜索引擎是人们最普遍使用的信息检索工具,由于网络信息量过大,传统的搜索引擎页面排序算法又无法提供个性化搜索结果,目前的搜索引擎仍无法满足用户的需要。针对用户对搜索引擎的个性化服务的需要,本文建立了一种用户个性化兴趣模型,并对各部分的实现算法进行了分析和设计,同时,基于这一模型,提出了一种搜索引擎页面排序算法P_URank。算法改进的核心思想是以效率换取个性化服务。换句话说,多花一点点时间来大幅度的提高搜索引擎的服务质量。将用户模型以及用户投票加入到排序关键字的计算当中,使页面质量的评价不仅取决于网页之间的“投票”还取决于用户对页面的评价;使最终的排序关键字不仅取决于页面本身的质量,还与用户的兴趣偏好有关,从而实现搜索引擎的个性化服务。最后,作者通过实验验证了算法的有效性,并且提出了继续研究的方向,以及可能存在的问题。
其他文献
新媒体艺术是新媒体技术高速发展背景下的产物,数字复制技术成就了新媒体艺术不同于以往艺术的样貌。就文化身份而言,类同取向的个体通过移动终端将自己封闭在不同的虚拟网络
<正>早在20世纪80年代,企业文化就在国有企业界火了一阵子,虽然国有企业界对企业文化关注较多,但很多企业领导与员工对企业文化的概念仍然十分模糊。许多国有企业文化建设停
<正>宣传思想文化工作的服务对象在基层,工作主体在基层,任务落实靠基层,要坚持重心下移,拿出实实在在的举措,打牢基层基础,补齐工作短板,使基层宣传思想文化工作强起来。刘
以萃取分离为主线,运用界面科学及化工分离原理,综合表面活性剂水油三元体系中微观结构的共性特征,提出了微乳相(microemulsionphase)的概念和定义,阐述了微乳相体系的特点、
<正>在印刷生产过程中,减少停机次数,对提高生产效率和保护机器都显得极为重要。导致停机的因素有很多,输纸故障就是一个主要因素。顺利输纸是印刷的前提、基础。对于单张纸
<正>1月12日~18日,drupa2008新闻发布会在德国杜塞尔多夫市展览中心举行,来自世界各地的138名印刷行业媒体记者参加了本次发布会。本刊记者受邀参加会议,这也是《印刷杂志》连
随着互联网规模的快速增长,拥塞已经成为一个十分重要的问题。近年来主动式队列管理算法已经成为端到端拥塞控制的一个研究热点。它通过评估网络状态、预测早期拥塞的出现,有目
[目的]研究体质指数对膀胱癌根治性全切患者治疗及预后的影响。[方法]回顾性采集427例因膀胱癌行根治性全切患者的临床病理信息、治疗过程和随访结局,根据BMI将患者分成3组,
通过本文窥见公安消防执法的一个侧面,即明确并依法履行对铁路旅客列车消防监督检查的职责(提高工作质量),详细而全面、合法又合乎实际情况地设定出检查的形式和内容(提高办
总结了开展施工图审查工作以来的主要做法 ,归纳了审图发现的主要设计问题 ,并提出了其处理方式 ,对施工图审查的必要性和重要性进行了较全面的分析和论述。