一种自动分类的网页搜索排序算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:gustczh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统网页排序算法Okapi BM25通常会出现网页与查询关键词领域无关的领域漂移现象,以及改进算法需要人工建立领域向量的问题,提出了一种基于BM25和softmax回归分类模型的网页搜索排序算法。方法对网页文本进行数据预处理并利用词袋模型进行网页文本的向量表示,之后通过少量的网页数据训练Softmax回归分类模型,来预测测试网页数据的类别分数,并与BM25信息检索的分数结合在一起,得到最终的网页排序结果。实验结果显示该检索算法无须人工建立领域向量,即可达到很好的网页排序结果。
其他文献
通过文献复习和比较研究法,比较目前中外护理人才培养在理念、教育方案(培养目标、课程体系、教学方法、评估体系)上的异同,为学习和借鉴国外优秀的教育模式、改革我国护理教育模
于2007年4月~11月,对崇明岛不同季节昆虫群落多样性进行调查。选取6种不同生境,分别用物种丰富度、多样性指数、均匀度指数、相似性指数对不同的群落进行统计分析。共采集到昆
<正> 太阳是地球上光和热的最主要来源,和人类的关系至为密切。人若非生而眇者,孰能不识日乎?但倘深知确识,亦非易也。这里仅就古籍中有关太阳的描述、传说和用典作些简要的
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
<正>近年来,美育问题经过一个时期的沉寂后又重新得到人们的重视,这是可喜的现象。在我国建设中国特色社会主义的进程中,物质文明建设和精神文明建设处于同样重要的地位,当广
在教育行业中,信息技术的快速迭代与互联网的普及发展催生了很多新型的教学模式,微课就是其中一种倍受欢迎与好评的形式。微课在应用到各个学科的教学过程中虽然具有一定的普
为实现机械臂精确的轨迹规划与实时位置跟踪,针对GALIL DMC控制板卡,设计了工业机械臂实时位置跟踪控制系统和轨迹规划算法,使用REbot-V-6R六自由度机械臂完成了汉字轮廓绘制
在煌煌一部中国艺术史中,20世纪的中国画史呈现出最为斑斓复杂的面貌。传统绘画的丰厚遗产遭遇到知识分子对自身文化传统的信仰危机,而令如康南海等人士发出“中国近世之画衰败
报纸
1940年10月10日,新四军苏北部队与八路军第五纵队在东台以北白驹、刘庄之间狮子口胜利会师,打开了苏北抗日斗争的新局面。为了统一指挥华中地区各部队,中央军委命令成立新四
用氧电极仪、红外CO2气体分析仪及叶绿素荧光仪,结合透射电镜技术对几个杂种杨无性系在光胁迫下的光系统Ⅱ活性、光合色素及叶绿体超微结构进行了测定。随着预处理光强的增加,