一种基于超链接结构的向量空间模型改进算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:jklbnm123jkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于向量空间模型的信息检索系统中,TF-IDF算法被广泛的应用在基于关键字的信息检索中.然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接的网页内容考虑进去.本文分析了向量空间模型的实质,并找出了其精度低的原因,在传统模型基础上提出了一种基于网页超链接结构的向量空间模型改进算法.实验分析表明改进后的算法与原算法相比检索精确度提高了10%,在一定程度上改善了检索效果.
其他文献
诡异的遭遇把我和吉米联结在一起了。我们被困这个暗无天日的岩洞已经五个多小时了,又渴又累,恐惧的阴影一直笼罩在我们头上,我好象闻到死亡的气息正向我们靠近。黑暗中我摔
不要再抱怨市场严重饱和、没有开发的可能,有的企业从细分市场突围同样获得了一片蓝天,有的企业靠深挖市场也创造出了奇迹。
<正>~~
<正>~~
随着企业经营环境的变化,石油企业将通过产业结构调整、改组、改制等方式,转换经营机制,提高市场竞争能力,建立资本经营模式。在这一脱胎换骨的改革过程中,新旧体制交替,将发
三年医药卫生体制改革工作成效如何?记者近期深入到上海、青海、海南、新疆、黑龙江等13个省区市,受访的基层群众普遍反映:三年医改缓解了“看病贵、看病难”,帮百姓实现了织网、强基、削山等多年愿望,给基层群众带来了真正实惠。  织网 神州大地正实现“全民医保”梦想  地处祖国版图最西端的新疆乌恰县,是我国最晚送走太阳的地方。在黑孜苇乡中心卫生院一号病房里,74岁的柯尔克孜族老人哈地尔·那依正安静地休息。
<正>~~
<正>~~
解决蒙古语基本名词短语的定界问题,是在蒙古语词性标注语料库的基础上进行的探索性研究.基本名词短语的内部结构信息对其定界问题具有重要作用.确定基本名词短语内部结构的
近些年来,中文时间信息抽取和处理已经变得越来越重要。然而,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息