2005年863网页检索ICST评测报告

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sd2009shandong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2005年863评测任务是在CWT100G这个90G的数据桑上检索相关网页。评测给出了50个包含title、dese、narr的主题,要求根据这些主题自动和人工生成查询。ICST在这次评测中使用了倒排索引技术蛤数据桑建索引,通过给多个查询调整权重和多个文档查询域调整权重的方法,综合给出网页的得分。2005年的评测结果显示,排在最前的一些网页大部分是相关网页,前10个结果的准确率超过了50%。召回率也达到了30%以上。评测结果也表明,手工选词生成查询的结果要优于自动生成的查询。
其他文献
随着企业经营环境的变化,石油企业将通过产业结构调整、改组、改制等方式,转换经营机制,提高市场竞争能力,建立资本经营模式。在这一脱胎换骨的改革过程中,新旧体制交替,将发
三年医药卫生体制改革工作成效如何?记者近期深入到上海、青海、海南、新疆、黑龙江等13个省区市,受访的基层群众普遍反映:三年医改缓解了“看病贵、看病难”,帮百姓实现了织网、强基、削山等多年愿望,给基层群众带来了真正实惠。  织网 神州大地正实现“全民医保”梦想  地处祖国版图最西端的新疆乌恰县,是我国最晚送走太阳的地方。在黑孜苇乡中心卫生院一号病房里,74岁的柯尔克孜族老人哈地尔·那依正安静地休息。
<正>~~
<正>~~
解决蒙古语基本名词短语的定界问题,是在蒙古语词性标注语料库的基础上进行的探索性研究.基本名词短语的内部结构信息对其定界问题具有重要作用.确定基本名词短语内部结构的
近些年来,中文时间信息抽取和处理已经变得越来越重要。然而,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息
在基于向量空间模型的信息检索系统中,TF-IDF算法被广泛的应用在基于关键字的信息检索中.然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接
“上帝欲使其灭亡,必先使其疯狂”。西方谚语中的上帝当然并不存在,但某些人不断滋生的贪欲,却让他们失去对法律的敬畏,最终被法律之绳所绑缚。  2006年6月29日,十届全国人大常委会第二十二次会议闭幕。当天下午,会议发布公告:海军本届军人代表大会接受了王守业提出的辞去全国人大代表职务的请求。依照代表法的有关规定,王守业的代表资格终止。  新华社当即报道了此事,并称,拥有中将头衔的王守业已被中央军委免
缺水已经成了人类社会的共同难题。  联合国原秘书长安南说“目前世界范围内的水储量正在下降,地下水源面临枯竭,河流湖泊水域在缩减,农用化学品严重污染水质,加上人口不断增加等原因,各国特别是发展中国家水资源紧缺问题越来越严重。”  在20世纪的100年中,人们的取水量增加了5倍,达3800立方公里。其增加速度,相当于同期人口增长速度的两倍。人均淡水量则在不断减少。  1995年世界人均水量为7300立
<正>~~