【摘 要】
:
冗长查询指用户提交的句子成份复杂的查询.当前的搜索引擎对于关键字的检索取得了较好的结果.但是对于冗长的查询,如果将所有词作为关键字进行检索,往往只能返回相当有限的结
【机 构】
:
哈尔滨工业大学计算机科学与技术学院社会计算与信息检索研究中心,腾讯公司搜索平台部
【基金项目】
:
国家自然科学基金面上项目(61073126,61273321),国家自然科学基金(61133012),国家863前沿技术研究项目(2012AA01102)
论文部分内容阅读
冗长查询指用户提交的句子成份复杂的查询.当前的搜索引擎对于关键字的检索取得了较好的结果.但是对于冗长的查询,如果将所有词作为关键字进行检索,往往只能返回相当有限的结果.我们尝试利用关键词之间的词语关联度,发现语义蕴含,删除“信息量”小的关键词,提高检索的效果.对于实验结果,我们分别从“面向机器”和“面向用户”两个角度进行评价.在“面向机器”的评价部分,我们根据搜索引擎返回结果的标红率和结果数进行自动评价;在“面向用户”的评价部分,我们对搜索结果文档进行人工评价.实验结果表明,我们的方法能够明显提高检索结果
其他文献
小学数学是小学阶段学习科目中的重要科目,而小学数学有着很强的抽象性和思维性,对于小学生来说显得较为吃力。所以,在小学数学教学中需要探究更多的教学方法以使得课堂教学
调理美白第一品牌——CLEXC公司于8月18日在历史名镇东莞虎门举行了10周年庆典。金碧辉煌的会议中心座无虚席,CLEXC品牌全国300余家优秀加盟美容院到会,共贺CLEXC品牌10周年庆
五味之中,唯独苦味给人印象不佳,这多半是中药惹的祸。在人生经历中,喝中药难免,几乎人人都吃过它的苦。不少药材都含有苦味,尤其是黄连。“黄连树下弹琴——苦中作乐”,足以
情感分类是目前自然语言处理领域的一个热点研究问题。该文关注情感分类中的半监督学习方法(即基于少量标注样本和大量未标注样本进行学习的方式),提出了一种新的基于动态随机
1.概述:Micrel-synergy的SY89429/30V频率合成器是为在各种时钟子系统中的运用所设计的.其基本功能是合成所要求的时钟频率,为系统提供高质量、低颤抖的时钟信号源.