【摘 要】
:
通过对大规模查询日志进行挖掘分析进而提高检索的准确率一直是信息检索领域的热点问题。文章提出一种基于PMI-IR(逐点互信息方法)的联想词表构造方法。该方法利用序列模式挖掘
【机 构】
:
北京信息科技大学计算机学院智能信息处理研究所
【基金项目】
:
国家自然科学基金资助项目(61070119);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委专项基金(PXM2012-014224-000020)
论文部分内容阅读
通过对大规模查询日志进行挖掘分析进而提高检索的准确率一直是信息检索领域的热点问题。文章提出一种基于PMI-IR(逐点互信息方法)的联想词表构造方法。该方法利用序列模式挖掘算法扫描大规模用户查询日志,获取共现频次超过某一阈值的词组合,进行聚类获取候选同义词集,然后依次计算词wordA与每个候选词的相似度,选择相似度高于某一阈值的词作为词wordA的联想词集,最后形成联想词表。实验表明,借助该方法得到的联想词表进行扩展查询提高了检索的准确率。
其他文献
东西方冷战结束后,和平与发展成为时代主流。但霸权主义和强权政治并不随之隐退和终结,而是以新的形式在出现和发展着。邓小平同志认为西方大国实行的孤立制裁政策就是其中的
随着学情、教情、学习环境和学习内容的变化,在高中阶段的教育教学中,教育理念和教育手段几经更新,一些新的教学模式在一线教学中也得到探究、尝试和推广,高中化学教学也进行了一
李铮同志是临安市经委保卫科长、农工党党员。2001年临安市市长王坚同志在一份群众表扬李铮的信件上批示:我们需要的就是这样为民排忧解难的基层干部。
在改革开放浪潮的引领下,中小企业的经济发展走向了繁荣。在这种发展环境的影响下,企业之间的竞争从经济实力上的竞争,转变成专业人才和技术上的竞争。尤其是在国门打开后,市
本篇目的在于探讨基于计算机技术的水利工程设计仿真系统。对于我国当前水利工程施工建设过程中,实现水利工程设计在线检测,有助于节约水利工程设计时间,提升当前的水利工程
农工党桂林市二医院总支的墙报创刊于1983年元旦,当时作为农工党支部重要活动的一项内容。每逢节日如元旦、春节、护士节、七一、十一出版。经支委会研究决定,从1988年7月1日起
作为“中国葡萄酒名城”和“世界七大葡萄海岸之一”的山东蓬莱产区,因势利导抢抓产业发展机遇,经过近几年的发展,已成为国内发展最快、最具活力的葡萄酒产区之一。本文概述
7月6日0800时,今年第1号台风"尼伯特"位于18.7N/130.2E(距福州东南约1380公里西北太平洋上),中心气压910百帕,近中心最大风力17级。7月9日13时45分,"尼伯特"在福建泉州市石狮市登陆