基于语言模型的个性化信息检索的方法与实现

来源 :内蒙古大学 | 被引量 : 3次 | 上传用户:jica330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网的快速发展,在繁多纷杂的信息中,如何辨别用户的真实意图,准确的从浩瀚的信息资源中找到所需的信息,成为当前信息检索领域一个较为关注的问题。在当今技术较为成熟的搜索引擎网站上,查全率及响应速度已经做得很好,但在查准率上始终难以让用户满意。信息检索的主要目的,即:从众多的文档中找到符合用户查询需求的文档。传统的查询扩展重视原问句的扩展,但是忽略了扩展后查询问句中存在许多不必要的词汇,从而又阻碍了扩展后查询的准确性,因此不能从根本上表达用户查询意图。本文将从用户的个性化角度,对查询扩展进行研究。本文为个性化的研究看出了两种检索方法,即:用户查询扩展模型和去掉扩展词的停用词表方法,两种方法的基本思想是源于查询优化,对用户的查询进行查询扩展或是查询词的删减。用户模型主要是通过结合个体用户所涉及到的主题领域对其查询问句进行扩充,扩展后的新查询可以提高用户的准确率和查全率。而去掉扩展词的停用词是将通过原始查询进行伪相关扩展后的新查询问句的研究,在不同的领域基础上总结得出查询问句的停用词表,以减少新的查询问句中词的不必要词,将其所分配的概率值重新分配,加大了原始查询词的概率值。本文在语言模型的基础上,利用现有的成熟技术,从新的角度来研究查询问句扩展,通过实验,进一步改进查询问句的方法,利用用户兴趣模型,提高用户的检索结果。我们将在文中详细讨论各种检索模型中查询扩展的方法。经过实验训练,验证本文提出用户查询扩展和提出的不同领域的停用词表。
其他文献
<正>本刊讯5月6日,自治区教育厅召开深化考试招生制度改革实施方案培训会。自治区高校工委书记、教育厅厅长秦斌出席会议并作专题辅导报告。秦斌围绕"怎么看、做什么、怎么干
那天下午放学后,我正在办公室批改作业,劳动委员鋆鋆和班长谦谦急冲冲地跑进办公室。鋆鋆挥着手中的几张小纸条,着急地说:"李老师,有的男生现在就给谦谦写小纸条了,你看!"我接过
目的探讨小儿外科腹股沟斜疝、隐睾、阑尾炎采用腹腔镜手术后的护理措施,总结经验.方法对55例行腹腔镜手术患儿实施术前护理,术后观察和护理.结果55例病例均无并发症出现,术
本文实验发现具有较大密度和较高速度的93W钨合金长杆模拟弹的穿靶深度反而比密度较小,速度较低的90W钨合金长杆弹的穿靶深度小.针对这一现象,本文从两种材料在侵彻环境下的
微课是以微视频为载体,记录教师在教学过程中围绕某一个知识点或教学重难点而开展的教学活动过程,时间一般为5—10分钟。微课是一种新型的学习方式,能够打破时空的限制,让学
介绍了TFT-LCD液晶基板玻璃生产过程中的离线式称重和在线式称重的用途和区别,及在线式称重方式中的三种不同的称重方式,通过对比硬件配置、分析动作流程和调试维护难度等方
目前,有相当一部分学生厌学情绪比较严重。这应该引起教师的思考:学生为什么会产生厌学心理?笔者认为,厌学心理的产生除了与学生自身思想素质有关,还与学校教育环境、家庭教育
森林资产评估是实行森林资产化管理的关键问题,提出了的林地、林木资产评估的成本法、收益还原法、序列林价法等8种方法,以及搞好森林资产评估应做好的四项基础工作,对推动森林资
目前,在我国每年40亿吨的煤炭消费量里,有7亿吨~8亿吨散烧煤用在分散的锅炉及民用。为提高我国农村用能清洁化利用水平,减少大气污染物排放,十二届全国人大代表、农业部规划设计
报纸
【摘 要】本文从电子设计竞赛的特点出发,针对参赛学生在竞赛过程中暴露的问题,提出创新实验室的建设方案与管理措施,促进实践教学与创新能力培养模式改革。  【关键词】电子设计 创新实验室 创新能力 开放式  【中图分类号】G 【文献标识码】A  【文章编号】0450-9889(2016)10C-0039-02  一、竞赛与创新实验室的关系  电子设计竞赛是面向高校大学生的群体性科技活动,其目的在于推动