WAF改进算法在基于语义分析的查询扩展上的应用

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:wlp00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询扩展是信息检索中的一项重要技术,是辅助用户更好使用搜索引擎的有效手段。但是,随着互联网信息的复杂化和多远化,尤其是微博、微信等社交方式高速发展,传统的查询扩展算法由于忽略了文档中词间的语义关系,已无法在不规范的短文本上推荐出有效的关键词。传统检索模型的词独立性假设和短文本的信息缺失,导致现有查询扩展算法无法获取足够的语义信息,进入无法解决用户检索时普遍存在的同义词和多义词问题。本文针对以上问题对经典的信息检索模型和查询扩展方法展开了深入调研,分析得出引发查询扩展问题的根本原因在于缺少行之有效的语义分析,本文创造性地提出将词激活力算法WAF应用在基于话题的查询扩展中,意在通过精准的语义分析手段为查询扩展的提高寻找突破口。本文通过对WAF理论的深入学习,提出一种全新的基于WAF的查询扩展算法,主要工作如下:第一,通过WAF与传统词关联算法在微博语料上的大量对比实验,证明了WAF在语义分析和词网建模上的巨大优势,尤其是话题核心词的扩展和高价值词的挖掘。第二,针对短文本的不规范性和信息缺失,本文通过调整WAF中词激活力的计算方式,使其充分利用短文本特点,弱化噪声特征对于核心语义分析的影响。为了提高WAF的词扩展质量,本文提出在词网模型的基础上,通过词亲和度的整体分布对关联词列表的排序进行调整。第三,本文将WAF的语义分析和话题聚类相结合,设计出一种较为完备的查询扩展算法,并且嵌入到微博监控项目的整体框架中,应用在微博语料的检索上。经过与基于BM25权重机制的查询扩展的对比实验,证明了WAF生成的词网模型在查询扩展中的巨大潜力。
其他文献
目的:不同手术治疗踝部骨折的临床疗效观察研究.方法:本次研究选取本院2019年1月-2019年8月收治的踝部骨折患者56例,按照电脑随机分组法将其分为对照组和实验组两组,其中对照
目的:讨论内分泌内科护理中人性化护理临床应用.方法:首先确定选择对象,将其选择范围确定在于我院接受治疗的内分泌内科患者,然后确定样本选择时间,时间在2017年1月至次年5月
目的:对晚期胃癌患者接受阿帕替尼联合替吉奥治疗后的疗效进行观察分析,为临床提供参考.方法:选取2017年3月至2019年2月来我院进行诊疗的晚期胃癌患者46例作为研究对象,将其
目的:阐述患者接受妇科手术治疗后辅以中药封包、穴位按摩联合干预的具体措施及对促进肠功能恢复的作用.方法:2018年5月-2019年5年于我院接受妇科手术治疗的患者90例,将其分
目的:对处于慢性化脓性中耳炎静止期的患者使用不同的鼓膜成形术在临床治疗中发挥的作用进行总结分析.方法:对自2017年1月至2019年1月来我院完成鼓膜成形术的110名患者的情况
目的:评价精细化健康管理模式在体检中心的应用效果.方法:将2018年9月至2019年9月于本体检中心进行体检的94例体检者作为研究对象,平均分为对照组与观察组,其中对照组应用传
筛选肽适配子已经成为研究蛋白质功能、鉴定、选取有效新药靶标以及新药研发的重要手段。利用传统的酵母双杂交系统筛选肽适配子技术已经比较成熟,然而该系统由于依赖于转录激
基于PCI总线接口的高速数据采集和处理系统是拉曼型分布式光纤传感系统(DOFS)中的重要组成部分之一。高速采集卡完成对光电转换之后的信号进行调理、采样、存储和转发,其高效
目的:探讨循证护理理念在胸外科临床护理教学中的应用价值.方法:选择2014年五年制护理专业的180名学生,分为实验组和对照组,每组90名.对照组使用传统的教学方法,实验组使用基