利用人工和自动生成的资源进行中文信息检索查询扩展

来源 :天津大学 | 被引量 : 0次 | 上传用户:P214909697
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文中利用中文信息检索标准测试集,对信息检索系统及其算法进行了科学客观的评价,并对中文信息检索的最佳检索单元进行了详细的讨论和研究,在此基础上,重点讨论和研究了利用人工和自动生成的资源进行中文信息检索查询扩展.提出并实现了利用知网提供的人工生成的信息资源,进行中文信息检索查询扩展.受知网资源的限制,试验表明,单独利用知网的资源直接进行中文信息检索查询扩展,并不能取得具有统计意义的理想的检索效果.实现了一种带衰减因子的词共现模型,可以对大规模中文文件集进行统计处理,并自动生成包含词与词相关性信息的资源.由于该模型考虑了词与词间距离的概念,因此,不同于普通的词共现模型,带衰减因子的词共现模型能够更准确地描述词与词间相关性信息.提出并实现了基于上下文的查询扩展方法,可以根据查询的上下文对扩展词进行选择,是一种相对"智能"的查询扩展方法.相对于不进行查询扩展的检索效果,基于上下文的查询扩展方法取得了具有统计意义提高的检索效果.提出并实现了利用人工和自动生成的两种资源的组合进行中文信息检索查询扩展.利用知网的同义词资源与"伪同义词资源"的组合进行基于上下文的查询扩展,取得了具有统计意义的更理想的检索效果.
其他文献
石油在国民经济发展中的地位已毋庸赘述,但是我国石油的贮量形势令人堪忧。国内几个大型油田都不同程度地进入了衰竭期,很多油井因“出不敷入”已关闭,大量的低产油井也因功耗大
该系统是一个基于B/S模式的通用型考试系统,其目的是提高教学管理效率和资源共享程度.系统主要包括题卷管理、在线考试、成绩管理、综合评估等功能.该系统采用B/S结构,即采用
工作流管理系统帮助企业将其业务活动分解由多个任务组成的一个工作流,并按照一定的规则,在一个分布式的应用环境中对它们进行执行与监控,同时企业的工作人员也被配以一定的
在电子商务迅猛发展的今天,商业社会的各部门需要信息共享与交换。一开始,人们试图通过各种不同的方式来交换信息,如文本文件、FTP等,但一直以来都没有一个标准的途径,直到可扩展
随着并行处理技术的不断发展,机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构。在机群系统中,机间通信的性能是影响整个系统性
ARTs-OS的中断管理模型是在对各种实时系统实现技术的评估和系统的具体需求的分析基础上建立的.ARTs-OS的中断模型包括了中断模拟、中断的优先级调度、中断屏蔽、核外中断等
该文从理论和实践两个方面,对面向对象的中间件技术进行研究.论文首先从系统建模的角度论述了面向对象的重要概念和通用建模语言(UML),然后研究了三种主流的面向对象中间件技
学位
随着医疗卫生服务信息化进程的推进和医疗数据的积累,医疗人工智能已经成为了医疗领域内的研究热点。其中,通过病人门诊、住院、用药及健康等相关数据给出具有临床意义的病人间
近年来,电信网综合通信能力明显增强,运营商必须提供更多的多媒体业务才能吸引住用户,因此网络面临的压力越来越大。在这一发展背景下,基于软交换技术的下一代网络(NGN)技术应运