【摘 要】
:
集合选择是分布式信息检索系统的重要组成部分。利用文本语义信息来度量查询与集合的相关度是提高集合选择准确度的一个有效途径。本文从文本的语义表示入手,提出一种基于分
论文部分内容阅读
集合选择是分布式信息检索系统的重要组成部分。利用文本语义信息来度量查询与集合的相关度是提高集合选择准确度的一个有效途径。本文从文本的语义表示入手,提出一种基于分布式表征(Distributed Representation)和局部排序的信息检索集合选择方法。该方法针对现有集合选择方法在文本表示上存在的语义获取不准确问题,采用神经网络语言模型来训练查询与文档对应的分布式表征向量,以提高查询与文档相关度的准确度;针对原始查询过于简短、不易确定查询意图的问题,使用一种结合Wikipedia和ListNet的方法对原始查询进行扩展,以进一步提高查询与文档相关度的准确度;在已知查询与文档相关度的基础上,针对传统方法的文档排序方式不合理问题,使用局部排序的方法对文档进行排序,并引入文档评分阈值,来提高查询与集合相关度的准确度。最后,本文选取ReDDE、 MReDDE、CRCS和LBCS方法作为基准方法,在三种集合划分方式下分别对本文方法中三大组成要素的单项有效性和综合有效性进行验证,并探究了三大要素在本文方法中的贡献率。实验结果表明,本文提出的方法可以选出更合适的集合,在精确度上优于所选的基准方法。
其他文献
粗糙集理论在经过了近三十年的发展得到了广泛的认可,已经成为智能信息学科中研究极其活跃的部分之一。作为一种数学工具,粗糙集理论能够十分有效的处理那些不完整的,模糊的,
随着信息技术和嵌入式技术的飞速发展,嵌入式手持设备在越来越多的领域发挥着重要的作用。在某些专用领域,以小型化、便携化的嵌入式设备取代通用型计算机系统已成为了当今一
近年来,随着计算机与通讯技术的快速发展,各企业更加注重使用高度集成的计算机软件来进行日常的生产及办公,从而提高工作的效率和降低成本。而工作流技术顺应了以过程为中心
高级加密标准(AES)是由Joan Daemen和Vincent Rjimen开发并经美国国家标准与技术研究所于2001年通过。这是设计来取代数据加密标准(DES),在银行领域成功后,在各种领域,如车辆安
随着多Agent系统被越来越多的应用到政府、商业和服务业等领域,对多Agent系统的可靠性研究也逐渐成为热点。由于Agent自身的特性,使得面向Agent的软件测试与传统软件测试有着较
视频搜索关键技术主要是指视频中的目标检测和识别。目标检测是目标识别的基础,直接影响着识别结果的准确性和鲁棒性。目前目标检测方法多种多样,根据目标属性的不同,采用不
CCD传感器和扫描控制器是扫描仪的核心,只有透彻地掌握与之相关的内核技术,才能开发出更高性能的扫描仪产品。本文通过参与一种新型号的大幅面CCD扫描仪的开发过程,设计并实
网络覆盖是无线传感器网络的基本问题之一,通常期望通过部署或者调度传感器节点,在保证一定服务质量的前提下,达到网络覆盖范围的最大化。如果使所有节点同时处于工作状态,无线传
近年来微波作为一种节能环保的新的能源形式,在国内外得到了迅猛发展。在工业控制中,如何对微波加热进行控制直接影响微波加热设备的应用前景,对于大功率微波加热系统,其操作程序
随着互联网的迅速发展,获取信息资源变得更加方便和快捷,同时抄袭也变更得加容易。就计算机专业而言,因其工程实践性的特征几乎完全可采用计算机进行教学与考核,从而导致作业