文档检索相关论文
针对当前文档间关联性弱、文档数据和其他数据相互隔离、传统文档检索方式单一等问题,提出了文档知识图谱构建及其智能检索的方法。......
全文自索引技术是指在庞大的文本资料上所建立的一种数据结构。该结构可以在原文档集合中实现高效的模式串计数、定位查询等工作;......
手写体文档的检索方法既与手写体文字的识别有相似之处,同时也有重要区别,主要体现在这种检索需要在开放的集合上执行,而文字识别......
XML(eXtensible Markup Language)日益成为互联网上数据表现和数据交换的标准,而在浩瀚的XML组织的信息中进行有效的检索也就成为......
本文描述一种基于超节点对等网的语义架构环境,并在此基础上提出数字图书馆原型系统,研究相应的语义构造和语义搜索算法,探讨采用......
使用美国DIALOG系统检索多个文档时,过去要对一条检索策略执行多次贮存的重复输入,这便增加了检索时间和费用。自1987年10月起,该......
一名联机检索员若想利用专利数据库检索到所需情报就需要了解哪些数据库是可以利用的,专利数据库中各个数据字段的含义,在每个数据......
6.及时利用系统新功能 联机系统为了方便用户,增加自身的吸引力,都在不断地开发改善自己的检索功能,尽早发现、及时利用这些新功......
介绍STN系统Scisearch文档独特的引文检索和跨文档检索功能,比较了Dialog和STN在引文检索方面的特点,并通过实例说明STN系统的SELECTCIT在引文检索中的应用
This paper......
主要介绍"中华烹饪文化"本体的构建以及基于该本体的文档语义标注方法两部分。在本体构建部分,采用手动添加、机器自动导入和人工......
随着互联网信息的爆炸式增长,文档检索已经成为自然语言处理的热点问题。对于长文本检索,使用传统的基于词频的表示方法往往忽略了......
随着企业生产方式和项目研发模式的改变,企业信息化建设的加速,企业和高校内部各种信息资源库的建立以及扩张,数字资源成指数形式......
该研究面向XML文本文档信息的检索,以信息检索技术为出发点,通过分析XML文档与传统检索技术相结合所带来的新问题,以及当前XML文本......
e-Science旨在重要的科学领域中通过因特网进行分布在全球的合作,并充分利用极大规模的数据、万亿次规模的计算资源和高性能的可视化......
随着互联网技术的飞速发展,HTML语言本身所具有的弱点,使得其已不能满足WEB越来越广泛的应用,XML可扩展标记语言是专门为Web应用设计......
在应答一个来自用户的查询(query)时,现代搜索引擎会返回给用户前k个相关的查询结果及其摘要。摘要是一小段摘选于文档的文本,该段......
对目前问答系统的性能分析表明,用于答案抽取来源的文档的相关性是制约问答系统性能的主要因素。相关文档检索作为问答系统的一个......
对文档进行语义哈希是一种比较常见的加速相似性查找的方法。所谓语义哈希就是将文档进行哈希编码,并且使得在语义上相似的文档能够......
随着计算机的普及和现代网络技术的发展,文档在线阅读和共享已经成为现代社会人们获取知识的一种普遍途径。作为对传统出版物的重......
以长文本为基础的文档检索在许多领域中有广泛应用,如面向科普,知识文献,新闻,影视,文学作品等内容的搜索。长文本文档相对于短文......
信息系统是一种描述关于感兴趣对象相关定性与定量信息的标准形式。这一形式是进行信息处理任务的起点,也常被作为数据分析工具与......
槽填充(Slot Filling)旨在从大规模语料中抽取目标实体的属性信息。该研究包含两方面关键任务:1)源信息(相关文档)获取,其任务是根......
随着国内高校科研管理信息化的不断发展,各类科研文档数据迅速增长,如何有效地组织和利用这些科研文档数据,是目前亟待解决的问题......
针对目前工程项目管理的信息化需求,提出一种基于工作流技术的工程项目管理系统.为实现该系统,文章首先结合工程项目管理的相关业......
2.1 数据库是怎样组成的图书馆是怎样组织藏书的,在图书馆里可以得到何种图书、期刊和其它的文献,它们是如何安排的,有助于你检索......
10.1 保留检索到此为止,我们已经讨论的所有检索过程涉及到以下几个方面:编制一个可执行的检索指令,最终检索到所希望的集合,然后......
WWW提供了方便的手段来访问远程信息资源,对于Web用户而言,衡量Web服务质量的一个重要指标就是检索信息所花费的时间。缩短检索时间的途径很多......
Internet上大量、异质、分布、动态的信息造成了“信息过载”.在信息充斥的情况下,如何有效地为用户提供基于Internet的资源发现服务已经成为一项重要......
将数据挖掘的思想引入WWW信息处理领域,讨论了在WWW上进行信息挖掘所采用的算法和策略,设计并实现了一个采用向量空间模型的网络信......
XML语言从诞生到发展到如今在网络上大展挙脚,经过了十多年的历程。其优点及可行性也不可忽略,本文就XML优于HTML语言的几个方面进......
内容管理系统是一种位于WEB前端(WEB服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统.内容的创作人员、编辑人员、发......
本文对汉语语音文档检索技术及系统的实现进行了研究。主要内容如下: ⑴ 在语音识别方面,针对语音文档检索所面对的复杂声学环境,......
Web2.0技术开启了信息爆炸的时代,面对铺天盖地的互联网信息,用户需求的往往不是搜索引擎返回的大量网页,而是从网页中提取的结构......
20世纪90年代以来,Internet得到飞速发展.作为最大的信息集散地,Web上具有海量的信息数据,成为人们工作与学习的平台之一.如何从数......
分析当前常用的两类扫描文档检索方法:基于OCR和基于词形状编码的方法.提出基于识别信度将两种方法进行有机结合的思路.基于文档排......
Dublin Core元数据在文档描述中被广泛使用。文章首先对Dublin Core元数据进行简短介绍,然后阐述对数字文档进行检索的几种方法,最后......
由汉王科技公司推出的全球首款手写电纸书日前亮相北京科博会。据汉王科技介绍,这款产品预装了两干册正版图书,是具有全屏手写批注、......
现有文档检索软件大多存在功能耦合过于紧密、软件难以重用、可扩展性不好等问题:提出了一种面向服务的文档智能检索平台SODIRP(Serv......
探讨把文档检索中的二值独立检索模型改进后应用于FTP文件检索.解决现有仅通过字符串匹配检索时存在的无法按相关程度排序结果和因......
Web文档聚类在Web信息检索中起着重要的作用。文中提出了一种新的Web文档聚类和检索算法。该算法采用有序聚类的方法,根据Web文档的......
本文指出了美国DIALOG系统数据库的DIALINDEX/OneSearch主题范畴代码检索系统的缺陷。针对这些缺陷,作者编制了更为先进实用的七大......
开发人员通常通过问答网站的搜索引擎进行相关软件问答文档的搜索。在检索结果中,包含优质代码片段(使用示例)的问答文档往往更受青睐......
文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统......