文档集合相关论文
随着科学与信息技术的迅猛发展,人类社会在日常生活中产生日益剧增的文本数据,在任何特定领域中大量的文本信息所集合成为的语料库......
本文通过以主题的方式构建分布式信息检索的文档集合,将传统的按照出版时间、信息来源构造文档集合的方法作为不限,对比看出基于主......
多文档文摘是针对信息源由多篇关于同一主题文档组成的文档集合,从信息源中提取重要信息、生成精简版本的过程.本文主要研究了面向......
文本检索旨在对给出的查询,在文档集合中找出与之最相关的文档子集。它能有效地对文档中的语句词义进行压缩整合,并与查询进行匹配,利......
作为内容管理和图书馆解决方案领先提供商,PTFS发布了Archival-Ware4.3。为了保持功能上的领先优势,PTFS又一次增强了ArchivalWare......
在近年信息处理与分析相关技术领域的进展中,文本挖掘是最引人注目的领域之一。文本挖掘是一个方法群,涉及统计学、自然语言处理、......
词向量是深度学习背景下的新兴技术,与传统词袋模型不同,词向量将每个词语映射到特殊的语义向量。本文对词向量技术进行系统研究,并通......
Internet的飞速发展极大方便了人们对信息的获取和使用,但同时也带来了信息过载的问题。在这些海量信息中快速、准确地找到所需要......
对于一个文档集合,能够从无到有的理解其内容并不是一件很容易的事情,尤其是专业性较强的文档,比如学术论文。而理解一个集合却有......
为了快速、高效、准确地对Internet 上发布的Web 信息进行内容核查,本文提出了一种多层结构的Web搜索与特定内容核查软件......
文本挖掘是数据挖掘的一个重要分支,其应用前景十分广泛。本文对文本挖掘的基本概念和主要内容进行介绍,并且说明了挖掘的过程以及......
基于特定信息需求的网站用户游历其兴趣文档集合的便利性,建立了一种站点结构优化的数学模型,通过页组支持度与页组拓扑平均距离量......
本文介绍了一种新的多文档自动文摘方法。该方法的基本思想是通过估计词在文摘中出现的概率来选择最能反映多文档集信息内容的核心......
文中提出了一种新的图论框架下的多文档自动文摘方法。为了尽可能地降低摘要中的冗余并保持其信息的多样性,采用了一种基于图模型......
合理的文档集合划分能够有效的提高分布式信息检索的效果,本文针对分布式信息检索中的集合划分问题,提出了一种基于查询空问的文档集......
本文主要介绍了存储于关系中的XML文档的更新,即先在XML文档中选择更新对象,定位到关系数据库中,并对关系中存储该对象的元组或表进行......
本文提供了群体遗传算法来有效地支持了存储在关系库中的XML视图的物化选择,在存储和查询遵循固定DTD的XML文档集合的应用中较好地......
档案网站是由档案部门建立、被链接在一起并通过因特网或各级公共网络向社会提供服务的电子文档集合。它的建设是档案信息化建设的......
微博作为当前使用非常广泛的社交软件已然成为了人们获取实时信息的重要途径之一,然而微博短文的自身特点使得其检索的难度相应增......