多文档自动文摘相关论文
本文研究的重点是中文多文档自动文摘中的几个重要问题:主题的自动提取、文摘句的选取、系统的自动评价.具体地讲,本文从如下几个......
多文档自动文摘是自然语言理解领域中的一个重要的研究方向。多文档文摘可以将多篇同一主题的文档进行汇总,提供给人们简洁,全面的信......
随着互联网在世界范围内的迅猛发展,网络上的信息日益增加。人们迫切需要一种方法来从这些海量信息中快速获取有用信息、排除冗余......
随着互联网的普及应用,网络已成为一个巨大的信息源。大量的数字信息在带给人们丰富便利的信息资源的同时,也给有效信息的快速获取......
生物医学研究是二十一世纪最受关注的研究领域之一,尤其随着生物医学研究在分子层面的展开,人类基因组计划的实施完成,产生了海量......
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。同时,随着人......
在互联网信息繁杂的时代,如何快速获取重要、简洁的信息是一个非常有价值的研究点。多文档自动摘要正是基于此背景衍生出来的技术,......
Internet的飞速发展为用户提供了丰富的信息资源,同时也促进了信息处理技术的崛起。通过信息处理技术,可以帮助人们更加有效地组织......
随着社会发展进入信息时代,海量信息的到来,自动文摘技术的诞生和发展为人们进行文献处理提供了便利.本文主要介绍了自动文摘技术......
文章描述了一种基于子主题划分和查询相结合的多文档自动摘要系统的设计:首先利用同义词词林计算句子语义相似度,通过对句子的聚类......
在分析新闻文档的特殊结构、内容特点以及常用聚类算法优缺点的基础上,提出了一种基于改进的最小最大聚类方法的主题来龙去脉生成方......
多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档......
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相......
多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术,它可以从全局的角度对网络信息进......
提出了一种基于主题与子事件抽取的多文档自动文摘方法。该方法突破传统词频统计方法,除考虑词语频率、位置信息外,还将词语是否为......
面向互联网新闻事件的演化式摘要是自然语言处理的一个新兴任务,其本质是多文档自动文摘。由于互联网新闻事件报道具有动态演化、......
网站的新闻专题往往包含大量的网页,多文档自动文摘可以帮助人们从中快速获取主要信息。该文提出了利用时间戳改善文摘句子抽取质......
针对面向查询的多文档自动文摘,本文将查询句混入多文档集合中的各句子中间,采用高效的软聚类算法SSC对所有的句子进行聚类。采用轮......
主题模型已成为机器学习和自然语言处理等领域研究的重要工具,它可发现大规模语料库中的隐含主题.随着语料库规模增大,发现的主题规模......
互联网的普及带来了网络电子期刊文献的剧增,这给研究人员(尤其是初级研究人员)高效准确地从海量信息中挖掘所需要的信息带来了巨......
随着移动互联网的迅速崛起,用户经常使用移动终端在大批量文本信息中快速查找并获取有用的信息。这就要求信息服务供应商具备能够提......
互联网迅速发展,每天产生大量文本、图像、视频等类型的数据。其中文本数据是最常见的,用户想查询和了解自己关注的话题需要花费大......
随着大数据时代的到来,人们花费在搜索上的时间越来越多。面对着成千上万同一主题下的网页,它们大部分都包含着相同的信息,然而又......
多文档自动文摘技术是对内容相关的多篇文章进行分析,并根据它们所描述的主题脉络或用户的兴趣导向来抽取出重要的信息或用户感兴......
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技......
随着信息技术发展变化的脚步日益加快,互联网应用已经同社会生活的方方面面密不可分,而随之而来的信息爆炸情况也出现在各个领域。......
<正>从2011年开始,哥伦比亚大学将在新闻学院和工程学院为学生提供新型的双学位,旨在为在线新闻的未来另辟蹊径,为计算机技术人员......
本文提出一种基于LSA和pLSA的多文档自动文摘策略。首先,将多个文档切分成自然段,以自然段作为聚类单位。采用了新的特征提取方法......
近年来使用概率主题模型表示多文档文摘问题受到研究者的关注.LDA(latent dirichlet allocation)是主题模型中具有代表性的概率生......
主题模型(Topic Models)是一种可以从大规模离散数据集中自动提取其中隐含语义主题的生成概率模型。自2003年提出以来,主题模型逐......
文档自动文摘是自然语言处理一个研究热点。本文提出了一种基于局部主题关键句抽取的多文档自动文摘方法。首先,将文档集合中的每篇......
句子打分是基于抽取的自动文摘中的最为关键的问题之一。近年来,基于图模型的句子打分算法成为本领域研究的热点问题。通过将句子......
随着互联网的普及、信息获取途径的增加,人们获得的信息日益丰富。为了从这些丰富的信息中快速、准确地获取有用信息,提高用户获取......
随着网络的日益普及,在线信息急剧增加,如何有效地获取和描述这些文本信息显得越来越重要。尽管用户通过搜索引擎可以快速获得丰富......
随着互联网的普及,互联网上包含着海量的并且时刻在增加的信息。针对用户输入的一个简单查询,搜索引擎一般会返回用户可能需要的一......
基于隐主题马尔科夫模型,消除LDA主题模型的主题独立假设,使得文摘生成过程中充分利用文章的结构信息,并结合基于内容的多特征方法提......