文本信息处理相关论文
随着信息时代的来临,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并准确、全面、快速地将用户所需要的信息从文本信息系......
命名实体识别(Named Entity Recognition,NER)是指识别文本中的人名、地名、组织机构名等命名实体。命名实体识别作为自然语言处理......
本文以西班牙马德里事件作为实验对象,研究突发事件领域的文本信息特点,探索突发事件模板的自动获取。通过机器学习方法,建立了相关事......
随着互联网信息的爆炸式发展,公开网络的资源与数据越来越丰富,其商业价值也不断地被发现与探索。数据的纷繁复杂是目前价值分析的......
在当今高度信息化的社会中,视力缺陷的残疾人因为其生理上的缺陷,不能像普通群体一样,享受到互联网时代所带来的高效和便捷。网站......
Internet的迅猛发展使得网络上聚集了越来越多的文本信息。关于文本信息处理的诸如检索、分类、聚类、抽取等技术有了很大的发展,但......
当今人类越来越重的网络依赖性令网络数据的规模呈现出爆炸性增长的趋势,文字作为重要载体,其相关的文本信息处理技术得到越来越多......
当前计算技术特别是因特网技术发展迅猛,信息技术正深刻地影响着人们的生活。Blog、电子文献以及数据内容形成了文本的数据海洋,亟......
关键短语抽取是文本信息处理的重要技术。随着网络时代的到来,在线文档呈现出几何级数的增长,“信息爆炸”成为这个时代的主要特征......
随着Web Service技术的发展,面向服务架构的思想不断成熟,把SOA架构思想引入到文本信息处理系统是一个很好的尝试。因为SOA架构思想......
近年来,随着WEB3.0的飞速发展,社交媒体也迅速发展起来,各大社交平台竞相怒放,用户量迅猛增长。截至2016年11月,Facebook注册用户......
向量空间模型(VSM)是文本信息处理的经典模型,它把文本用向量表示,以特征项的权值作为分量,这个架构很大程度上提高了信息处理的性能......
讨论了几种基于文本的分类技术的原理和方法,基于语义网络的概念推理网利用关键概念和其他概念间的相互关系,模拟人脑的推理思维模......
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系......
An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances......
1.引言Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务.但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘......
印刷文献信息采集处理是文本信息处理应用 ,特别是数字化图书馆建设中十分繁重而又必须从事的工作 .由于目前广泛使用的字符光学识......
本文提出了一种快速的高频字串提取和统计方法。使用Hash技术,该方法不需要词典,也不需要语料库的训练,不进行分词操作,依靠统计信息,提......
以中文信息处理为主题,对2001—2010年间的3种图书情报学核心期刊的载文及其引文进行了统计分析,包括载文量、基金论文分布、核心......
命名实体识别是文本信息处理中的一个研究热点,人名是命名实体的重要组成部分。本文主要讨论中文文本中人名识别的问题。所要识别......
研究了中文词性标注的一般方法和隐马尔可夫模型(hidden markov model,HMM)的基本原理,应用HMM进行中文词性标注,实验验证了HMM中文......
介绍了文本词向量及预训练语言模型的发展体系,系统整理并分析了其中重点方法的思想特点。首先,阐述了传统的文本词向量表征方法及......
近年来,范例推理(Case-Based Reasoning,CBR)的基础研究及系统实现正受到人们的普遍关注,是当今人工智能研究的前沿课题。CBR不仅是关......
话题追踪与演化分析技术旨在将用户关注的话题以最直观的方式呈现出来,使得用户方便的对话题的来龙去脉有一个全面的了解,在军事和......
学生的阅读过程是一个复杂的理解过程,它是教师、学生、作者、文本等多方面因素相互作用的结果。学生的阅读理解过程既是学生对文......
随着信息技术的飞速发展,电子文本信息资源正激剧增长。通过人工的方法来组织管理海量信息资源,对绝大多数机构来说面临着人力、物力......
目前,网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。针对汉语中复杂句式的结构特点以及对多种复杂句式的有效......
传统基于词语独立性假设、原始高维词语特征表示和字面匹配方法的文本信息处理往往忽略了文本信息中所隐藏的语义结构,无法形成对......