术语抽取相关论文
【目的/意义】从海量论文元数据中抽取算法术语并构建它们之间的创新演化关系,有利于对算法的有效管理和运用,以帮助科研工作者提升......
中国列车运行控制系统(CTCS)规范体系是在借鉴欧洲列车运行控制系统(ETCS)规范等国外标准的基础上,结合中国国情逐步建立起来的,已成为......
提出了一种领域术语抽取方法,该方法结合分词和粗切分两种方式对语料进行处理,利用体现字串间结合强度的互信息算法构建候选词集,......
将领域本体学习的任务与中文文本挖掘技术相结合,构建基于文本挖掘的中文领域本体学习模型,从领域文本库构建、领域概念学习、概念......
提出同步协作检索结果的相关性判断策略及其实现算法,设计并实现检索结果的分配、检索结果的用户相关性判断、相关结果的集成和用......
采用规则的方法,从学术文献中识别方法类句子,然后运用词表与规则相合的方法从句子中抽取方法术语,对抽取出的方法术语进行同义归......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
文章从传统知识组织系统和现代知识组织系统两方面介绍了知识组织系统构建研究现状,并从术语自动抽取及统一知识组织系统自动映射......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
经过数十年的发展,当今互联网不但汇聚了海量信息,而且其流通数据量仍以指数级速度激增。由于计算机无法理解Web上数据的具体内涵,面......
术语抽取技术是信息处理领域的一项基础性课题,是自然语言处理领域的非常重要的子任务,在诸如自然语言的生成、句法分析、数据挖掘以......
术语自动抽取是计算术语学中最重要的任务之一,它的主要目的是从专门领域的文本集中识别出能代表本领域的文本单元的集合,如词语等。......
本体在智能信息集成、信息管理、自然语言处理等领域发挥着越来越重要的作用。目前本体的构造大多基于人工方式,需要大量的时间和费......
随着网络信息量的急剧增长,人们期待通过一种更加简洁的方式获取信息。传统的搜索引擎只能返回一系列的网页,人们期待通过一种更加......
如何快速又准确地抽取术语是自然语言处理中一项重要课题。面向学术论文领域的术语抽取研究能够有效地推动科学的发展与成果的推广......
传统机器学习方法从训练数据中学习得到的数据模型能够在测试数据中取得良好效果的前提是:有充足的训练数据且训练数据与测试数据同......
专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层......
当前随着互联网时代的技术更迭,数据量呈现爆炸式的增长,每一个用户都是信息的发布者和接受者。因此从海量的数据中抽取出有效的结......
针对2016年以后的互联网里国内外公开的专利情报领域信息,从专利情报信息的研究方法、研究应用和新技术应用趋势的预测3个方面对专......
[目的/意义]针对方志资源的知识价值利用率极为有限的现状,探究面向方志知识图谱的自动化术语抽取,解决缺乏大规模标注语料的冷启......
随着网络信息化的飞速发展,科技文献的大量出现和国内外学术交流的日益普及,新术语和新信息层出不穷,多语言科技知识的有效获取是......
[目的]围绕实体识别任务实现以传统音乐为对象的非物质文化遗产术语抽取.[方法]构建基于中国非物质文化遗产网的国家级非物质文化......
本文提出基于条件随机场(CRFs)的中文领域术语的自动抽取方法,在给定领域分类语料前提下,该方法不仅很好解决了未登录词中的领域术语抽......
近年来,由于统计方法在自然语言处理领域得到广泛运用,大规模语料库的作用得以凸显。其中,大规模的双语对齐语料库因为包含有两种不同......
本文提出了一种基于文本的本体学习框架,该框架共包括术语抽取、本体创建和本体修剪三大功能模块。术语抽取用来从Web文本中识别出......
本文介绍了一种基于最大公共子串(LCS,Longest CommonSubstring)算法的术语抽取方法:按标点符号对领域文档进行切分;抽取切分后的语......
针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法.我们从Internet上采集网页,使用改进的互信息参数(......
术语抽取是自然语言处理领域的一项基础性工作.本文提出了一种基于统计与规则相结合的术语抽取方法:首先在对生语料进行分词标注的......
[目的/意义]梳理和总结基于机器学习的自动术语抽取的相关研究,为领域相关人员提供参考.[方法/过程]在CNKI和EndNote的分析工具基......
中文分词是将中文文本中的词语按照一定的规则进行切分的过程。由于中文语句中字与字之间没有任何明显的切分标记,计算机无法对词......
研究哈萨克语信息技术术语自动识别方法.采用基于条件随机场(CRF)的方法,针对哈萨克语信息技术术语的组成形式、定界规则等术语自......
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则......
术语抽取是自然语言处理领域的一项基础性工作。本文提出了一种基于统计与规则相结合的术语抽取方法:首先在对主语料进行分词标注的......
专业术语的识别是知识抽取和文本挖掘的关键。为了提高专业术语识别的效率,提出了一种半监督的基于种子迭代扩充的专业术语识别方......
在目前的术语自动抽取中,双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了术语自动抽取......
介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本......
自动化地获取网络资源中的领域本体可以缩短本体的构建周期,但自动化的本体扩充还是本体工程中的一个挑战,其难点主要在于如何抽取......
科技名词中文译名标准化和规范化工作是推动我国科技进步和科学知识传播的重要基础。新的科学概念和技术名词层出不穷,如何及时发现......
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并......
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性......
摘 要:中文科技名词自动抽取的关键步骤是分词,文章首先讨论中文语料库中字母词的全/半角现象,然后考察这种现象对自动分词结果当......
设计并实现了中文领域术语抽取系统,提出了基于前后缀的中文领域术语抽取算法,该算法独立于具体的领域,并且对包含常用前后缀的领......
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量。获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度。本......