术语抽取相关论文
【目的/意义】从海量论文元数据中抽取算法术语并构建它们之间的创新演化关系,有利于对算法的有效管理和运用,以帮助科研工作者提升......
中国列车运行控制系统(CTCS)规范体系是在借鉴欧洲列车运行控制系统(ETCS)规范等国外标准的基础上,结合中国国情逐步建立起来的,已成为......
文章从传统知识组织系统和现代知识组织系统两方面介绍了知识组织系统构建研究现状,并从术语自动抽取及统一知识组织系统自动映射......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
术语自动抽取是计算术语学中最重要的任务之一,它的主要目的是从专门领域的文本集中识别出能代表本领域的文本单元的集合,如词语等。......
本体在智能信息集成、信息管理、自然语言处理等领域发挥着越来越重要的作用。目前本体的构造大多基于人工方式,需要大量的时间和费......
随着网络信息量的急剧增长,人们期待通过一种更加简洁的方式获取信息。传统的搜索引擎只能返回一系列的网页,人们期待通过一种更加......
如何快速又准确地抽取术语是自然语言处理中一项重要课题。面向学术论文领域的术语抽取研究能够有效地推动科学的发展与成果的推广......
传统机器学习方法从训练数据中学习得到的数据模型能够在测试数据中取得良好效果的前提是:有充足的训练数据且训练数据与测试数据同......
专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层......
当前随着互联网时代的技术更迭,数据量呈现爆炸式的增长,每一个用户都是信息的发布者和接受者。因此从海量的数据中抽取出有效的结......
针对2016年以后的互联网里国内外公开的专利情报领域信息,从专利情报信息的研究方法、研究应用和新技术应用趋势的预测3个方面对专......
[目的/意义]梳理和总结基于机器学习的自动术语抽取的相关研究,为领域相关人员提供参考.[方法/过程]在CNKI和EndNote的分析工具基......
中文分词是将中文文本中的词语按照一定的规则进行切分的过程。由于中文语句中字与字之间没有任何明显的切分标记,计算机无法对词......
研究哈萨克语信息技术术语自动识别方法.采用基于条件随机场(CRF)的方法,针对哈萨克语信息技术术语的组成形式、定界规则等术语自......
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则......
专业术语的识别是知识抽取和文本挖掘的关键。为了提高专业术语识别的效率,提出了一种半监督的基于种子迭代扩充的专业术语识别方......
在目前的术语自动抽取中,双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了术语自动抽取......
介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本......
自动化地获取网络资源中的领域本体可以缩短本体的构建周期,但自动化的本体扩充还是本体工程中的一个挑战,其难点主要在于如何抽取......
科技名词中文译名标准化和规范化工作是推动我国科技进步和科学知识传播的重要基础。新的科学概念和技术名词层出不穷,如何及时发现......
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性......
摘 要:中文科技名词自动抽取的关键步骤是分词,文章首先讨论中文语料库中字母词的全/半角现象,然后考察这种现象对自动分词结果当......
设计并实现了中文领域术语抽取系统,提出了基于前后缀的中文领域术语抽取算法,该算法独立于具体的领域,并且对包含常用前后缀的领......
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量。获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度。本......
针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在......
设计了一个将统计方法与规则方法相结合的专业领域内术语抽取算法.针对专业领域术语的特点,利用多种衡量字符串中各字之间结合'......
随着国家科技战略规划发展的进一步深化,知识产权战略已经提升到国家层面,未来国家重点产业持续发展和新兴产业创新开拓都与知识产权......
为了确定改进互信息(PMIk)方法的参数k取何值时能够克服互信息(PMI)方法过高估计两个低频且总是一起出现的字串间结合强度的缺点,......
针对中医领域,提出了一种基于条件随机场的术语抽取方法,该方法将中医领域术语抽取看作一个序列标注问题,将中医领域术语分布的特征量......
军事术语是传递军事信息的主要载体,客观反映军事领域的变化与发展,军事领域术语抽取研究对于军事信息处理有着重要意义。以军事领......
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.......
术语抽取是层次体系构建的首要子任务。目前的术语抽取研究主要集中在文本语料并且混合多个主题,存在知识获取的瓶颈和术语表述的......
本文提出基于浅层句法分析的术语抽取的算法,其基本思想是大规模无标注真实科技文本库中,通过基于概率模型的句法分析对句子进行句......
双语术语抽取在双语术语词典编撰、双语本体构建、机器翻译以及跨语言信息检索中具有重要的作用。其中,双语核心术语是双语术语识......
针对手工构建本体工作量大、效率低以及更新维护困难等问题,文章提出了一种中文环境下多策略本体学习方法。使用统计分析和语义关......
为了降低互信息方法固有问题对术语过滤效果的影响,提出一种双阈值互信息过滤方法,给出了一种基于局部评价指标的阈值确定算法,通......
设计了统计方法和规则方法相结合的专业术语抽取算法,并对由此算法抽取的术语作进一步的处理,以方便人们阅读专业文献。通过对统计......
针对军事情报领域,提出了一种基于条件随机场的术语抽取方法,该方法将领域术语抽取看作一个序列标注问题,将领域术语分布的特征量化作......
在术语抽取工作中,经常会遇到一些包含活跃词汇的短语或短语碎片,这些干扰项一般具有稳定的搭配模式,并且在语料中共现的概率也非常高......
专利是科技信息工作的重要研究对象,其中所蕴含的价值亦是有目共睹。深入挖掘专利中所蕴含的知识,从而深化其利用价值是科技信息工作......
提出ATValue(Advanced TValue and Fieldhood Integration)术语抽取法。为提高术语抽取质量,在TValue五属性的基础上,提出领域度。通......
丰富的电商领域的产品概念层次体系,有助于全面了解产品属性,进行产品信息的深度挖掘,从而进一步用于挖掘消费者需求,辅助商业决策......
提出一种改进C-value的术语抽取方法,即IC-value方法。利用停用词对文本进行预处理后,采用一种基于串频统计的抽取算法提取候选术......
研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库......
在阅读学术资料时,人们总是希望能迅速准确地把握文章中的术语词及其定义,从而能更好地理解和把握主题;在自然语言处理的工作中,研......
互联网时代信息传播速度加快,传播途径广泛。学者学术交流更加频繁,科技文献的发表数量增多,术语作为科技文献中能够反映研究领域......