条件随机域相关论文
本文研究的主要目的是针对生物医学命名实体的特点开发使用有效的特征集合,并结合使用不同的信息资源,以提高基于特征的机器学习方......
条件随机域模型通过计算标注序列在观测序列下的条件概率进行标注,解决了传统模型(如隐马尔科夫模型和最大熵马尔科夫模型等)中存......
本文基于条件随机域模型处理中文命名实体中的人名、地名、组织机构名识别,综合利用外部特征,研究了字一级包括外国译名在内的中文......
在自然语言处理及信息处理领域,例如信息检索、文本分类等,如何正确地识别出命名实体,一直是一项重要而又困难的研究课题。已有的研究......
在Web2.0时代,互联网已经成为包含人类社会各种知识的信息库,人们越来越依赖互联网作为查询信息的重要来源。其中,人物之间的关系是一......
条件概率模型,又称为判别式模型(Discriminative Model),是一类常用的模式识别方法,它相对于产生式模型有很多优点。产生式模型早期被广......
随着近代计算机技术的飞速发展,孤立词语音识别系统已经取得了较高的识别准确率,非特定人、大词表连续语音识别技术成为当前的研究......
随着信息技术的发展,不同语言之间的沟通和交流变得越来越重要,在此背景下机器翻译等自然语言处理技术得到长足发展。作为当前研究......
随着互联网资源的迅速增长,仅仅依靠浏览器以及基于关键字检索查询的搜索引擎,已远不能满足互联网用户的信息需求,Web信息抽取应运......
中文分词是中文自然语言处理的基础性任务,分词的准确性直接影响到后续处理任务,分词的速度影响到后续的直接应用。成功的分词方法......
阜阳市局 £4a 局长——_MINtkMMtgj’#lnH$B——q.M——D收束志不他只邀狲位J则【科校为先导推动地租工作.B为广为戳民U用凶盼引眯B.......
随着社会和信息网络的发展,自然语言处理变得越来越重要。完全句法分析是自然语言处理的一个重点和难点,于是人们提出一种浅层句法......
文本分类是基于文本内容将待定文本划分到一个或多个预先定义的类中的方法。文本分类能较好地解决大量文档信息归类的问题并可以应......
随着人工智能技术在电力行业的应用,知识图谱将在电网调度、智能运检、客服问答等领域发挥重要的作用.实体识别是构建电力知识图谱......
时间表达式在多个自然语言处理领域都有着重要的作用,为了更好地识别时间表达式,提出使用条件随机域模型结合多种特征的方法对英语......
传统中文评价搭配抽取采用的最大熵和条件随机域等算法依赖于人工选取特征,且对前期语义标注精度要求较高.本文提出一种使用词向量......
为了解决中文组块分析精度不高和未利用词的语义信息的问题,提出了一种基于条件随机域模型和语义类的中文组块分析方法.该方法通过......
提出一种新的基于条件随机域和隐马尔可夫模型(HMM)的人类动作识别方法——HMCRF。目前已有的动作识别方法均使用隐马尔可夫模型及......
首次把条件随机域(CRF)模型应用到了中文名实体识别中,且根据中文的特点,定义了多种特征模板。同时,为了解决长距离约束问题,将词语触发......
提出一种基于条件随机域模型的方法用于中文文本组块分析.该方法将中文组块分析转化为对每个词语赋予一个组块标注符号,再根据条件随......
通过加入噪声、替代文字等手段隐藏信息内容的真实符号分布,是目前垃圾制造者干扰或躲避过滤器检测的主要手段。介绍一种使用基于......
信息抽取中,同一token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离......
生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采......
目前在国内外语篇级情感计算的研究刚刚起步.首先按表达情感的复杂度将句子划分为单情感词的简单句、多情感词的简单句和多情感词......
针对当前车辆检测方法中存在难以有效消除阴影干扰的缺点,提出了一种能够消除阴影干扰的车辆区域检测方法。该算法首先运用选择性......
论述了近年来国内外在常规命名实体识别方面研究工作的进展状况,针对其中最为关键的产品命名实体识别技术,考虑到领域本体对产品命......
为了获取隐藏在Intemet中的信息,基于条件随机域模型(CRF),提出了一种Web信息抽取的方法。该方法对网页样本中的每一行加注标签,确定文......
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的......
分析了判别式模型的标记偏置问题对序列化标记的影响,利用条件随机域模型的全序列概率归一思想解决标记偏置问题。在条件随机域模......
提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署......
介绍一个用于在生物医学文献中识别基因、蛋白质等生物实体的识别方法。该方法基于条件随机域方法,选取适当特征进行实体识别,利用......
基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称缩写对识别算法"扩充词典,利用编辑距离算法提高识别召回率。在......
随着互联网的普及应用,网上各种垃圾信息尤其是垃圾邮件也随着互联网的广泛应用而充塞在整个互联网上,对人们的工作生活和经济带来......
识别句子中的最长名词短语是一个对机器翻译等任务具有重要实际价值的难题.为了克服传统方法在处理词之间的长程关联的不足和标注......
为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRY建立抽取模型,提出了一种文本信息抽取的方法。该方法对文本......
为克服传统的全监督机器学习模型的训练依赖于大量的标注样本的弱点,给出一种半监督学习和主动学习相结合的算法。根据主动学习选择......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
近年来,随着生物医学文本的大规模出现,对文本进行自动化处理的文本挖掘技术变得越来越重要,如对海量生物医学文本数据进行自动分类,......
情感计算是目前人工智能领域的热门课题,而词汇的情感计算又是准确完成文本情感计算的基础.目前情感词汇的获取大多采用人工获取的......
传统的分步骤事件抽取方法中,事件元素识别的结果无法指导事件类型识别,而事件类型识别的效果在很大程度上决定了事件抽取系统的整......
随着基于统计技术的自然语言处理方法的兴起,怎样在语料规模有限的情况下,尽可能的提高系统的效果就显得十分重要。以下主要介绍两种......
提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测......
将条件随机域(Conditional Random Fields,CRFs)理论引入网络入侵检测研究中,并结合网络连接数据序列的属性特征,提出一种基于属性......
词性标注主要面临兼类词消歧以及未知词标注的难题,传统隐马尔科夫方法不易融合新特征,而最大熵马尔科夫模型存在标注偏置等问题。......
中文新词识别是指从未标注文本语料中抽取新词并识别其属性的过程,是中文信息处理领域的一项基础任务,其识别结果直接影响着分词、......