条件随机域模型相关论文
作为文本信息中的基本信息元素,命名实体是正确理解文本的基础。命名实体识别就是将文本信息中规定的实体识别出来,它在自然语言处......
语音识别即计算机自动语音识别,简单地说,就是让计算机能听懂人说话,将人说的话转换成计算机文本的一项技术。随着Internet和电子商务......
信息抽取是指从海量的文档集合中抽取需要信息的自然语言处理技术,是自然语言处理领域中非常重要的子领域,是近十几年发展起来的新领......
语音识别技术简单地说,就是让计算机能听懂人说话,将人说的话转换成计算机文本的一项技术。这将大大提高人们的效率,有着巨大的理论意......
随着互联网的发展,网络上的数据呈现了指数级地增长,互联网的用户也不断增加。如何从各种数据中快速准确的找到人们需要的信息,并......
中文地名识别属于中文命名实体(Named Entity)识别范畴,它是自然语言处理的基础任务之一,是机器翻译、信息检索、问答系统等技术的......
基于重复串构造候选词集合是未登录词识别(UWI)的重要方法,目前有两种策略用于重复串提取:基于字符和基于分词。该文针对这两种策略实......
藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁.根据藏语句法特点,该文作者提出五种句......
层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段.该文将其中的组......
针对生物医学文本中传统生物实体识别算法的精确度不高的问题,提出了一种新的基于粒子群优化-条件随机域的生物实体识别算法.新算......
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将共应用到百科全书文本段......
针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义......
未登录词词性猜测是未登录词识别的重要步骤.论文中应用条件随机域模型,使用词的外部和内部特征(组合特征),进行中文未登录词的词性......
名词短语是文本主要的组成部分,很好的识别出名词短语可以很大程度上帮助把握文章所表达的主要意思。而中文最长名词短语亦是如此......
命名实体是文本中基本的信息元素,是正确理解文本的基础。命名实体识别就是要判断一个字符串是否代表一个命名实体,并确定它的类别......