短语识别相关论文
时间信息抽取是自然语言处理的一个新课题.2004年ACE评测在TERNevaluationplan中对时间表达式的评测给出了详细的定义和要求.本文......
在简单分析语法上识别汉语短语困境的基础上,提出一种利用语义搭配关系识别汉语短语的方法.首先,利用同义词词林对词的语义类进行......
应用最大熵模型进行英文基本名词短语的识别是一种新兴的短语识别算法.本文首先利用训练语料和自定义的特征模板生成候选特征,继而......
互联网上的信息与日俱增,随着信息检索技术的发展,用户已经能够通过Google,Yahoo,Baidu等搜索引擎提供和查询接口查询互联网中大量......
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边......
FreeartTrans英汉全文翻译系统是由西安汇申软件有限公司自主投资研发的基于规则的英汉全文全自动精确翻译软件。基于规则的机器翻......
近几年来,自然语言处理技术得到了快速的发展。句法分析作为自然语言处理中的关键技术之一,从一开始就受到了研究者们的极大关注。......
随着计算机技术及人工智能等技术的发展,说话人识别在近几年也有了长足的进展。自从Reynolds提出将GMM(Gaussian Mixture Model,高斯......
随着机器翻译技术的不断发展,对完全句法分析质量的要求也越来越高。由于完全句法分析(full parsing)要确定句子所包含的全部句法......
随着数据库技术的高速发展,普通用户可以像网页搜索引擎一样通过输入关键词直接在关系数据上查询结果,而不需要了解底层的数据库模式......
数量短语的识别是现代汉语语句分析的一个局部难点。现代汉语中数词千变万化,量词的种类繁多,数量短语的组合方式多样。本文以识别......
近年来,专利信息资源呈几何爆炸式的增长,如何充分地利用它们,使专利信息在科研和专利业务等方面发挥作用,成为文本处理领域的热门......
短语的识别与处理是英汉翻译中的一个重要环节.本文在讨论了英文短语的形态结构特征的基础上,提出了一种以短语模式空间匹配为基础......
在进行哈萨克语短语识别过程中,存在短语结构歧义的现象。本文通过研究大量的具有歧义的短语结构实例,分析了计算机处理过程中遇到......
期刊
本文应用基于实例的MBL(Memory-Based Learning)学习方法,对汉语中较常见的9种基本短语的边界及类别进行识别,并利用短语内部构成......
利用错误驱动法、支持向量机法和隐马尔可模型三种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效......
在自然语言处理中,短语在汉语分析中占有举足轻重的地位。短语作为汉语句子中的一个基本组成单位,在整个汉语句子的句法分析与语义......
利用错误驱动法、支持向量机法和隐马尔可模型3种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效......
重复短语识别是网页文本的特征抽取过程中的关键性技术之一,通过重复短语的识别能够有效地解决网页文本内容特征抽取的难题.研究利......
本文运用规则和统计相结合的方法构造了一个汉语介词短语识别算法.首先,根据介词和介词短语右边界组成的搭配模板自动提取可信搭配......
数量名短语的自动识别是中文信息处理中短语识别的重要内容,对汉语深层次句法分析和语义分析将起到很重要的作用。本文对"数.量.名"......
在进行哈萨克语短语识别过程中,存在短语结构歧义的现象。本文通过研究大量的具有歧义的短语结构实例,分析了计算机处理过程中遇到的......
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利......
针对介词短语右边界存在多种错误识别的问题,提出了一种基于最大熵的汉语介词短语自动识别方法。该方法结合了汉语介词短语左右边界......
为了进一步提高网页相关性判断的速度和准确率,提出了一种新的用于聚焦文摘的句子权重计算方法。在查询返回的结果集的基础上,通过......
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识......
本文针对统计方法和规则方法各自的特点,提出基于最大熵方法和转换规则方法相结合的中文基本名词短语识别算法,该算法是在一定词性标......
【目的/意义】针对基于统计特征的短语识别方法存在的噪声问题,提出了融合多策略的短语识别方法。【方法/过程】该方法融合多统计......
短语识别是进行短语分析的前期准备工作。针对搜索引擎日志中"N+V+N"、"V+N+N"型短语特点,采用最大熵方法,按词信息、词性信息、音节数及前......
...
本文在讨论了英文事的形态结构特征的基础上,提出了一种以短语模式空间匹配为基础的短语识别算法。该算法通过对短语的原型描述与输......
海量文本信息的增长给信息检索带来了极大的困难,当前的智能信息检索技术试图通过信息组织,将文本数据转化为机器可以存储、标引、......
心理学家用"台风眼效应"表征人们离危机事件中心的距离越远、反应越强的心理现象。突发事件发生以后,网络舆情数据通常会呈现铺天......
为了进一步提高名词短语的识别精度,针对遗传算法和隐马尔可夫模型各自的特点,提出一种基于遗传算法的隐马尔可夫模型识别方法。该......
为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐......
信息网络技术的飞速发展使信息的发布和共享超越了时空限制,基于自然语言处理技术的文档高质量自动处理成为热点研究课题。自然语......
本文经过借鉴维吾尔语自身特点和前人的研究成果,针对维吾尔语的句法、词法分析等方面进行了较深入的研究。经过分析其他语言在短......
汉语介词短语识别的方法是基于最大熵的统计模型,通过最大熵的介词短语边界自动识别和依存语法错误校正两个处理阶段:先由最大熵模......
短语识别在机器翻译、信息检索、信息抽取、文本分类和问题回答系统等自然语言处理应用领域中起着重要作用。随着互联网的应用越来......
随着Internet的快速发展和网络应用范围的不断扩大,WEB信息量呈指数增长,而传统的搜索引擎仅能从词的层面上来进行搜索,造成人们从......