人名识别相关论文
本文主要对信息抽取中的命名实体识别和模板自动获取两个技术进行了研究,并提出了一套有效的解决方案.在命名实体识别方面本文重点......
命名实体识别(Named Entity Recognition,NER)是根据各种识别和搜索技术识别输入的文本对象中的人名实体,机构名实体,地名实体。命......
在分析智能交通管(ITMS)领域特点的基础上,提出了适于ITMS的分词算法.使用特征词处理规则、专有词典和专有地名库切分出特征词、专......
为了提高藏文人名识别的效果,提出了结合三层的层次特征的藏文人名识别算法。提出了无须分词,仅在藏文音节粒度上,基于藏文人名三......
该文根据中国人名的形成方式,总结和统计了人名的用字特征和边界模板特征,通过计算人名内聚度、人名区分度和边界模板可信度的综合......
招中标数据中的联系人和评审专家是企业关注的关键信息之一,为建立企业竞争信息服务平台,实现招中标数据的自动处理,采用基于隐马......
专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料......
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用......
搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名......
人名识别常被作为命名实体识别任务的一部分,与其他类型的实体同时进行识别。当前使用NER方法的人名识别依赖于训练语料对特定类型......
在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界......
提出了一种基于位置概率模型的中文人名识别算法。系统的知识源来自于两个方面:人名列表以及标注语料库中提取的人名的左右边界词......
共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识......
新兴媒体时代的发展使大量的信息涌入了我们的视线和大脑,广大网名用户在面对网上的信息时需要找寻符合自己的资料,在这种情况下,......
中文人名数量众多,规律各异,使得中文人名识别成为中文分词的重点和难点,中文人名识别技术的突破将对提高汉语自动分词和句法分析......
采用基于统计的方法实现日本人名的识别和翻译系统。将人名的识别转换成序列标注问题,采用条件随机场方法训练识别模型。训练语料......
受限于标注语料的领域和规模以及类别不均衡,中文人名识别性能偏低。相比人名识别训练语料,人名词典获取较为容易,利用词典提升人......
如何建立适于交通管理系统下信息检索子系统中的分词模块是提高检索性能的关键所在。本文在分析交通管理领域特点的基础上,提出了......
提出并实现了一种基于支持向量机(SVM)的中文文本中人名的自动识别方法。对训练文本进行自动分词、词性标注及分类标注,然后按字抽......
在中文文本分析的许多应用领域中,人名识别是一个广泛存在且受到持续关注的基本问题。虽然目前人名识别方法较多,但大多以语料统计和......
随着藏文信息技术的发展和进步,藏文字处理技术已经日趋成熟。其中UNICODE藏文编码国际标准的公布和OPENTYPE技术在藏文字体设计上......
根据中国人名和外国人名的构成特点产生潜在中国人名和外国人名,然后把它们作为节点词加入到句子的分词有向图中,利用上下文信息对有......
CLP2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)的人名消歧评测的任务是个聚类问题:对给定的一组文档,按......
中文人名的识别至今还是自然语言研究领域一个比较困难的课题,因此提出一种基于条件随机场模型的文中人名识别方法。条件随机场模......
众所周知,维吾尔族是一个勤劳勇敢的民族,在我国的发展建设中做出了突出贡献。研究维吾尔族人名对于了解维吾尔族,维护祖国统一和......
在本文中,对自然语言处理的基础性问题中文分词进行了研究。在常见的基于词典的分词算法和基于统计的分词算法的基础之上,提出了一......
由于深度学习的相关研究不断深入,深度学习平台TensorFlow在命名实体识别中的应用也得到了广泛的应用,并且推动了人名识别研究的发......
维吾尔语是属于阿尔泰语系的黏着性语言,构词特点比较复杂,尤其是维吾尔语中的人名,由于来源差别巨大,识别难度很高,到目前为止,还......
中文分词技术的研究是中文信息处理的一项基础性课题,广泛应用于搜索引擎、机器翻译、信息抽取、文本聚类等领域。目前,影响分词质......
在人们利用计算机技术自动处理海量信息的大背景下,信息检索、信息抽取、机器翻译、文摘生成等技术应运而生。命名实体识别是对文本......
中文分词是机器学习,自然语言处理中的一个基础部分,中文分词处理要对输入的中文语句在字、词、句三个层面上进行处理。在中文中,......
自然语言处理是人工智能中的重要领域,不但能够帮助人们从庞大的语言数据中提取出需要的信息,甚至能够理解语法语义并对其做出合理......
命名实体识别是近年来中文信息处理领域研究的热点之一。命名实体是文本中信息最重要的载体,提高命名实体识别的准确率不仅能提高分......
近年来电影行业蓬勃发展,相关的信息抽取和分析技术日益受到行业内的重视,其中对电影主创人物的分析尤为重要。而电影评论作为观影......
命名实体识别(Named entity recognition,NER)是自然语言处理(Natural language processing,NLP)中重要的任务,其中人名实体是主要......