基于规则和统计相结合的中文命名实体识别研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:gunnie0095
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。
其他文献
电影的片名是一部电影的眼睛,影响观众对电影的最直观感受,也影响着整部电影的成功率。本文以修辞学的相关理论为基础,结合社会语言学的研究方法,从英语电影中文片名修辞效果的实
从20世纪90年代初开始,我国股票市场经过了22年的发展和完善,其规模和影响力日益扩大。股票市场已成为企业重要的融资渠道和居民投资场所,与国民经济的关联越发紧密。股票市场的
“很、太”是现代汉语中使用频率较高的程度副词。本文借助中介语语料库,考察了菲律宾、泰国留学生程度副词“很、太”的偏误情况,从历时角度揭示学生在习得程度副词“很、太”
英语写作既能巩固学生的词汇和言语构造,又能让学生的语言知识得到发展,思维得到训练,还能提高学生的交际能力,培养其创造能力。我们以'有兴趣、有语料、有方法'三方
文章通过理论分析和实践经验相结合的方法来探讨大专学生自信心问题,阐述了加强大专学生学习自信心教育的必要性,提出了加强大专学生学习自信心教育的途径和方法,并指出加强
<正>2012年国内最火的电视综艺节目《中国好声音》,让制作公司"灿星"和众导师声名远扬,浙江卫视更是借此狂赚数亿,其实,这一切的定夺权皆掌握在一个幕后老板的手中,从好声音
<正>英国诗人柯尔立治认为:"在生气勃勃的散文中,自然的各种美、人类的各种激情与遭遇,时常是用一个纯洁而仁慈的人在沉思默想这些事物时所想到的自然的语言表达出来。"朱自
根据我国中小型乳品厂生产巴氏消毒乳的现有条件,对其潜在的危害进行了分析,确定其危害控制 点,并提出了有效可行的控制方法。
目的探讨独活寄生汤加减配合牵引推拿治疗腰椎间盘突出症的临床疗效。方法选择本院近4年来确诊腰椎间盘突出症的患者252例,随机分为治疗组和对照组各126例。治疗组给予独活寄
新世纪以来,在后现代文化氛围、新媒介、文化消费主义的合力冲击下,文学发展陷入暂时的困境。文学的阻滞主要表现在文学创作、文学批评、传播媒介以及文学文本等诸多层面。在