【摘 要】
:
人名识别是自然理言处语领域的一个重要的子任务.实例学习是机器学习中的一种常见的方法.本文在对大量语料的语言现象的统计与分析的基础上,提出了一种用实例描述语言现象,用
【机 构】
:
山西大学计算机与信息技术学院,山西,030006
【出 处】
:
中国中文信息学会二十五周年学术会议
论文部分内容阅读
人名识别是自然理言处语领域的一个重要的子任务.实例学习是机器学习中的一种常见的方法.本文在对大量语料的语言现象的统计与分析的基础上,提出了一种用实例描述语言现象,用相似度计算识别人名的方法.实验表明,该方法具有一定的可行性.
其他文献
中国是辞书古国、辞书大国,但还不是辞书强国.中国辞书现代化的步伐还相当迟缓,缺乏宏观的战略谋划和领跑世界的辞书编纂实践,缺乏享誉世界的精品辞书和影响世界的辞书研究成
中文信息检索最早可追溯到748工程中的汉字信息检索项目,上世纪90年代以中文全文检索为代表的信息检索技术得到了迅速的发展并形成了规模化的应用,进入21世纪,由于搜索引擎应
专有名词的识别在针对各国语言的自然语言处理系统中都是一个具有挑战性和研究意义的课题.目前已有多种专名识别的方法,基于各自的出发点,各有利弊.本文对这些方法作了大致的
5月13日,“十一五”国家科技支撑计划“优质多抗专用蔬菜育种技术研究及新品种选育”课题启动会在中国农业科学院隆重召开,该项计划共分大白菜、甘蓝、番茄、辣椒、黄瓜、西
话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术.话题跟踪任务就是根据话题相关的训练新闻报道,在后续报道中发现与这个话题相关的所有报道.针
中文名实体识别是自然语言处理当中一个富有难度和挑战性的课题.本文提出了一种改进的基于TBL的后处理技术,它对学习到的规则集合进行优化,极大地提高了单个分类器的识别效果
一口气读完《彭德怀自述》,思绪万千,感慨无穷。历史何等公正,人民何等幸运,十年动乱之后,终于能读到这样一本惊心动魄、震古烁今的《自述》。
Breath read “Peng Dehuai
随着肿瘤免疫治疗的开展,免疫相关不良事件的发生率越来越高,其中免疫检查点抑制剂(immune check point inhibitors,ICI)引起的心肌炎的发生率为1%左右[1].心肌炎的发生频率虽
尼达尼布是一种三重血管激酶抑制剂,可靶向抑制血管内皮生长因子受体、血小板衍生生长因子受体和成纤维细胞生长因子受体通路,避免肿瘤转向正常逃逸机制,已被欧洲药品管理局
聚乙二醇重组抗血友病因子(Adynovate)建立在重组抗血友病因子(Advate)基础上,是聚乙二醇化的重组凝血因子Ⅷ,用于成人和青少年血友病A患者出血发作的按需治疗与控制以及常规