基于两类统计机器学习模型的中文化学物质名称识别研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:b329066975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与基于词典和基于规则的识别方法相比,统计机器学习方法更加适合被应用到命名实体的识别工作中来。本文主要在中文化学物质名称的识别工作中,考察两类统计机器学习模型识别效果及识别效率的优劣,实验结果表明,在所取训练语料与测试语料相同的情况下,以CRF模型为代表的条件概率模型可以展现出更好的实验性能。
其他文献
合成了具有Dawson结构的钼钒磷杂多酸,并将其转变为相应的十六烷基吡啶盐,利用IR,CV,31PNMR,UV等手段进行表征.讨论了钒取代后杂多化合物的结构特征.
针对我国青少年存在高自杀率的现状,文章从生命教育的问题提出背景、概念、必要性出发,提出了生命教育的实施内容;并探讨了生命教育的实施策略与途径:整合各种资源、促进生命
通过介绍客运专线与常规铁路特性的区别,提出了客运专线牵引变电所接地设计不能以地网电阻小于0.5Ω为设计标准,应以变电所接地短路时故障点地电位满足人身及设备安全为设计标
<正> 不知大家注意到没有,凡是写作能力低下的学生,朗读时都磕磕巴巴的。原因何在?就是他们的语感差,不具备从一句话的开头预测整个语句的趋向的本领。因为语感差,所以无论他
期刊
我国目前对牵引变电所二次设备防高压侵入技术有着比较深入的研究,对于防雷电和接地设计也有着非常完善的设计,但是影响牵引变电所安全的问题时有发生,我们根据牵引变电所反
近年来,随着医患关系越来越紧张,人们对于医生这一职业的关注度也越来越高。现代医学显现出技术化和商业化过重的色彩,医学科学与医学人文的割裂感也越发强烈,归根究底是医务
近年来,四川藏区城镇急速发展致使资源消耗过快与区域生态环境退化。面对发展的现实困境和《全国主体功能区划》的限制要求,引导四川藏区城镇走生态化、可持续化的发展道路显
牧草基因工程是近年来国内外研究的热点之一。针对农杆菌介导百脉根遗传转化原理、影响农杆菌介导百脉根遗传转化的重要因素、转基因技术在百脉根的生物固氮、抗逆性和品质改
<正>一般提到"早恋",我们首先想到的是中学生,有哪位家长相信孩子在小学阶段会恋爱?这样的事恰恰就发生在我所带的四年级(2)班。这是本学期开学第三周的星期五,我在办公室批
“民间智库”由来已久,并且表现为不同的历史存在形态。概括起来分别有礼失求诸野、民情上达、智库借鉴、智库依赖、参议政事、民间立场6种存在形态。“民间智库”的功效得失