面向本体学习的中文专利术语抽取研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:liongliong485
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以“钢铁冶金”领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场的学习过程,最大限度避免因核心词汇库代替人工带来的标注不准确不充分问题;在此基础上,进一步依据合成规则构造新术语,并经过领域专家确认后添加至核心词汇库中。经过实验论证,基于字角色标注的基本术语抽取F1值高于94%,而基于合成规则的复杂术语抽取准确率也可达到75%。在7597件专利的题名和摘要文本中,
其他文献
当前,连锁企业为保证自身经营的可续性,对现有物流配送模式的选择尤为重要,其决定了企业发展的优越性,同时也敦促着企业物流配送模式的优化与科学化。因此,本文立足于连锁企
针对直接测量法无法同时兼顾高频信号和低频信号,且测量误差大、设计相对麻烦的问题,本文选用等精度测量法设计了数字频率计,能够适应不同量程范围内频率的测量,且误差不随频
目的:探讨超声检查在急性阑尾炎诊断中的应用价值。方法:从某医疗机构2015年8月—2017年10月收治急性阑尾炎患者140例作为本次研究对象,所有患者均采取了超生仪器检测诊断。
企业资源计划(ERP)是一个复杂的软件系统,其中以物料需求计划为核心。企业在实施ERP项目中,在项目管理、业务流程重组、文化整合、变革管理、组织学习等方面都面临着巨大的挑
<正>恶性肿瘤的发生和进展是一个由多个因素共同参与,不同阶段互相影响、关联、协同的复杂病理生理过程。大肠癌作为肠道最常见恶性肿瘤,在我国其发病率高居消化道癌症发病率
学术在本质上是独立的、自由的,因此学术自由是学术自身发展的必要条件,同时也是大学发展的动力。大学学术自由的实现有赖于政府、社会和大学三方面的共同努力。
布依族民间故事是布依族优秀传统文化的重要组成部分,反映了布依族人民在各个历史时期的社会生活,分为机智人物故事、劳动生活故事等,是布依族人民集体智慧的结晶。随着全球
信息技术发展、经济全球化使市场消费者的需求呈现多元化态势,而这又要求市场信息多样、迅速、精准触达终端,也最终导致了市场各环节分工精细化。事实上,独自一家企业无法抵
系统梳理了上位法相关要求和国内城市经验做法,深入分析了南京现行城市规划管理体制和农村规划管理现状,结合现实需求,探讨了南京农村规划管理创新的路径与思路,在此基础上设
目的:研究不同剂量的无机砷对人肝星状细胞自噬水平的影响,探究三甲基腺嘌呤在无机砷诱导的自噬体-溶酶体融合的阻断作用。方法:1.RFP-GFP-LC3慢病毒感染LX-2细胞并经嘌呤霉素筛选稳定表达RFP-GFP-LC3基因的细胞株,分别用流式细胞仪和激光共聚焦显微镜分析感染效率。饥饿处理稳定感染的细胞,激光共聚焦显微镜下观察细胞内的RFP、GFP荧光表达及自噬溶酶体的形成。2.采用CCK8检测细胞活