【摘 要】
:
传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步
【机 构】
:
中国电子科技集团公司第三十六研究所,西北农林科技大学信息工程学院
【基金项目】
:
陕西省自然科学基金项目(2017JM6059),中央高校基本科研业务费专项资金资助项目(2452016081),中国博士后基金(2017M613216),陕西省博士后基金(2016BSHEDZZ121).
论文部分内容阅读
传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分
其他文献
爱尔兰投票决定成为世界上第一个撤资化石燃料的国家.日前,爱尔兰国会下议院已通过化石燃料撤资法案.具有里程碑意义的举措意味着已经投资于煤炭、石油和天然气行业的公共资
架结构混凝土浇筑的相关材料、机具准备、质量要求及施工工艺。
啤酒中双乙酰含量超过0.1mg/L。会产生不愉快的馊饭味或奶油味。双乙酰被认为是衡量啤酒成熟与否的关键性指标。本文分析了影响啤酒中双乙酰含量的因素,从而总结出降低双乙酰的
近日,华扬太阳能通过国家两化融合管理体系评定工作委员会对公司两化融合管理体系的审查复核,获得了工信部颁发的“两化融合管理体系评定证书”,成为2017年全国首批获证的企
本文研究了油品销售企业设备管理的特点,探究设备报废的条件及在日常生产经营过程中设备报废的价值,并对关键设备的报废标准提出具体建议。
我经常去北京植物园锻炼,有一次路过竹园发现,成片的竹林边上的竹子都喜欢往外长。后来再去竹园,发现工作人员用粗壮的绳索试图拉回这些“歪身浪子”,但其中的一些竹子拼命往外就
针对以往水泥浆体系失水性能不稳定而造成施工耽搁的情况,本文从提高水泥浆体系性能入手,通过室内试验,研制出一种失水量小、稠化性能可调的新型水泥浆体系,目的是为满足新疆
前言二甲基硫(DMS)在啤酒中的阈值为30~50μg/L,会给啤酒带来一种令人不愉快的类似煮熟蔬菜的味道,被认为是对啤酒风味影响较大的硫化物之一.
用电感耦合等离子体原子发射光谱(ICP-AES)对市售附子中Cu、As、Cd、Cr、Pb等5种重金属元素的进行检测,并进行方法学研究。该方法过程稳定,数据准确性较高,符合检测要求,可以