【摘 要】
:
现实中的重要信息大量地以非结构化的文本形式呈现,难以被直接利用。在非结构化文本的结构化处理当中,实体关系抽取是一项关键任务。有监督的实体关系抽取依赖于成本极高的标
论文部分内容阅读
现实中的重要信息大量地以非结构化的文本形式呈现,难以被直接利用。在非结构化文本的结构化处理当中,实体关系抽取是一项关键任务。有监督的实体关系抽取依赖于成本极高的标注数据,而弱监督学习方法通过利用较为容易取得的知识库数据为实体关系句子自动标注,可以有效地缓解人工标注带来的高昂成本。弱监督的实体抽取中存在错误标注以及关系重叠的问题,针对这些问题,本文涉及的主要工作有:设计了基于深度神经网络的端到端学习方式进行关系抽取以取代特征工程。传统的人工特征设计难以覆盖真实的样本空间,且其依赖的自然语言处理工具所产生的错误将造成噪声传播。端到端的神经网络避免了人工特征的这些限制。针对弱监督学习的误标注噪声设计了层次注意力神经网络,并针对标签重叠问题设计了多标签联合学习的方法。本文通过具有层次注意力的多示例学习降低误标注样本在学习中的权重以消除噪声影响,且通过对关系类别间的关系建模,进一步提高了模型性能。设计了一种全局优化的序列标注模型实现了弱监督的实体及关系联合抽取。该方法比传统上将这两项任务分别独立开展更具效率,且通过联合的学习提高了性能。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
众所周知,政治理论课教学作为学校德育工作的主渠遭,在学校的整体工作中占有相当重要的地位,但近年来,学生普遍对政治理论课不感兴趣,这里固然有其社会根源,同时,与我们政治理论课不
<正> 规模化猪场应贯彻“防重于治”的方针。现将兽医保健工作日程,列入表1。规模化猪场可根据当地疫情和实际情况参考表1内容,再制定本猪场的兽医保健工作。
公路工程存在施工准备不足、施工组织设计不完善、物料影响因素难控制和现场施工工序产品检测的误差大等问题。有效解决公路施工中的问题,应加强施工前的准备工作,现场施工要
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
基于分析预应力施工技术的优势,研究预应力施工技术在桥梁工程施工中的作用,根据具体工程案例,通过对混凝土桥梁预应力施工要点的探究,提出混凝土桥梁预应力施工对策。以期提
平原河网地区水动力学条件复杂,治理难度较大。基于MIKEll软件建立盐城堤东地区河网模型,对模型进行率定和验证,利用该模型对现状排涝能力进行评估,并通过河道整治、挡潮闸下
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
本科毕业论文是本科教学的重要环节,能综合检验本科毕业生对所学知识的掌握和运用能力,在本科人才培养方案中占有非常重要的地位。其质量高低直接反映人才培养的效果。因此,
普卢利沙星是由日本新药公司与明治制果公司共同开发研制的第三代氟喹诺酮类广谱抗菌药物,2 0 0 2年10月8日在日本注册,同年12月6日上市。[1]按照中国最新新药注册管理办法