面向产业合作的半监督关系抽取

来源 :浙江大学 | 被引量 : 0次 | 上传用户:rscgmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在产业互联网蓬勃发展的今天,对产业合作场景进行分析,实现全球精准合作,已经成为产业发展的必然趋势,这不仅对政府决策人员具有重要参考意义,也为企业决策者提供了指导意义。产业合作相关信息广泛存在于互联网的产业新闻资讯中,利用大数据和人工智能技术,从非结构化的新闻资讯中抽取出结构化的产业合作信息,并进而组织成为知识,具有十分重要的应用价值和现实意义。对于产业合作这一细分领域,没有合适的标注数据集用来构建信息抽取模型,因此数据集的构建也成为产业合作信息抽取任务中的难点与关键点。本文关注产业合作场景中产业合作关系的抽取,设计并实现了针对产业合作领域的关系抽取框架,能够从产业新闻资讯中抽取企业实体和企业间的合作关系。框架中涵盖了从数据清洗到抽取结果整合的完整流程,包含基于模式匹配的规则抽取和基于机器学习的模型抽取两条数据通路,能够自动化完成产业合作领域的关系抽取。此外,本文针对框架中的相关企业抽取模型和产业合作关系抽取模型进行了优化。针对实体抽取模型,通过词向量和词性信息获得组合特征,并在网络结构上使用多层CNN+双向LSTM的方案,能够结合局部特征和全局特征,带来更好的模型效果。针对关系抽取模型,本文提出基于上下文模板约束的半监督关系抽取方案,能够从小数据量出发,通过半监督学习对数据集进行扩展,并充分利用已有标注数据,提取标注数据中的上下文模板作为先验知识,对扩展的伪标签样本进行置信度评估,提高扩展数据的质量,进而构建更好的关系抽取模型。本文构建了产业合作数据集,并在数据集上进行对比实验,验证了本文方案的有效性,并将方案应用到产业发展决策支持系统中,为用户提供服务。
其他文献
随着现代经济的高速发展,受众越来越倾向于为更好的体验买单,这也意味着人类已经迎来了体验经济的时代。质感作为最基础、最直观的体验形式,是根据已有的触觉感受储备库,对材料表面肌理的再次感受,逐渐受到越来越多的关注,因此,质感设计也被广泛应用于各个设计领域。三维动态图形,即在动态图形的基础上添加纵轴以创建空间感的新型设计方向,基于三维软件先进的计算机图形技术,三维动态图形以其逼真的视觉真实特征、创意无限
一个产品的完整设计过程需要经历设计、分析和优化三个阶段的反复迭代,其中设计阶段在CAD系统中进行,分析和优化阶段在CAE系统中进行。然而,大多数CAD/CAE系统未实现有效集成,导致CAD系统生成的参数化模型无法直接用于CAE系统,CAE系统得出的优化结果也无法直接驱动CAD系统对模型进行自动更新。为了提升CAD/CAE系统的集成度,提高产品的设计与开发效率,本文对基于优化参数驱动原始模型自动更新
无线自组织网络(Mobile Ad Hoc Network)是大量无中心节点通过多跳通信方式组成的网络。Ad Hoc网络具有便利性、灵活性等特点,在军民领域都得到了广泛的应用。但是在大量的应用中网络节点呈现数量更多、移动更灵活的特点,对路由协议要求也越来越高。尤其是在网络拓扑变化不确定的情况下,现有的Ad Hoc路由协议对环境变化感知能力不足,不能根据拓扑和环境状态的变化情况自适应地修改路由信息,
时栅位移传感器具有抗干扰能力强、稳定性好、可靠性高、工程易实现等优点,它基于时空转换重要思想,通过感应电磁场的变化将空间位移量转换为电信号,再利用高频时钟脉冲插补相位差来实现高精度高分辨力的位移测量。随着时栅位移传感器朝着高分辨力测量方向的发展,传统时栅位移传感器还需采用超精密刻画技术减小空间栅距来提高分辨力。为了解决过度依赖空间超精密刻线问题,本文提出采用多参数协同调制的位移测量方法来提高传感器
随着科学技术的发展,人类在山地侦察、资源勘探、抢险救灾等特殊环境中作业的需求不断增加。六足机器人因具有多自由度的腿部结构和离散的落足点等特点,成为面向复杂环境作业的优秀解决方案,逐渐替代人类在复杂环境中执行任务。由于作业环境的特殊性,六足机器人在行走的过程中不可避免的会受到外部环境的冲击,可能产生腿部结构变形、关节装配松弛、电子元器件失效等多方面的问题,从而造成机器人行走状态的异常,影响机器人继续
目的:本研究旨在阐明我中心初诊急性髓系白血病患者血清铜、锌水平及铜/锌比值的变化及其影响因素,并进一步评估血清铜/锌比值对成人急性髓系白血病患者早期治疗结局的影响。方法:第一部分,选择2017年10月至2019年4月于吉林大学第一医院肿瘤中心血液科住院并初次诊断为原发性急性髓系白血病的患者109例作为病例组;同时,选取同一时期于我院体检中心进行体检的82例健康者作为对照组。收集急性髓系白血病患者和
在现实环境中,通过物体图像推断它自身的材质一直是一个具有挑战的问题,获得的材质可被广泛应用在三维物体的重建,克隆迁移等AR领域。由于物体自身的材质属性在图像中与物体
随着社会经济的持续发展,物流企业逐渐关注服务质量竞争。物流企业作为物流服务提供者,如何提高服务质量,成为每个物流企业关注的焦点。服务失误在所难免,但在追求个性化需求、强调定制化服务的今天,如何在服务失误发生后进行补救以及提高补救水平以维护客户满意水平、减少顾客流失、提高顾客忠诚度和提升企业形象是快递服务企业当前面临的焦点难题。以我国快递业服务补救为研究对象,依据感知公平、顾客关系、服务补救等相关理
英国翻译理论家彼得·纽马克(Peter Newmark)在20世纪80年代提出了语义翻译和交际翻译的理论,为翻译实践提供了一定的方法和策略。纽马克指出,不同类型的文本表达方式不同,语
近年来,科学家致力于通过对软体机器人的研究,利用软体材料天然的柔顺性、迟滞性和响应特性,解决传统机器人主被动适应性差、安全系数低以及不灵活等问题。尽管关于软体机器人的研究已经取得了较大进展,但其仍然普遍存在着响应速率缓慢、运动方式单一、应用场景不足等弊端。此外,作为软机器人的关键组成部分,软体执行器的设计极大程度上决定了软体机器人的综合性能和应用场景。基于此,本文从软体执行器出发,创新设计了一款响