特征演算在关系抽取中的研究与应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:liaonianyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子级别关系抽取任务旨在识别句子中两个实体之间存在的语义关系。由于句子包含的词数量有限,导致关系抽取任务存在特征稀疏的问题。为解决上述问题,本文提出了一种特征演算的方法用于关系抽取任务,以充分获取句子的语义特征和结构特征。该方法使用关系实例中两个实体将句子的特征分组为不同的集合。然后,利用集合操作和逻辑运算对特征集合中的特征进行运算生成复合特征。本文的主要研究工作如下:(1)基于特征演算的关系抽取方法。现有工作大多基于贪婪算法或经验研究如何发现更多特征,很少考虑特征在句子中的语言特点和语法功能。对此,本文根据句子中的两个实体将特征进行组合以捕获句子的结构及语义信息,这样有助于最大程度地缓解特征稀疏问题。因此,本文提出特征演算方法操作形式化的特征。同时构建了一个最大熵模型,在ACE 2005中文数据集上系统性地探讨了不同特征组合方法对关系抽取性能的影响,证明了句子结构信息对关系抽取任务的重要性。(2)结合神经网络和特征演算的关系抽取方法。神经网络模型能自动获取句子语义特征表示,但不能对句子结构信息进行充分建模。因此,本文结合神经网络和特征演算的优势,提出将两者结合用于关系抽取的方法。该方法将特征演算生成的复合特征分别和卷积神经网络和双向长短期记忆网络结合,以使神经网络模型能获取到句子结构信息。在ACE 2005中文数据集上证明了本文提出方法明显优于其他基于神经网络的关系抽取方法。最后基于特征演算和神经网络设计并实现了一个界面友好的关系抽取系统。该系统抽取句子中存在的关系并形成结构化的数据以便存储和取用,为更多下游任务如知识图谱、智能问答等提供技术参考。
其他文献
贵州独特的地理生态环境蕴育了丰富的地方稻种资源,其中红色稻种占多数。红米具有较高的营养价值和药用价值,但是由于其不佳的口感而影响了人们日常生活中的食用频率。淀粉是稻米胚乳的主要成分,是决定稻米蒸煮食味品质的关键因子。因此,研究贵州地方红米水稻品种的遗传多样性、淀粉合成相关基因的变异类型及其对稻米蒸煮食味相关品质的影响,探索贵州地方红米水稻蒸煮食味品质形成的分子机理,为地方红米稻种资源的保护利用以及
分子标记辅助选择育种(Marker-assisted selection,MAS)与传统育种技术相比,可以快速有效的提高育种效率,降低育种成本。因此,寻找对猪生长繁殖性状有效遗传分子标记,对猪场经济效益至关重要。前期基于对贵州地方猪种进行全基因组重测序研究基础上,筛选出10个与香猪生长和繁殖相关的结构变异。采用PCR技术结合生物信息学分析方法,检测10个SV位点的群体基因型分布频率,以及与香猪生长
细胞色素P450是最古老、最庞大的超基因家族,作为昆虫最重要的解毒酶系之一,不仅与昆虫蜕皮激素、保幼激素和信息素等合成关系密切,并且在昆虫代谢杀虫剂和植物次生代谢物方面起着非常重要的作用。草地贪夜蛾Spodoptera frugiperda属鳞翅目夜蛾科灰翅夜蛾属,是起源于北美洲、南美洲的热带和亚热带地区的一种多食性害虫。因其具有强大的迁飞能力、繁殖能力以及适应能力和耐药性,已成为最难防治的农业害
为明晰茉莉酸甲酯(MeJA)连续处理昆虫多个世代后对其生长发育和反防御能力的影响,本论文以斜纹夜蛾Spodoptera litura(Fabricius)为研究对象,探讨了MeJA连续处理斜纹夜蛾幼虫6代后对其生长发育和解毒能力的影响,并通过转录组测序分析了F0和F5代幼虫中肠和脂肪体中差异基因表达变化。生长发育研究结果表明F0代幼虫经MeJA处理48 h后其体重增长率显著比对照高21.82%,F
集约化、规模化畜禽养殖模式,易造成畜禽体脂沉积过多等问题。饲料中添加抗生素、激素等,会导致畜禽体内药物沉积过多,这与人们生活水平和质量的提高、对畜禽产品的安全性和肉品质要求越来越高相矛盾。且为缓解目前国内玉米豆粕供需趋紧的现状,我国农业农村部畜牧兽医局下达了《饲料中玉米豆粕减量替代的方案》。为改善畜禽产品质量、响应国家饲料中玉米豆粕减量替代的政策,研究天然、绿色、健康且能替代玉米豆粕的饲料资源,生
随着遥感技术的飞速发展,高分辨率遥感影像目前已广泛应用于环境监测、灾害评估和农作物产量评估等领域。语义分割作为计算机视觉中的关键任务之一,它可以对图像中的每个像素进行分类。由于高分辨率遥感影像具有背景复杂和目标尺度差异大等特点,传统的语义分割方法对遥感影像处理的效果并不理想。深度学习技术在近几年取得了长足的进步,将其应用于遥感影像的解析中具有现实意义。本文对基于深度学习的语义分割方法在高分辨率遥感
本文旨在从中草药饲料添加剂对育肥猪平均日增重、平均日采食量、料肉比、腹泻率、基础日粮成本和经济效益等方面,设计试验,探讨中草药饲料添加剂对育肥猪生长性状的影响。一、中草药饲料添加剂对育肥猪日采食量、平均日增重、料肉比的影响试验采用60头体重60kg左右的育肥猪,随机分成对照组、抗生素组、试验I组(添加0.5%的中草药饲料添加剂)、试验II组(添加1.0%的中草药饲料添加剂)和试验III组(添加1.
互联网在进行无线通信传输时,其传输安全性、传输效率以及传输质量等因素尤为重要。因此对无线传输性能的研究具有重要意义。为了改善无线通信的传输性能,本文主要研究内容是基于SDN技术的LDPC的联合优化,具体工作内容和研究成果如下:(1)基于对传统的LDPC校验矩阵的构造算法进行学习和研究,提出改进后的PEG算法与矩阵移位算法相结合的方案来实现校验矩阵的构造。首先根据校验矩阵中各节点的编号以及当前需构造
双切换系统(也叫切换马尔可夫跳跃系统)作为一类新型的混杂系统,由于同时存在确定性切换信号和随机切换信号,在实际工程中得到了大量应用。正系统是一类较为特殊的动态系统,由于其状态轨迹被严格约束在状态空间非负区域的结构特性,在实际工程领域也具有不可忽视的地位。本课题研究对象为双切换连续线性正系统,和一般双切换系统相比,这类系统既具有双切换系统的性质又具有正系统的性质,两者共同作用所诱导产生的复杂特性使得
β-Ga2O3是一种超宽禁带半导体材料,具有高击穿电压以及良好的巴利加优值,禁带宽度高达4.8eV。在大功率器件领域有良好的应用前景,且在紫外探测器和气体传感器领域也得到应用。目前国内外对于β-Ga2O3材料的研究主要集中在材料的制备、掺杂、刻蚀以及β-Ga2O3基光电探测器等领域。随着器件及工艺技术的进步,基于β-Ga2O3的集成电路将成为发展趋势,电阻、电容等无源元件是集成电路中必不可少的关键