【摘 要】
:
随着大数据时代的到来,海量的信息以半结构或者原始文本的形式存在于网络中,如何将其中的信息以结构化的形式储存是当前亟待解决的问题。知识图谱作为结构化的语义网络被广泛
论文部分内容阅读
随着大数据时代的到来,海量的信息以半结构或者原始文本的形式存在于网络中,如何将其中的信息以结构化的形式储存是当前亟待解决的问题。知识图谱作为结构化的语义网络被广泛用于自然语言处理中,关系抽取可用于文本中实体对之间语义关系的识别,在文本的语义理解和知识图谱的构建及完善中发挥着重要作用。基于神经网络的关系抽取方法是当前关系抽取的主流方法之一,它可降低传统自然语言处理中特征工程的复杂性,减少错误传播,在实际应用中取得了较强的效果与泛化性。结合词分布的向量表示和深度残差网络,本文开展了关系抽取方法的研究工作,本文的主要工作如下:1.提出了一种融合词语义信息与词位置信息的词分布模型。首先,结合二维高斯分布拟合单词的位置集合,用于文本的相似度计算,在此基础上,给出了融合词语义信息与词位置信息的词分布模型;其次,通过计算各个类簇间的高频词与类簇间的相似度,提出了句子级的词分布向量表示方法;最后,通过计算单词与各个类簇间的相似度,并结合关系文本聚类,提出了单词级的词分布向量表示方法。实验结果表明:在远程监督数据Wiki和NYT上,本文提出的结合词分布模型的单词级向量方法比文献中的方法具有更好的效果。2.提出了一种基于深度残差网络的关系抽取方法。首先,结合多尺度骨干架构(Res2Net),在深度网络的残差单元结构中使用分层层叠的特征组(Scale),取代了通用卷积层,扩充每个网络层的感受野范围,实现了不同粒度级别的多尺度特征表示;其次,融合挤压激励模块(Squeeze-and-Excitation Networks),在残差网络中通过机器学习的方式自主获取各个特征通道的重要程度;最后,结合句子级的注意力机制(Attention),在远程监督的数据集上减弱噪声影响,提高了关系抽取效果。实验结果表明:在NYT数据集上,相比文献中的方法PCNN+ATT、CNN+RL等方法,本文提出的方法取得了较好的效果,提高了远程监督关系抽取的Top-K准确率。
其他文献
信息获取80%的来源是眼睛,而双目立体视觉技术研究是模拟视觉系统来获取真实世界信息的系统,是计算机视觉中一个研究热点。立体匹配有广泛的应用领域,如目标检测,无人飞行器,
随着物联网、云计算与大数据技术的不断发展,数据中心的规模不断扩大,其能源消耗也变得越来越大,数据中心网络节能已经成为了重要的研究领域。传统数据中心网络状况复杂、难
肿瘤,尤其是恶性肿瘤,作为全球最大的公共卫生问题之一,已极大地危害人类的身体健康。细胞外基质(ECM)作为肿瘤微环境的重要组分,在肿瘤发生发展的各个阶段发挥着相应的作用,
车载热成像行人检测是计算机视觉领域的一个研究热点,为高级辅助驾驶提供了重要的技术支持。热成像不受光照影响,但是分辨率、对比度和信噪比较低,车载热成像行人检测稳定检
目的:研究REG4在胃癌腹膜转移中的作用和机制,并发现一个由REG4触发的正反馈调控环路。方法:以免疫组织化学方法(IHC)检测胃癌标本中REG4的表达情况。采用REG4过表达胃癌细胞
随着国内马铃薯收获机械化水平的不断提升,在借鉴了国内外先进技术的基础上,结合国内马铃薯收获地形差别较大的实际情况,设计了一款能够适应多种收获地形的仿形挖掘结构—摇摆结构。根据目前国内马铃薯联合收获机挖掘装置存在无法实现垄上压力调节的问题,提出了垄上减压系统的设计方案。通过研究马铃薯整茎物理机械特性、马铃薯块茎生长分布以及土壤物理机械特性等,为马铃薯联合收获机关键部件设计提供理论依据。本文主要研究内
随着时代的进步,互联网应用越来越融入到人民的日常生活中,伴随着网络视频、音频以及数字通信技术在通信传输速度的要求也越来越高。而无线通信系统技术同样的发生翻天覆地的
泛素-蛋白酶体系统(ubiquitin-proteasome system,UPS)是体内水解细胞周期调控蛋白的重要通路,它的异常会引起多种疾病的发生,如:肿瘤、阿尔茨海默症等,因此,UPS已经成为重要的抗肿瘤通路,其中蛋白酶体是这一通路中重要的药物设计靶点。目前针对蛋白酶体的抑制剂种类较多,可分为肽及非肽两大类。肽类抑制剂中硼酸类药物硼替佐米(Bortezomib)以及环氧酮类药物卡非佐米(Ca
背景与目的:胰腺癌是消化道常见的恶性肿瘤之一,在世界上癌症的发病率与死亡率都位列于第七位。尽管近些年来对于胰腺癌的诊断、治疗技术不断进步,但由于胰腺癌起病隐秘、恶
随着统计机器学习和深度学习技术在人工智能领域中的不断发展和应用,生物识别也逐渐成为人工智能领域中的重要研究对象之一.声纹识别是生物识别中身份验证的一种,是指通过对