基于矩阵分解的无监督实体关系提取方法研究

来源 :武汉大学 | 被引量 : 4次 | 上传用户:qqqq920644875
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取是信息抽取中的重要子任务。传统有监督及半监督模型要求已有标注数据或知识库,无法在无先验知识的领域直接应用。无监督实体关系提取方法则将任务建模为聚类问题,能够只使用语料库自身信息进行实体关系抽取。然而已有方法受限于实体对文本共现矩阵的高维稀疏特性,表现有限且模型较为复杂。虽然在模型中引入了文本信息,但使用的人工构建特征集生成的离散特征向量同样高维稀疏,进一步增加了模型的复杂度,降低了引入信息对于模型的提升效果。因此,本文基于矩阵分解构建无监督实体关系提取模型,旨在降低模型复杂度并引入新的文本语义信息,从而提高模型的训练效率、可扩展性以及表现效果。本文工作主要分为以下三个部分:首先,本文提出了一个基于负采样的共现矩阵分解模型。模型使用表示学习方法学习实体对在关系空间中的表达,从而能够利用负采样方法降低模型学习的复杂度,更充分的利用高维稀疏共现矩阵的有限信息。其次,本文提出了一个深度语义强化的层次矩阵分解模型。模型使用层次矩阵分解模型降低文本语义信息引入后增加的模型复杂度,并使用深度语义嵌入编码文本语义信息,从而避免了人工构建特征集的高维稀疏特性与额外噪音。最后,本文融合了上述两个模型,并使用深度学习方法构建模型结构,提出了NURE-DSE神经网络实体关系抽取模型。模型结合了上述两个模型的优点,并使用反向传播算法自动推断模型参数,从而避免了复杂的数学推导。该模型复杂度低而结构简单,能够适应更大规模的语料库,从而具备更加广阔的应用与扩展空间。在NYT10实体关系提取数据集上的实验结果表明,本文提出的基于深度语义强化的神经网络实体关系提取模型在实体关系提取的表现上超过了已有方法,能够有效的学习到实体对在关系空间中的表达。
其他文献
青春,一个美好的字眼,象征着年轻和美丽,但是不管您的性别、职业,从青春期开始,小痘痘是否一直困拢着您?它不是一个大问题,但它会在您生命中的关键时期冒出来,令您不胜烦恼。
蛋清品质是除蛋壳和蛋黄外,消费者、贸易者评价鸡蛋品质的重要指标;因蛋鸡生理的特殊性,蛋清品质与饲粮蛋白的质和量关系密切,本研究以标准回肠可消化氨基酸模式为前提,在平衡赖氨酸、蛋氨酸、色氨酸、苏氨酸、异亮氨酸、缬氨酸和精氨酸的基础上,在玉米-脱酚棉籽蛋白型蛋鸡饲粮中补充亮氨酸(Leu)和丝氨酸(Ser),观察其对产蛋高峰期鸡蛋蛋清品质的影响及其机理,旨在为拓宽饲料蛋白资源、合理利用棉籽蛋白、降低蛋鸡
设计了一种用于电荷域流水线ADC的高速电荷比较器电路,该比较器包括电荷采样电路、共模不敏感开关电容网络和锁存放大器。仿真结果表明,在0.18μm CMOS工艺条件下,该比较器在
当人们在各地的书刊市场上初次见到2020年《中国土族》春季号期刊公开发行时,正值我国对新冠肺炎疫情的防控阻击取得阶段性胜利的重要时刻。该刊一经出现,封面上高原土乡的人
光传送网(OTN)是未来全光网络的重要发展趋势之一,随着数据流量急增,直接在光层完成大颗粒业务的交叉已势在必行。光交叉连接器(OXC)是传送网向全光网发展的基础技术之一,而
当前,围绕物业管理的纠纷迅速增长,业主的消费权益及参与意识的觉醒,要求明明白白消费,要求物业管理质价相符,物有所值。但是,广大业主对物业管理不了解,不清楚物业管理应该做什么事
2016年11月4—6日,“2016湖南·梅山文化”学术研讨会在湖南人文科技学院举行。会议以“梅山文化与区域发展”为主题,由湖南省哲学社会科学重点研究基地区域文化研究基地发
本文采用基于猪八戒网的案例研究方法,从创业企业的生命周期、专业领域和地域分布三个维度挖掘创业企业的创新创业服务需求,并运用生命周期理论、资源观理论和开放式创新理论
近来,订单农业悄然兴起,给农业生产注入了新的活力。过去,农产品好销,是“皇帝的女儿不愁嫁”,农民的市场意识也十分淡薄。如今不同了,只有市场需要,产品才会好销。这对习惯于过去的
分析了快速开关型限流器的运行原理和特性,以及其相对于传统限流电抗器的优缺点。给出了快速开关型限流器的设计方法和流程,并通过工程设计实例进行了详细说明。将限流器的设