基于最短依存路径和BERT的关系抽取算法研究

来源 :西南师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:orallove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习模型依靠文本单一的词特征、位置特征在文本关系抽取任务中取得了不错的效果.但以往研究未能充分理解句子语义,数据稀疏和噪声传播问题对分类模型的影响依旧存在.随着注意力机制和预训练语言模型的研究不断深入,BERT(bidirectional encoder representations from transformers)预训练模型为自然语言处理任务提供了更好的词句表示.因此,该文提出结合BERT预训练语言模型获得更具语义表现力的特征表示,同时使用依存句法分析提取出最短依存路径作为额外信息输入分类模型,降低了噪声词汇对分类模型的影响.该算法在中文人物关系抽取数据集和SemEval2010 Task 8语料集上进行对比实验,最终实验效果F值可达到0.865.
其他文献
2020年10月3日在太原市汾河公园内河西区域管道桥以北进行植被考察时,发现了蓼科(Polygonaceae)虎杖属(Reynoutria Houtt.)的虎杖(Reynoutria japonica Houtt.),此前在山西省境内均无分布记录.至此,虎杖的发现使山西蓼科植物增加为7属33种,2变种.
蛋白质酪氨酸磷酸酶1B(PTP1B)是2型糖尿病及肥胖症的主要靶点之一,PTP1B抑制剂可增加胰岛素敏感来降低血糖水平,可减轻肥胖脂类代谢紊乱.文章利用系统溶剂萃取法得到7种远志提取物;将表达人源PTP1B的大肠杆菌超声破碎,采用离子交换层析法纯化PTP1B,然后测定了7种远志提取物对人源重组的PTP1B的半数抑制浓度(IC50),并对这7种远志提取物分别进行UPLC-Q-Orbitrap HRMS分析.结果表明:远志氯仿提取物具有较好的PTP1B抑制活性(IC50为(1.213±0.3)μg/mL),氯
期刊
借助Clarke广义梯度以及凸泛函的相关性质,给出了一些新的广义凸函数:广义(C,α)-I型凸函数、广义严格拟(C,α)-I型凸函数以及广义严格拟伪(C,α)-I型凸函数.在新的广义凸性下,得到了一类多目标规划问题的若干最优性充分条件.
本研究基于癌症基因组图谱(TCGA)数据库中的子宫内膜癌基因表达数据集,通过基因差异表达分析共鉴别出1906个mRNA、753个lncRNA和56个miRNA在EC样本中的异常表达.然后对鉴别出的1906个差异表达的mRNA进行GO功能富集分析和KEGG通路分析.基于筛选出的差异基因,构建了一个包含66个mRNA、16个miRNA和66个lncRNA的内源竞争RNA(ceRNA)调控网络.在这个网络中,16个mRNA,5个lncRNA和1个miRNA的表达量与EC患者的总体生存率密切相关(P.value<
通过有机分子束沉积法和超高真空低温扫描隧道显微镜研究了非手性的萘酞菁(H2 Pc)在Cd(0001)表面的手性特征和生长机理.研究发现:在极低的覆盖度下,每个分子都沿Cd(0001)衬底的晶向排列.随着分子的聚集,分子的叶瓣和衬底的晶向不是一致的,存在大约8°的偏差.在0.8 ML(定义1 ML为在第2层出现之前能够完全覆盖整个衬底表面的H2 Pc覆盖度)时,由于与衬底的不对称电荷转移,M型分子(定义M型分子叶瓣与衬底晶向成8°夹角)表现出明显的手性特征.随着覆盖率的进一步提高,H2 Pc分子的亚单层分子