基于BERT的因果关系抽取

来源 :吉林大学学报(理学版) | 被引量 : 0次 | 上传用户:zhangshun102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统关系抽取模型依赖特征工程等机器学习方法,存在准确率较低且规则较繁琐等问题,提出一种BERT+BiLSTM+CRF方法.首先使用BERT(bidirectional encoder representations from transformers)对语料进行预训练;然后利用BERT根据上下文特征动态生成词向量的特点,将生成的词向量通过双向长短期记忆网络(BiLSTM)编码;最后输入到条件随机场(CRF)层完成对因果关系的抽取.实验结果表明,该模型在SemEval-CE数据集上准确率比BiLSTM+CRF+self-ATT模型提高了0.0541,从而提高了深度学习方法在因果关系抽取任务中的性能.
其他文献
为有效满足h自适应的网格重划分要求,提出通过前沿推进法和Delaunay算法对四面体网格进行局部重划分.首先,在重划分过程中,采用由线到面、由面到体的顺序保证整体网格的协调性;其次,通过局部尺寸函数保证网格尺寸平滑过渡;最后,用投影法使网格满足几何保形.仿真实验结果表明,该算法适用于包含多部件的复杂计算机辅助设计(CAD)模型,在h自适应加密过程中网格更贴近真实几何形态,且重划分后可保证网格单元的质量.
针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题,提出一种高效阴阳k-means聚类算法.该算法根据数据相似性将原始数据进行逐层分解,并建立满m叉树结构存储各层数据,以树结构各叶子节点中存储的数据信息建立加权数据,运行加权阴阳k-means算法得到收敛中心.在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值.在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验,实验结果表明,该算法具有较高的加速比,且求解精度
针对目前采用油温控制的方法油船货油无法真正反映油品运动特性的问题,搭建油船货油加热模拟实验台,运用货油粘度随温度变化的拟合公式,实现测取温度对粘度的实时转换,并以此提出货油加热控制策略.结果表明:货油粘度在初始加热阶段的下降幅度较大,加热中期变化平缓,后期经短暂波动后再缓慢下降,采用高负荷加热方式可降低加热能耗;依据加热过程粘度变化趋势及耗能可以控制货油加热量.
为实现同时利用属性信息和结构信息完成更精确的协同聚类,提出一种基于属性异构信息网络的半监督协同聚类框架(SCCAIN).首先,设计一种可学习的整体关联度量,其通过元路径和属性投影整合结构关联和属性关联;其次,将约束负矩阵三因式分解引入到具有约束的协同聚类节点中,将相关性度量和协同聚类相结合,以协同聚类结果作为共享因子,并提出一个统一的半监督学习框架,以联合优化协同聚类和相关性测量给定的约束;最后,在不同的数据集上进行仿真实验,实验结果表明,该方法聚类效果较好,从而验证了属性信息和结构信息对能提升协同聚类效
针对在人脸图像高维数据降维时单纯使用主成分分析(PCA)算法的提取精度和速度受限问题,提出一种基于小波变换和改进PCA的混合特征提取算法.该方法首先对人脸图像进行小波分解,选取低频分量对人脸图像进行特征提取;然后利用改进的PCA算法进行主成分提取,获得代表人脸特征的特征向量;最后将该算法应用于Olivetti Faces人脸库数据集的图像分类.实验结果表明,经过该混合算法处理后的图像特征数据,由卷
针对正常和异常声音可能具有较大的相似性,有时无法利用自编码器重构误差大小区分的问题,提出一种生成对抗单分类网络方法进行异常声音检测,通过多次训练,该方法学习正常样本的分布特征.在测试过程中,测试正常样本能以极小的误差进行重构,而异常样本重构效果较差,在某些频率段会发生畸变,从而给出判别分类结果.实验采用UrbanSound8K公开数据集和实测电机声音数据集进行了测试,获得该方法的准确率分别为86.3%和98.1%,比卷积自动编码器等主要深度学习方法分别提高了5.0%和3.0%.
针对电力推进船舶逆变器存在的开关器件开路故障诊断问题,提出一种基于三分类支持向量机的故障诊断方法.利用对称分量分析方法获得逆变器输出正序瞬时值分量,通过对信号进行小波包分解,得到不同开关元件故障下的小波能量,规范化后作为对应开关器件故障特征.根据开关器件位置和逆变器输出波形特点对开关器件进行分组,利用三分类支持向量机实现故障分类.仿真分析结果表明,该三分类支持向量机故障分类正确率94.29%,诊断方法有效.
针对当前卷积神经网络未能充分利用浅层特征信息,并难以捕获各特征通道间的依赖关系、丢失高频信息的问题,提出一种新的生成对抗网络用于图像超分辨率重建.首先,在生成器中引入WDSR-B残差块充分提取浅层特征信息;其次,将GCNet模块和像素注意力机制相结合加入到生成器和鉴别器中,学习各特征通道的重要程度和高频信息;最后,采用谱归一化代替不利于图像超分辨率的批规范化,减少计算开销,稳定训练.实验结果表明,
研究三维分数阶混沌系统的自适应滑模同步,给出滑模函数的设计和控制器的构造,得到三维分数阶不确定混沌系统的自适应滑模同步的充分条件,将分数阶的相关结论推广到整数阶情形,并用MATLAB验证结论的正确性.
第四次工业革命是数字化、网络化和智能化的深度融合.在此背景下,科技与经济间的深度融合成为创新力的重要决定因素.对于不同的经济体,筛选不同分位数水平以及复合分位数水平下影响创新力的关键因素,并分析这些因素的影响程度,对于发现创新力发展优势和短板,具有一定意义.本文以分位数回归和复合分位数回归为基础模型,构建科技经济融合创新力模型,以从科技经济视角,研究不同分位数水平以及复合分位数水平下创新力的重要影响因素,以期为政府及相关部门提供决策参考.研究表明,经济状况方面的因素对创新力影响最大;科学基础中的知识转移是