中文矛盾语块数据集构建和边界识别研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：cn1976

【摘要】

：

文本矛盾是自然语言理解的一项基础性问题。目前的研究大多针对矛盾识别任务,而深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集。该文在前人矛盾研究基

【作者】

：

李博涵姜姗刘畅于东

【机构】

：

北京语言大学信息科学学院

【出处】

：

中文信息学报

【发表日期】

：

2020年3期

【关键词】

：

自然语言理解文本矛盾矛盾语块 natural language understandingtext contradictioncontradictory b

【基金项目】

：

教育部人文社会科学研究青年基金(19YJCZH230),国家社会科学基金(16AYY007),北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)(19YCX116)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本矛盾是自然语言理解的一项基础性问题。目前的研究大多针对矛盾识别任务,而深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集。该文在前人矛盾研究基础上,提出矛盾语块的概念,将其划分为7种类型,并根据标注规范构建了包含16 224条数据的中文矛盾语块(CCB)数据集。基于此数据集,利用序列标注及抽取式阅读理解类模型开展矛盾语块边界识别实验,以检验模型对矛盾内部语义信息的理解能力,结果显示阅读理解类模型在该任务上的性能优于序列标注模型。该文通过三个角度对影响语块边界识别的因素进行分析,为文本矛

其他文献

刍议工程测绘中的GPS测绘技术

GPS技术已深入到人们生活各个层面,在工程测绘中更是起到重要的作用。文章通过对GPS技术重要性的阐述,全面分析了工程测绘中GPS的应用。

期刊

工程测绘GPS测量技术特点

河流健康评价的回归支持向量机模型及应用

建立河流健康评价指标体系、分级标准及回归支持向量机（ SVR ）河流健康评价模型，并以云南省文山州清水河健康评价为例进行研究。首先，利用层次分析法（ AHP ）从水文水资源、物理结构

期刊

河流健康指标体系分级标准回归支持向量机综合评价云南省river healthindex systemgrading standardssupport

基于TM数据的太湖叶绿素A浓度定量反演

利用TM(ETM)数据与准实时地面采样数据,建立太湖叶绿素浓度反演模型。结果表明,TM3/(TM1+TM4)与叶绿素A浓度的相关性最好,并以此建立了太湖叶绿素A浓度线性反演模型,但反演精度并不高,因此,建立了一个两层BP神经网络模型反演太湖的叶绿素A浓度,结果表明,神经网络模型的反演精度远高于线性反演模型,16个测试样本表明,神经网络模型反演的相对误差小于30%的有15个点,占总测试样本93.75

期刊

太湖叶绿素A浓度遥感定量反演神经网络模型Taihu Lake Chlorophyll a remote sensingquantitative r

天津地区典型土壤剖面多环芳烃的垂向分布特征

天津地区不同环境功能区表层土中均检出萘、苊、苊烯、联苯、菲、惹烯、芴、二苯并呋喃、二苯并噻吩、荧蒽、芘、屈、苯并芴、苯并蒽、苯并荧蒽、苯并芘、苝、二苯并[a,h]蒽

期刊

土壤剖面多环芳烃污染物纵向分异天津soil profile polycyclic aromatic hydrocarbon compounds pol

地方高职院校服务本地企业经济发展途径及其效果研究——以新余市高职院校为例

文章以新余市高职院校为例,研究地方高职院校服务本地企业经济发展的主要途径,以及分析各种途径产生的经济效果.文章先从新余市高职院校基本情况出发,站在新余高职院校、本

期刊

新余高职院校服务途径企业经济

基于态度资源对米歇尔·奥巴马访华演讲中身份建构的分析

从评价系统中的态度资源角度,研究米歇尔·奥巴马2014年访华期间在北京和成都演讲的身份建构,对于准确理解跨文化话语有着非常重要的意义。研究发现,在跨文化话语中建构

期刊

态度资源米歇尔·奥巴马跨文化话语身份建构attitude resource Michelle Obama cross-cultural dis

优化大山选矿厂磨矿粒度组成提高铜浮选指标

针对大山选矿厂磨矿产品粒度组成不合理的问题,进行了优化磨机球荷特性,提高磨矿产品粒度均匀性,增加中间可选粒级含量的实验室试验和工业化试验,工业试验结果表明,在优化磨

期刊

粒度组成铜矿磨矿浮选size composition copper ore grinding floatation

中文症状知识库的建立与分析

构建大规模的知识库是人工智能、自然语言理解等领域的基础任务之一。症状作为描述病人的主观感受和诊断疾病的重要依据,更是优化智能导诊、医学问答等任务的重要因素。该文

期刊

中文症状知识库医学知识图谱知识标注Chinese symptom knowledge basemedical knowledge graphknowled

康家湾矿硫精矿提质试验

试验研究表明,康家湾矿硫精矿提质采用锌硫混合浮选—精选—锌硫分离工艺,可将硫精矿品位从36%提高到45%以上,同时精矿中金、铁品位也相应得到提高,提升了硫精矿的附加值。该

期刊

硫精矿提质工艺改造浮选sulphur concentrate quality technological renovation flotation

中国能源结构与产业结构发展现状及灰色关联关系研究

基于2000~2018年相关数据,透彻剖析中国能源结构与产业结构发展现状及其演变过程;利用灰色关联分析法,构建中国能源结构与产业结构灰色关联分析模型,探究中国能源结构与产业

期刊

能源结构产业结构灰色关联分析energy structurelndustrial structuregrey correlation analysis

中文矛盾语块数据集构建和边界识别研究

与本文相关的学术论文