中文矛盾语块数据集构建和边界识别研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:cn1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本矛盾是自然语言理解的一项基础性问题。目前的研究大多针对矛盾识别任务,而深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集。该文在前人矛盾研究基础上,提出矛盾语块的概念,将其划分为7种类型,并根据标注规范构建了包含16 224条数据的中文矛盾语块(CCB)数据集。基于此数据集,利用序列标注及抽取式阅读理解类模型开展矛盾语块边界识别实验,以检验模型对矛盾内部语义信息的理解能力,结果显示阅读理解类模型在该任务上的性能优于序列标注模型。该文通过三个角度对影响语块边界识别的因素进行分析,为文本矛
其他文献
GPS技术已深入到人们生活各个层面,在工程测绘中更是起到重要的作用。文章通过对GPS技术重要性的阐述,全面分析了工程测绘中GPS的应用。
建立河流健康评价指标体系、分级标准及回归支持向量机( SVR )河流健康评价模型,并以云南省文山州清水河健康评价为例进行研究。首先,利用层次分析法( AHP )从水文水资源、物理结构
利用TM(ETM)数据与准实时地面采样数据,建立太湖叶绿素浓度反演模型。结果表明,TM3/(TM1+TM4)与叶绿素A浓度的相关性最好,并以此建立了太湖叶绿素A浓度线性反演模型,但反演精度并不高,因此,建立了一个两层BP神经网络模型反演太湖的叶绿素A浓度,结果表明,神经网络模型的反演精度远高于线性反演模型,16个测试样本表明,神经网络模型反演的相对误差小于30%的有15个点,占总测试样本93.75
天津地区不同环境功能区表层土中均检出萘、苊、苊烯、联苯、菲、惹烯、芴、二苯并呋喃、二苯并噻吩、荧蒽、芘、屈、苯并芴、苯并蒽、苯并荧蒽、苯并芘、苝、二苯并[a,h]蒽
文章以新余市高职院校为例,研究地方高职院校服务本地企业经济发展的主要途径,以及分析各种途径产生的经济效果.文章先从新余市高职院校基本情况出发,站在新余高职院校、 本
从评价系统中的态度资源角度,研究米歇尔·奥巴马2014年访华期间在北京和成都演讲的身份建构,对于准确理解跨文化话语有着非常重要的意义。研究发现,在跨文化话语中建构
针对大山选矿厂磨矿产品粒度组成不合理的问题,进行了优化磨机球荷特性,提高磨矿产品粒度均匀性,增加中间可选粒级含量的实验室试验和工业化试验,工业试验结果表明,在优化磨
构建大规模的知识库是人工智能、自然语言理解等领域的基础任务之一。症状作为描述病人的主观感受和诊断疾病的重要依据,更是优化智能导诊、医学问答等任务的重要因素。该文
试验研究表明,康家湾矿硫精矿提质采用锌硫混合浮选—精选—锌硫分离工艺,可将硫精矿品位从36%提高到45%以上,同时精矿中金、铁品位也相应得到提高,提升了硫精矿的附加值。该
基于2000~2018年相关数据,透彻剖析中国能源结构与产业结构发展现状及其演变过程;利用灰色关联分析法,构建中国能源结构与产业结构灰色关联分析模型,探究中国能源结构与产业