序列标注相关论文
[目的 /意义]针对历史古籍事件识别问题,对比序列标注方法和文本生成方法,探究两种方法在古汉语上的表现,构建模型实现历史古籍事件识......
命名实体识别是进行文本处理的基础技术手段,深度学习因其强大的学习能力能够挖掘更深层次的文本特征而深受命名实体识别领域研究......
人在阅读过程中的眼球运动具有一定规律,阅读眼动模型有助于人们更好地理解和认知这些规律。针对现有阅读眼动模型建模方法复杂的问......
隐喻识别是自然语言处理中的语义理解的重要任务之一,目标为识别某一概念在使用时是否借用了另其他概念的属性和特点.由于单纯的神经......
随着从经济全球化到文化全球化的发展,人们希望可以随时随地获取世界各地的信息以促进生产生活。在全球化交流中,文字是人类记录和......
随着科技的进步和时代的发展,电子文档逐渐替代纸质文档成为汉字的重要存储方式。文字的录入方式也随着存储介质的变化,从传统的手......
因果关系抽取是自然语言处理的一个重要研究方向,现有研究将因果关系抽取转化为关系分类或序列标注任务。文本中的因果关系有丰富......
事件抽取是当前自然语言处理领域的研究热点和难点,目的是从大规模、无结构化的自然语言文本中提取反映客观事实的重要事件信息,在......
随着科技的发展,学者的数量也迅速增长,由于学者之间交流频繁,而且学者个人信息在许多领域都有应用,因此如何准确快速地获取学者信......
专业领域资源命名实体识别和关系抽取是对资源描述有关的自由文本进行信息抽取的重要方式,基于实体和关系可以构建出资源库和资源......
方面级情感分析任务的目标是挖掘和分析用户对评论文本中提及的方面词上的情感,但是现有模型通常采用预训练词向量结合神经网络模......
科技的发展和大量学术活动的展开催生了对学术服务的需求。学者画像作为最重要的基础应用之一,旨在建立学者多维度标签模型,为专家......
在互联网技术蓬勃发展的大环境下,电商平台的不断完善,推动着选择网上购买服装的群体数量逐年增加,同时也产生了大批量的服装评论......
简历大多以非结构化文本的形式存在,且数量众多。从此类简历文本中准确提取结构化信息,具有广泛的用途,可以为信息检索、关联分析......
心音信号和心电信号作为常见的医疗时序数据,具有易采集、价格低廉、无创无损及重复性好等特点,在医学临床中被广泛应用于疾病预防......
随着人工智能的发展,智能的信息服务持续升级,在各种智能信息服务领域均能看到知识图谱的应用,如智能问答、个性化推送、信息检索......
基于句子级别的抽取方法不足以解决中文事件元素分散问题.针对该问题,提出基于上下文融合的文档级事件抽取方法.首先将文档分割为......
现有的BERT模型大多关注初始层到中间层的语法信息,而更高层的语义信息往往被忽略.由于判断句子情感是需要语义的,本研究在BERT模......
随着互联网技术的发展与大数据时代的到来,文本数据的规模正在呈爆炸式增长。新闻文本数据中通常蕴含着丰富的高价值信息,然而用户......
二十一世纪是信息技术时代,同时也是生物技术时代,生物信息学正是二者的有效结合,它利用计算机科学技术解决生物学中的各种问题。随着......
信息抽取是指从海量的文档集合中抽取需要信息的自然语言处理技术,是自然语言处理领域中非常重要的子领域,是近十几年发展起来的新领......
随着用户越来越倾向于输入自然语言作为查询,问句理解成为了问答系统等领域中的研究重点之一。然而现有问答系统技术对复合事实型......
句法分析一直是自然语言处理任务中的重要课题,它的主要目标是根据语言学知识制定的语法规则或者基于统计知识建立的模型,自动建立......
医患纠纷类裁判文书作为宝贵的素材对解决医患矛盾有着重要借鉴作用,如能准确地将类似案例推荐给用户做参考,可以有效提升医患双方......
随着网络从信息单向的提供者转向为多元化的平台,越来越多的用户从单纯的网络信息的阅读者转变为网络信息的创造者和参与者。用户......
音频事件检测技术是音频内容分析与处理最主要的任务之一,目标是判断音频段中所发生的事件种类并标注音频事件的起止时间,其算法性......
随着近年来互联网的发展,社交网络已成为实时信息的重要来源。根据中国互联网络信息中心发布的第45次《中国互联网络发展状况统计......
产科电子病历作为医生全面了解孕妇和胎儿情况的主要渠道,对于提高人口的生育健康水平有着重要意义。结构化处理方案是一种对电子......
随着文本数据的不断增加,越来越需要使用自然语言处理技术来处理文本信息。多数中文自然语言处理任务要先进行分词才能进行下一步......
面向汽车的产品评论是指用户在微博、论坛、微信公众号等平台发表自己对汽车的价格、性能、动力、外观等方面的主观使用感受。在汽......
变异与部分复杂疾病紧密相关,是疾病和药物发现研究中的重要研究对象。如今,随着生物医学文献数量的快速增长,变异信息抽取技术也......
分词是中国语言处理的一项基本任务。词是“最小的能独立运用的语言单位”。中文与英文有所不同,在英文中词与词之间用空格天然分......
随着互联网的飞速发展,网络上的文本数据量激增,同时也导致了文本质量下降,传统的人工校对早已无法完成如此巨量的工作,文本自动校......
中文语义分析是使计算机理解汉语句子并实现人机中文对话的非常重要的一步,它能将中文句子转化为机器可以理解的一种表达方式。依......
命名实体识别(Named entity recognition,NER)任务旨在从非结构化的文本数据中定位并分类出预定义的实体类型(如人名、地名和组织......
知识图谱使互联网上海量杂乱的信息得以有效的组织和利用。在线百科中蕴含的大量知识以及结构化与半结构化内容使其成为知识图谱构......
随着社交网络的兴起,越来越多的人们开始利用诸如新浪微博等社交平台开始发表自己对于各种话题的讨论与观点,因此而产生了大量带有......
自然语言中否定是一种广泛存在且复杂的语言现象,其往往会反转文本表述中命题的真值、观点的立场、情感和态度的极性。对否定信息进......
黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大.现有的乌兹别克语词干提取任务仍依赖基于......
由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用......
基于序列标注方法大部分都是针对一些垂直领域,这些领域通常含有丰富语料。然而,当测试语料从含有大量标注语料的领域迁移到其他缺......
针对军事文本实体关系抽取过程中存在的“一句对应多个三元组”,“一个主语对应多个客体”等问题提出一种基于ERNIE的军事文本三元......
为了提高实体关系联合抽取的效果,提出一种端到端的联合抽取模型(HSL)。HSL模型采取一种新的标记方案,将实体和关系的联合抽取转化......
摘要:互联网的迅速发展带来了网络中评论数据的大量增长,分析这些非结构化的文本数据的潜在价值对于整车企业在生产、营销、售后等环......
冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。针对传统的基于规则和机器学习的方法,只考虑名词短......
该文提出了一种全新的分层式依存句法分析方法。该方法以依存深度不大于1的依存层作为分析单位,自底向上构建句子的依存结构。在层......
情绪原因识别是情绪分析中的一个重要研究任务。该任务旨在自动分析出导致某一情绪发生的原因描述。该文将情绪原因识别任务建模为......