建议句识别和建议信息抽取研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:gg499586617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建议是自然语言处理中广泛存在的一种复杂语言现象,其中往往蕴含着丰富有用的信息。在文本中对建议进行挖掘,将其自动识别并抽取关键信息,极大提高了所获信息的价值。目前建议挖掘在工业环境中有助于公司产品或服务提升的决策以及用户产品或服务体验的参考,在自然语言处理领域已经成为一个新的研究热点。总体而言,建议挖掘对工业界和学术界都具有重要意义。目前,建议挖掘由于语料的限制仍是探索程度较低的领域。相关研究中,通常将其定义为建议句识别任务。鉴于建议语料还有更细粒度的信息待挖掘,本文首次提出把建议挖掘分成二阶段任务。第一阶段为文本中建议句识别的原有任务(句子分类),第二阶段为建议信息抽取的拓展任务(序列标注)。主要研究内容包括以下两方面:(1)提出了基于BERT的双向长短期记忆网络和胶囊网络结合注意力机制的混合模型对英文语料进行建议句识别。该模型能够克服卷积神经网络无法提取短语语义、位置等深层信息的缺点和双向长短期记忆网络长距离依赖的缺点,融入目标语料预训练的BERT表征更强大的词嵌入。实验表明:在第十三届国际语义评测语料上,基于该模型的建议句识别结果具有较大的提升,且在跨领域文本间具有一定泛化能力。(2)鉴于第二阶段任务语料的缺失,本文自主标注新语料。提出了基于BERT和卷积神经网络双嵌入的双向长短期记忆网络结合混合半马尔可夫条件随机场模型对标注英文语料进行建议信息抽取。该模型能够克服条件随机场严重依赖人工提取特征的缺点,融入上下文和字符级特征的双嵌入,能有效地利用过去和未来的输入特征以及句子级别的标记信息。实验表明:在标注英文语料上,基于该模型的建议信息抽取任务获得了较好的实验结果。
其他文献
传统5CrNiMo或H13材料锻模在模锻难变形材料时,由于成形温度高,变形抗力大,模具型腔出现了严重变形、磨损和开裂等现象,导致模具寿命极低。因此,本课题组提出了一种大型铸钢基体“拳头”式锻模制造新方法:即以铸钢作为锻模基体;再通过增材制造技术在基体上堆焊第一层焊材JX01为强度硬度过渡层Ⅰ,第二层焊材JX02为高强度高硬度强化过渡层Ⅱ(HRC50左右),其中基体、过渡层Ⅰ和过渡层Ⅱ组合一起成为“
磁粒子成像(Magnetic Particle Imaging,MPI)是一种新兴的基于示踪剂的层析成像技术,它在小动物成像中显示出高空间分辨率和高灵敏度。该技术是利用超顺磁性氧化铁(Superparamagnetic iron oxide,SPIO)构成的磁性纳米粒子(Magnetic nanoparticles,MNPs)对时变激励磁场的非线性磁化响应,并对它们的空间分布成像来进行医学诊断,血
水力压裂作为一种常规、高效的岩体改造手段,在页岩气开采过程中能显著增加页岩的渗透率,进而提高页岩气的开采效率。但是由于页岩典型的层理结构所导致的各向异性,使得水力裂缝穿越层理的过程变得复杂多样,这对实际水力压裂施工控制提出巨大挑战;同时,地应力和注射速率也会影响水力裂缝的扩展以及压裂效果。因此,研究各向异性页岩在不同注射速率以及地应力状态下的水力裂缝扩展机制和压裂效果具有重要的现实意义。本文依托贵
随着无线通信技术的不断发展,频谱资源越来越匮乏。为解决该问题各种调制技术层出不穷,但是这些调制技术都没有脱离幅度、相位和频率这三个维度。为了从根本上解决频谱资源的问题,有学者提出了极化调制技术。极化调制利用电磁波的极化特性承载信息,将三维星座空间作为调制星座图,展现出无限的潜能。然而无线通信中的极化调制技术发展时间短,还有许多问题尚未解决。现有的调制架构使用正交双极化天线收发信号,当信号以任意角度
面对大量消耗化石燃料所带来的能源短缺和严峻的环境挑战,具有节能、环保优势的综合能源系统受到广泛关注。如何通过优化,使多种能源互补的综合能源系统的投资运行效益最大化,是综合能源研究热点之一。本文以含储能的并网型综合能源系统为研究对象,围绕综合能源系统的优化调度策略与规划方法展开研究。主要包括:(1)针对综合能源系统优化调度这种高维非线性优化问题,已有算法会遇到局部搜索能力受限的问题,通过引入爆炸半径
无线能量(功率)传输最早由尼古拉·特斯拉(Nikola Tesla)提出,是指能量以无线的方式从能量源传输到电负载的过程。目前,无线能量(功率)传输已被国际公认为能源传输领域一项最具前沿性和革命性的技术,将颠覆传统的有线(导线)输电模式。而基于微波或激光的远距离无线能量传输技术,可直接应用于救灾应急、特殊地域、移动装备及军用卫星、空间武器的无线供电。因此,论文以无人机激光传能项目为背景,开展高效率
印制电路板(Printed Circuit Board,PCB)是电子产品中连接所有元器件的载体,是保障电子信号处理和传输的关键部件。随着信息化技术和产业的迅速发展,社会对电子产品的功能和品质要求日益提高、电子产品的应用领域不断扩增,促使印制电路板(PCB)的品质和性能必须不断提高。而PCB的品质和性能取决于精细线路制作工艺,因此本课题将研究重心放在高品质精细线路的制作工艺研究上。基于减成法存在严
随着工业化的不断发展,我国每年因为金属材料的腐蚀造成的经济损失也是不可估量的。因此,开发新型高效、绿色环保、低毒等特点的有机缓蚀剂也成为近年来腐蚀领域研究的主要方向之一。本论文设计并合成了一系列含有单、双咪唑环的有机离子液体缓蚀剂C1-C6。目标化合物在硫酸介质中具有很好的溶解性,同时其结构中的氮杂环能够与金属铜表面形成的离子络合成键,从而在铜表面形成一层有机保护膜,隔绝金属与硫酸腐蚀介质的直接接
现有的机器人精密减速器主要有谐波减速器、RV减速器、Spinea减速器等,这些高精度减速器大部分被国外厂商垄断,国内厂商虽然能生产相同类型的减速器,但各项指标与国外产品还存在一定的差距。为开发出具有完全自主知识产权的高精度减速器,需要对精密减速器进行更加深入的研究。本文以NN型少齿差减速器为研究对象,通过结构设计、齿廓设计,再结合变形协调设计的理论基础,设计了新型刚柔复合少齿差减速器,并使用有限元
随着科学和社会的发展,光纤传感器在人们生活中的应用范围越来越普遍。光纤马赫-曾德干涉仪(MZI)是一种功能型光纤传感器,具有结构简单、机械性能稳定、测量精度高的优点,在现代传感领域发挥着重要作用。光信号在经过两个1x2耦合器后发生干涉,待测量信号会使干涉信号产生相位的变化。将光信号转换为易于观察测量的电信号之后,通过对电信号的检测、放大、调制之后进入鉴相器比较出二者的相位差,从而反推出待测信号的大