词向量-量子启发下嵌入情感信息的复数表示

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhaoxiufen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于大型语料库,通过利用上下文信息训练得到的词向量已经被广泛应用于众多自然语言处理任务中,但在展现语义关系时往往表现较差。我们认为传统的实值词嵌入方法泛化能力不佳是因为语言模型的基本假设只包含了语言的分布特征,继而错误的将语用作为语义来表示单词。由于语言特征的多样性和复杂性,导致传统的实数词向量很难对复杂的语义关系进行建模,例如突现语义“ivory tower”、歧义现象(“spring”可指代春天,也可指代泉水)、极性问题(“love”和“hate”两个词由于用法相近使得词向量相似度很高)。受量子理论的启发,我们通过将词向量扩展并嵌入到复数空间进而丰富单词的语义特征,并尝试对上述问题提供合理的建模和解释。本文重点关注了极性问题,我们提出了一种将情感信息编码嵌入到情感词的方法,以情感词典为监督知识,通过引入注意机制和联合学习帮助学习情感词的CR。复数向量可简单分解为幅度和相位两个部分,我们使用幅度部分表示语言的分布信息,使用相位部分表示语言的极性信息。为训练复数词向量,我们提出了一个词典扩充下的量子概率语言模型,分别在三个流行的SA数据集(MR,SST-1,SST-2)进行了大量对比实验。实验结果表明,该方法可以有效的统一建模语言的分布信息和极性信息,从而增强词向量的表示能力和泛化能力。
其他文献
背景:髓内钉置入内固定是治疗股骨干骨折的经典方案,其远端瞄准架被广泛应用于远端锁钉的置入,提高了远端锁钉置入的准确率,但其失败率仍然不容忽视。研究出一种可实现远端锁钉快速且精准锁钉的新技术,减少徒手锁钉时的X射线放射性损伤,是当务之急。目的:比较占位压杆技术和徒手锁钉技术在股骨髓内钉远端锁钉置入中的效果。方法:建立发生压杆偏移不能准确置入远端锁钉的股骨模型骨8个,分2组处理:占位压杆组(n=4)采
期刊
一条完整的漏洞描述应当具备六种关键信息:漏洞类型、根本原因、受影响的产品、影响、攻击者类型和攻击载体。这种漏洞信息的组合方式可以方便软件维护人员有效地管理,缓解和预防日益增多的软件漏洞。然而,在通用漏洞数据库(CVE)中存在着较为严重的关键信息缺失问题。关键信息的缺失会导致研究人员无法准确的分析漏洞的状态和特征,致使许多基于漏洞报告进行的研究在结果上产生较大的误差。尽管现有的漏洞报告正在随着漏洞分
学位
知识问答方法允许用户以输入自然语言问句的方式访问知识库中的内容,它帮助用户以一种更加自然的方式获取知识库中内容。问答系统要为海量用户提供服务,因此它需要具备高效处理批量问句的能力。并行是高效处理批量问句的一种简单但有效的方法。然而,并行的批量知识问答方法面临如下三个挑战:首先,批量问句之间可能包含子问句层次上的公共语义,而公共语义的冗余处理会导致时间代价的巨大浪费。复杂问句与简单问句处理时间代价相
学位
在自然语言处理领域,随着深度学习网络技术的广泛应用,越来越多的复杂模型声称在规范良好的数据集上有着更好的性能表现,但是随之而来的是对深度学习网络本身可解释性的担忧,犹如萦绕在科研工作者头上的定时炸弹。最近部分研究者受到量子理论的启发,在自然语言处理领域提出了一种基于量子理论数学框架的语言模型,通过将不同的单词表示为基本量子态,并使用密度矩阵建模包含若干单词的句子,构建一个量子混合系统,以期表示人类
学位
Transformer模型已经被广泛地应用在许多自然处理任务中,其核心组件是带刻度的点积注意力机制(词级注意力)。该注意力机制是一种单词级别的设计,关注的是任意单词对之间的相似性,因此它的复杂度在序列长度上是二次级的,这也大大限制了其在长序列任务上的应用。为了获得一个更加轻量高效的注意力机制,本文提出了两种新的注意力机制。一是本文提出了维度注意力机制,并在此基础上开发了一种新的语言建模方法,名为T
学位
无监督关系抽取的方法旨在从未知标签的文本中获得实体间的关系。句子中两个实体之间的关系通常取决于他们的类别属性,而不是由该句子中的两个特定实体确定。实体的类别在粒度和含义上具有很大的灵活性,即使使用手动标记也很难正确地对数据进行标注。有监督关系抽取方法和远程监督的关系抽取方法目前已经相对成熟,然而都需要带有标签的数据集来进行训练。自监督方法旨在通过模型自身生成的标签来进行训练,因而解决了数据集标注的
学位
目的:1.重度左房自发超声显影是血栓形成的前期阶段,是血栓事件的高危因素。研究表明,D-二聚体浓度可用于排除左房血栓,但尚不清楚重度左房自发超声显影房颤患者和左房血栓房颤患者的D-二聚体浓度是否存在差异。2.对于非瓣膜性房颤患者形成的左房血栓,常规应用华法林使血栓消退,而非维生素K拮抗剂口服抗凝药物(如达比加群和利伐沙班)对血栓溶解的安全性及有效性研究资料很少。方法:1.这项前瞻性研究筛选2017
学位
Abaqus是对核环吊进行瞬态动力学抗震分析时的常用软件,其中的Translator连接器可以用来模拟带有预紧力及剪切销的水平导行装置。如何根据水平导行装置的力学特性,构建连接器模型并正确设置其参数成为决定抗震分析正确性的关键之一。本文首先通过对含有连接器的简单质量块模型进行研究,确定了Translator连接器的设置方法;其次采用2个连接器并联的方式模拟带有预紧力及剪切销的水平导行装置;最后完成
期刊
随着现代互联网技术的发展,领域之间的跨界合作不断涌现,推动着服务生态系统不断发展。领域间合作的不断加强使得跨界与融合已经成为现代服务业发展的重要特征。然而目前,由于影响因素和参与者种类众多,数据量庞大且复杂,跨界服务对整个服务生态系统的影响机制仍然缺乏研究。本文提出了一种基于多样性度量的服务生态系统跨界演化框架SETE(Service Ecosystem Trans-boundary Evolut
学位
文本可视分析和计算机辅助设计等研究近年来快速发展,引起了博物馆领域的广泛关注,并初步应用于策展辅助工作。但是,现有的文本分析工作忽略了对展览文本进行语义挖掘,无法有效支持策展选题。交互式地进行展览方案策划,支持灵活编辑和逻辑叙事等研究也有所欠缺。与陈列设计相关的工作则存在对文博领域特征关注不足和交互设计不友好等问题。本文面向博物馆策展工作场景,对文本可视分析及计算机辅助设计方法在增强数字化资源的有
学位