基于连续量子测量和酉演化的端到端类量子语言模型

来源 :天津大学 | 被引量 : 0次 | 上传用户:jifaling1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理中,语言模型是一重要研究方向。近年来,研究者发现在自然语言中存在着量子性质,因此涌现出各类基于量子力学框架的语言模型,在各个自然语言处理任务上达到了不错的效果。然而,现有的量子语言模型存在一些问题,原始的量子语言模型基于非神经网络框架,对模型进行训练,使模型的推广受到极大的限制。基于神经网络框架的量子语言模型在建模文本表示时,模型会忽视文本数据的序列性和文本理解的动态性。本文对现有的量子语言模型存在的问题进行了深入讨论与研究,给出了解决这些问题的方法。本文主要创新点如下:(1)基于量子测量和酉演化原理,搭建了一个新型端到端类量子语言模型;(2)与以往模型相比,率先在文本序列的每个位置建立酉矩阵,赋予酉矩阵实际意义;(3)通过酉演化建模出文本数据的序列性和文本理解的动态性,并给出这一过程的详细推导,以及酉矩阵必要性和复合系统必要性的证明。本文模型根据单词出现的顺序,对文本进行量子测量和酉演化,建模出词序对文本表示的影响。模型经过训练后,可以得到单词条件概率以及文本密度矩阵。通过在多个标准测试集上的实验发现,利用本文提出的方法可以建模出单词间的依赖关系,效果得到了提升,验证了模型的有效性。
其他文献
目的 探究阿昔洛韦联合转移因子口服液治疗传染性单核细胞增多症(IM)患儿的临床效果。方法 选取南京市溧水区人民医院2017年1月至2022年4月收治的84例IM患儿作为研究对象,采用随机数字表法将其分为对照组和研究组,各42例。对照组给予阿昔洛韦静脉注射治疗,研究组给予阿昔洛韦联合转移因子口服液治疗。治疗1周后,比较两组临床疗效、咽峡炎消退时间、颈部淋巴结肿大消退时间、退热时间、CD3+、CD4+
期刊
新冠疫情对旅游行业造成了巨大的影响,同时也加快了旅游业态和旅游产品的更新迭代,催生了新的模式。在后疫情时代,为加快复苏与转型,旅游业需要分析当前消费者对于旅游产品的新需求,改进现有旅游产品及其服务模式和理念。本文研究了当前相关的理论研究进展,并利用调查问卷,从消费者的角度分析受疫情影响的旅游产品消费变化情况,并针对当前发展存在的问题,提出发展建议。
期刊
近年来,人口老龄化和空巢化的加剧使得养老服务领域的需求进一步升高。由于老年群体本身所具有的特殊性,在海量的数据中获取到匹配的服务变得更加困难。现阶段针对老年人的推荐算法考虑维度较为单一,需要考虑更多的维度使得对服务对象的刻画更加明确。老年人群体的描述有很多不同的维度,从多种方式得到的数据具有复杂的数据类型,模型转化也存着较大的困难,在保留客户特征的前提下处理高维状态下的多模态数据成为棘手的问题。此
学位
X线头影测量分析是正畸临床辅助检查的重要手段之一,患者拍摄X线头颅侧位片后,正畸医生在X光片中对牙颌、颅面等标志点描绘特定的线角,计算线距,从而分析相应的解剖结构特征,并据此做出相应的诊疗方案。解剖学标志点的定位是头影测量分析中的关键问题,每张侧位片中包含了数十个标志点,反映了牙颌、颅面软硬组织结构的发育情况及相互关系。由于X射线成像的限制,头颅侧位片存在组织结构重合、不对称,成像不清晰等情况,手
学位
随着信息技术与互联网的发展,越来越多的人参与到社区中进行交流、评论、转发,这使得社交网络的分析越来越复杂。网络分析通常是一个繁杂的过程,如何有效的在网络中找到所需的节点成为了一个值得研究的问题。本文提出了一种基于网络嵌入的方法,使用非负矩阵分解或神经网络的方式,将网络的文本信息和结构信息进行联合嵌入,从而得到网络表示矩阵,同时将用户指定的文本信息和结构信息进行向量化表示。最终根据用户指定节点属性的
学位
人机交互(HCI)很大程度上取决于手的行为检测,例如手部动作识别,手势识别等。然而,在许多人机交互情况下,例如手指指示、点击等,指尖检测则更为实用。在一般的目标检测中,尽管目前已经取得了长足的进步,但是细粒度的目标检测,例如指尖检测,由于其外观特征十分有限,对于现有方法仍然是一个挑战性的问题。先前工作都将指尖检测视为两个独立的任务,分别为手部检测和指尖检测;此外,在指尖检测过程中,先前的方法只能处
学位
虚拟现实(VR)是近些年兴起的一种技术,已经在很多领域有了实际应用,这其中就包括电子游戏。比起诸如军事、医学、工业仿真等其他领域,电子游戏对于技术方面的要求更高,同时需要给玩家展示更为完整的宏观世界。随着VR设备的逐渐普及,越来越多的VR游戏将会走进人们的日常生活中。本文旨在以坐落在骊山脚下的秦陵地宫为背景,虚构了故事线索,使用虚幻引擎设计并开发一款基于沉浸式头盔设备,以秦帝陵为背景的VR FPS
学位
发音依赖于多个发声器官的协作,采集和观察发音器官的协同运动可为语音研究提供多模态数据的同时,有利于发音机理的研究。但由于非侵入性仪器较多,无创检测辅助设备的设计已经成为多模态发音研究的重要领域。因此,本研究旨在提高超声换能器稳定设备的稳定性,实现与电声门图仪(EGG)对舌和声带数据采集和分析的协同。本研究设计一个用于稳定超声探头和EGG配合使用的设备。在确保头部和超声探头可以自由灵活的移动的前提下
学位
常用的时间序列预测方法主要有以下三种:基于传统统计学的方法、基于机器学习以及深度学习的方法,而且每一种方法都有各自的优势和应用场景。由于现实生活中时间序列的场景比较复杂、特征比较多,无法通过一个通用的模型实现对全部类型时间序列的精确预测。所以在很多场景下,以上方法的预测效果无法满足需求。本文提出了一个新的时序预测框架,用于解决不同时间序列的预测问题。该框架主要包含数据清洗和数据预测两大部分。针对数
学位
软件生态系统往往处于不断演化的过程中,因此对软件生态系统的演化过程进行研究分析具有十分重要的意义。Android系统中的应用框架层由众多的项目仓库组成,这些项目仓库互相依赖形成了协同演化的软件生态系统。Android的应用框架层给数百万的Android APP提供众多有用的API,它的演化会影响到众多Android APP的健壮性和稳定性。在本文中,我们提出了一种对软件生态系统的代码依赖网络进行演
学位