基于张量空间及张量网络的语言模型

来源 :天津大学 | 被引量 : 0次 | 上传用户:xxzxzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型是自然语言处理领域的一个非常重要且基础的研究课题,应用在很多自然语言处理任务中,如语音识别,机器翻译,对话系统等。现有的语言模型大体可以分为统计语言模型和神经语言模型两大类,他们各有优缺点,统计语言模型建模要求的参数量过大而难以估计,神经语言模型虽然建模效果较好但又理论性不足。本文提出了一个基于张量空间及张量网络构建的语言模型,并命名为张量空间语言模型(Tensor Space Language Model,TSLM)。在张量空间语言模型中,我们用张量积来捕捉词与词之间的交互信息,并且在此基础上模型能构建一个表达能力更强的语义空间。理论上,我们证明了这样的张量表示是n-gram语言模型的一般形式,另一方面,用张量分解推导了语言建模中的递归的条件概率计算过程。综上,我们提出的基于张量空间的语言模型是一个更一般的语言模型,这意味着统计语言模型和神经语言模型都可以作为张量空间模型的特例。换言之,我们构建的张量空间语言模型统一了统计语言模型和神经语言模型。在语言建模数据集Penn Tree Bank(PTB)和WikiText上的实验验证了张量空间语言模型的有效性。
其他文献
华硕新近推出了“静音王”QuieTrack系列光存储产品,包括CD-S520/A452×CD-ROM和CRW-5232AS刻录机。由于产品的外形和前代产品相同,因此在购买时请注意识别。华硕“静音王
“养虾就是养水”,也就是营造养殖水体“肥、活、嫩、爽”的水色,已成为养虾人的共识。现在的肥水不仅是狭义的用肥料把水肥起来,还包括使用大量的益生菌把水体调到最佳状态
我国经济在飞速发展的同时,环境问题日渐严重。党的十九大坚持践行绿水青山就是金山银山的理念,全力解决环境污染问题。重污染行业中的众多企业,不仅构成了国民经济的重要部分,而且对环境造成很严重的污染。据统计,80%的自然环境污染来自重污染企业。所以,重污染行业在绿色发展的背景下如何降低环境污染并进行环境信息披露是值得研究的问题。基于研究企业的环境信息披露与企业的财务绩效相关关系的中外文献,结合可持续发展
增强鱼体抗病力、减少病虫害的发生,从而提高鱼体质量和单位面积产量是渔业生产中一个非常重要的环节。主要抓好以下三个方面的工作:一、彻底清整池塘1.生石灰清塘①干池清塘
对CPU施以“超频”大法,虽然可以有效提升CPU 的处理能力,然而在对CPU进行超频的时候,CPU的功率必然也会随之增加。并目,由于某些CPU先天体质不佳,还必须适当增加CPU核心电压
如今用电脑通过网络即时欣赏电影和音乐越来越流行。在线视频教学、视频聊天、在线点播电影,音乐以及网络电视直播等,使我们足不出户即可享受到多姿多彩的网络影音世界。丰富
大学生考试及格率下降这一现象客观存在。本文从多个方面探讨了大学生考试及格率下降的原因,并对提高学习成绩提出了一些合理建议。
在《电脑迷》2006年9月上刊登了《拒绝迅雷弹出广告》一文,按照文中的操作方法可以将弹出广告消灭,但是迅雷还有大幅的区域直接被Flash广告所占据,令人不胜其烦。笔者经过一
研究了层层自组装技术制备的导电聚合物SPAn/纳米硫化镉复合膜的电化学和光电化学性质. 单层SPAn膜在0.1 mol/L的LiClO4/乙腈电解液中有弱的阴极光电流效应, 为p型半导体; 化