基于语义图聚类的词义向量构建方法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:muyue3122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了让计算机理解人类语言,词向量方法将每个单词的语义用一个低维稠密的向量表示,这是自然语言处理领域的一个重大突破。然而,自然语言存在着一词多义现象,词向量方法将单词的多个词义融合为一个向量表示,造成了含义混淆。为了解决这个问题,以单个向量表示词义的词义向量成为近年来一个新的研究方向。构建词义向量首先要获取单词的词义目录,然后生成每个词义的向量表示。当前已有的词义向量构建模型定义的词义目录不够准确,生成向量表示的过程过于简单。基于语义图聚类的词义向量构建模型是针对这两个不足的改进模型。该模型将单词的词义分布关系构建为语义图,根据改进的图聚类算法划分词义簇,实现了动态的词义感知。并且该模型不直接指定词义向量的生成函数,而是首先将词义簇通过Page Rank算法筛选得到词义中心词,设置词义向量靠近词义中心词等区域的优化目标,然后迭代求解词义向量关于词义中心词的词向量的映射函数。为了展示词义向量在下游任务中的应用,该模型将构造好的词义向量融入到词义消歧和实体消歧两个消歧任务中,在传统方案上进行改进。其中,词义消歧任务在通用领域进行研究,针对传统方案需要大量标注数据的缺点,该模型实现了一种将词义向量计算的局部可信度和全局流行度相结合的新方案;实体消歧任务在制造领域进行研究,针对传统方案中用词向量表示语义引起的歧义,该模型实现了一种利用词义向量计算的语义特征训练分类器的新方案。实验部分使用三个数据集分别评估词义向量的质量和词义向量在两个消歧任务中的表现,结果表明,在这三方面基于语义图聚类构建的词义向量相较于当前最优的Glo Ve词向量和CWMS词义向量均有3%-4%左右的提升。
其他文献
Cu-Cr-Zr合金作为一种典型的时效-析出强化型铜合金,是目前研制出的唯一能满足超大规模集成电路引线框架材料的高强高导铜合金,要求抗拉强度≥600MPa,导电率≥ 80%IACS,已然成为第三代高性能铜合金材料的代表。传统热轧工艺流程生产Cu-Cr-Zr合金主要存在偏析严重、固溶度低以及工艺繁琐的问题,生产效率低且成本高。国内外相关研究已经表明,增加合金凝固时的速率不仅可以有效提高Cr和Zr在铜
社会救助审计是社会救助制度的重要组成部分。本文以经典审计理论为基础,从学理上阐释社会救助审计的8个基础性问题,即社会救助审计需求、社会救助审计本质、社会救助审计客体、社会救助审计主体、社会救助审计内容、社会救助审计目标、社会救助审计方法、社会救助审计结果及其运用,并提出关于社会救助审计的基本理论框架。科学建构社会救助审计制度,必须从理论上正确认知社会救助审计的基础性问题。
我国烟草种植业规模大,从业人员众多,但是目前的烟叶烘烤控制技术不仅劳动强度大而且不能根据不同批次烟叶的情况进行及时的烘烤工艺调整,会降低烟叶的品质。对烟叶烘烤过程中的状态预测进行建模,准确预测烟叶烘烤所处的状态,并对烘烤工艺做出及时调整,可提升烟叶烘烤后的品质,降低劳动强度。烟叶烘烤过程中烟叶的面积、颜色、重量以及一些化学物质含量等变化明显,理论上可以作为状态预测模型的输入特征,但是由于密集化烤房
学位
学位
随着物质条件提升,越来越多人开始关注自身的健康和体型。人体体型测量可通过WBX人体扫描仪来实现,但是该设备价格昂贵,无法推广到大众消费市场。基于三维重建技术实现人体体型测量具有成本低、使用场景广的特点。设计并开发了一套基于三维重建的人体体型测量系统。首先通过棋盘标定法标定单目相机;然后使用已标定的单目相机采集不同角度的人体图像,并对这组图像进行预处理;然后使用SIFT(Scale-invarian
OpenStack作为一个开源云平台,具有大规模的服务部署能力,越来越多的服务以容器的方式部署到OpenStack云端。单个OpenStack云往往资源受限,云端管理员需要跨区域扩展多个OpenStack云以满足隔离性、安全性和高可用性等需求。当OpenStack云端用户请求急剧增加时,跨域容器之间如果负载分配不均衡,将会导致云端部分节点过载,进而影响整个跨域云端的性能。此外,跨域多云扩展场景下的
学位
学位
不经意随机访问机(Oblivious Random Access Machine,ORAM)是一种密码原语,它可以消除用户访问内存时轨迹中的信息泄露,隐藏了在不可信环境下用户的访问模式,使得对于任意两个相同长度的逻辑访问序列,客户端和服务器之间的可观察通信在计算上是不可区分的,从而保护数据隐私。然而目前一些效率比较高的ORAM方案一般都有着O(log N)的带宽放大,或者是依靠昂贵的计算开销来实现