基于关系能量最大化的词嵌入方法及应用研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fragishsss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词嵌入是指将词语表示成低维向量,并能在向量空间上反映出词语间关系的技术。词嵌入技术不仅能运用于自然语言处理领域,也能运用于推荐广告等其它领域。在这些领域的诸多任务中,一般采用词嵌入技术预训练词向量并将其作为下游模型的输入。传统的词嵌入算法无论是基于共现矩阵,还是基于神经网络,在可解释性上都有所欠缺。其次由于词嵌入可运用于推荐广告等领域,工业界要求词嵌入技术能学习出更多的词语关系信息以促进这些任务的效果提升进而为企业带来更大收益。词嵌入的理论基础是Harris等提出的词语分布假说,即“上下文相似的词,其语义也越相似”。该假说反映了词语间的关系信息由其上下文词的近似程度表示。若追本溯源,基于词语分布假说,深入研究词语与其上下文的关系,可能是提升词嵌入技术可解释性与学习能力的有效途径。受其启发,本文从词语分布假说出发,开展了词语和上下文间关系的相关研究,主要工作在于:(1)针对词嵌入方法的可解释性,结合词语分布假说理论与传统词嵌入获取词向量的方法,提出了基于关系能量最大化的词嵌入方法。首先,根据“上下文越相似的词,其语义也越相似”理论,将整个语料库的所有词语关系用其对应上下文表示,建立关系的能量公式。其次,采用极大似然估计,梯度更新每个词语的对应词向量。最后,将公式变换,使极大似然估计的过程转化为构建能量矩阵并进行矩阵分解的过程。文中提出的算法在获取词向量的过程中反映了词语分布假说的理论,可解释性更强。使用深度学习常用数据集Text8作为语料库,本文的算法相对于传统矩阵分解算法在word analogy任务上效果更好,而word similarity任务上,本方法也能和Word2vec效果相当。(2)针对词嵌入技术在推荐广告领域的运用效果,本文将基于关系能量最大化的词嵌入方法应用于推荐广告领域,使用阿里巴巴算法竞赛中的搜索广告点击与转化的数据进行实验。首先,建立转化率预估模型,从数据中构建丰富的特征使模型的预测效果达到较优水准。接着,将商品和属性当作词语和上下文构建能量公式并进行矩阵分解获取商品的低维向量表示。最后,将商品的向量作为特征加入转化率预估模型来衡量模型效果。通过实验,本方法可以进一步降低转化率预估模型的Logloss,并相对于传统词嵌入技术能取得更好的效果。
其他文献
将基于LabVIEW和MATLAB混合编程的虚拟实验技术引入信号与系统课程实验教学,提供了一种有效的实验手段。以调制与解调实验为例,阐述了实验的过程与实现方法,并给出实验结果。
<正>在贵州省黔东南苗族侗族自治州凯里经济开发区,坐落着一家以青钱柳茶种植、加工、销售为主业的企业——黔东南森林王红豆杉发展有限责任公司,在这里会看到一道壮观的风景
在分析传统FPGA动态重构方法性能缺陷的基础上,创新性的提出了基于改进型游程编码的FPGA动态重构方法,并详细介绍了该方法的设计实现。与传统FPGA动态重构方法对比测试结果表
我国的控烟政策正在不断推进,同时,吸烟人群也在减少,为烟草企业的发展带来了很多不利影响。为了减少企业面临的风险,烟草企业需要优化内部控制,进一步完善控制机制,提高信息
第二次世界大战后不久,在美国主导下,日本以美国教育体制为模板,把战前多样化的高等教育结构更改为以4年制大学为主体的单一的高等教育体系.然而,却带来了高校人才培养同质化
在美国媒介融合的大背景下,网站成为公众获取新闻的主要渠道,网站新闻信息的生产、呈现与传播渠道等发生重大变革,网站编辑作为新闻信息的直接把关人,其工作方式也发生着改变
无论坊间如何呼吁,新零售对于药店来说,似乎一直处于概念阶段。偶有个别创新,也仅限于“点”,无法“点动成线”。究其原因,笔者认为,药店业与普通零售业存在很大不同,普通零
报纸
我国人身损害赔偿诉讼中,经常需要利用法医临床司法鉴定结果确定人身损害程度,为赔偿数额的计算提供依据,从而使法官更好地对纠纷作出合理的判决。所以,法医临床司法鉴定在民
分析洪湖区湿地脆弱性的成因,并采取定量和定性相结合的方法对洪湖区湿地脆弱性进行评价。评价中依据湿地生态特性及演化规律建立评价指标体系,利用层次分析法(AHP)确定指标权重,
进入21世纪,世界政治经济形势的发展变化以及科技的飞速进步,对包括报纸在内的传媒业产生了重大影响,我国报业发展也面临一些新的情况。 In the 21st century, the developm