基于表示学习的浏览行为分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:chouser1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大型网站的浏览行为分析挖掘网页相似关系、用户浏览的偏好以及相似行为聚类,应用于网站营销等电子商务活动。本文从语义、偏好和行为三个角度分别提取网页URL的语义、浏览偏好概率分布、浏览行为表示。采用图概率模型和神经网络模型对比远距离关系的表达能力和可训练性,构建多阶Markov模型和长短记忆深度神经网络模型。主要贡献总结如下:(1)URL语义表示学习:采用URL的分布语义建立神经概率符号模型,将URL映射到高维语义特征空间,通过特征向量的距离近似表达URL的相似语义,用于LSTM模型的输入向量表示和URL关系分析。(2)浏览偏好模式:分别采用多阶Markov图概率模型和LSTM神经网络模型学习浏览行为习惯,推断当前页面下的下页访问概率分布,表达不同环境下浏览行为偏好,用于个性化推荐、网页分布结构优化。(3)行为语义表示学习:将用户的浏览轨迹映射到高维语义特征空间,通过向量空间中的距离近似表达不同用户间的相似行为语义,用于网站的流量分析、浏览者聚类。(4)实验与可视化:在实际的电商网站数据进行实验,实现图模型和神经网络模型在当前环境下的页面访问概率分布计算,可视化页面结构和用户行为的匹配度。将URL和用户行为映射到高维语义特征空间,可视化不同类型页面之间的语义相关性分析页面结构的合理程度,从时空两个维度可视化分析网站的流量分布和用户群;对特定店铺进行可视化热点分析。
其他文献
阐述了不确定度的A类评定、B类评定和合成不确定度的一般计算方法。由贝塞尔公式计算了杨氏模量实验中各直接测量量的A类不确定度,并根据具体测量条件计算了B类不确定度。分
<正>经国务院批准,自2013年8月1日起,在全国范围内开展交通运输业和部分现代服务业"营改增"试点。试点半个月,"营改增"对广西外贸企业有何具体影响,本文抽取了15家广西重点出
2019年4月23日,中关村管委会发布了《中关村国家自主创新示范区知识产权行动方案(2019-2021)》,力争有效促进知识产权高质量创造、高水准保护、高价值运用。该方案由中关村管
电力营业窗口直接面向客户,窗口业务办理必须一对一为客户提供优质服务,提高客户的满意度。营业窗口不仅关系到电力企业的对外形象,更关系到企业的对外竞争和抢占市场先机。
幼儿园音乐教学中渗透情感的培养,能发展幼儿对音乐的感受能力、表现能力,通过多元化的教学手段,激发幼儿的情感,使幼儿在愉悦中学习,让音乐成为幼儿自我表现的天地。
<正>几年前,当"职业倦怠"这一现象犹如魔咒般不可避免地出现在我的教学中时,我曾经内心有过深深的恐慌,不甘心就此混沌下去。于是,我开始改变,在我逐渐突破"职业倦怠"这个魔
目的探讨产前心理干预对分娩期妇女精神心理因素的作用。方法采用单日、双日分类法,将100例孕妇随机分为实验组和对照组,对照组孕妇接受常规的产前教育,实验组孕妇在接受常规
通过对中性点经小电阻接地发生单相接地故障的理论分析,得出中性点电阻阻值大小的要求,并举110kV及220kV变电站的实例结合一次系统配置分析其零序过流保护配置,最后给出了仿
大型离心式注水泵机组振动故障是影响注水泵正常生产的主要问题。本文以模糊数学为基础 ,研究了基于振动信号的离心式注水泵故障自动诊断技术及系统 ,根据注水泵的结构特点提
<正>园区是改革创新的试验田。加快形成权责一致、运转高效的园区行政审批体系是全面深化经济体制改革的一个重点,是转变政府职能、进一步理顺政企关系的突破口。不放不活,放