基于语言处理技术的推荐系统设计与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:fsp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐作为海量信息过滤的基本技术方法广泛应用在信息推送和商品推荐等应用领域,需要解决数据稀疏性的难点和推荐的多样性的问题,成为学术和应用领域的研究难点和热点问题。SVD方法在业界得到广泛采用,该方法通过购买和浏览等记录建立人和商品之间的二维关系,并对该关系进行SVD分解建立人和商品之间相关关系的推断。相对于复杂的深度神经网络模型SVD框架在实际中取得较好的效果:同时,广泛使用的移动设备也需要简单而节省能耗的模型以解决移动环境下的智能计算以及推荐问题。另一方面,作为时间序列模型的语言模型,能够表达词之间在时间维度上的依赖关系,以表达语言的语法、内容和表达者的情景状态等。相似地,商品购买者购买商品也受到他的需求(内容)和复杂心理以及环境的影响(情景状态),因此它们之间有较为相似的依赖结构。本文在SVD的框架下,扩展LDA模型到商品推荐上,将自然语言中文本语义识别、语义关联技术扩展到商品推荐领域,挖掘用户行为轨迹数据中体现的商品语义上的依赖,通过隐含空间表达这种依赖关系,建立商品和用户之间的关联。最后,在实际的淘宝数据集上的实验结果表明研究具有方法的有效性。本论文主要工作如下:(1)利用主题模型LDA,对“用户交互的商品轨迹序列”进行建模:将“商品ID”视为“词”、将“轨迹序列中的商品ID集”视为“文档”。利用LDA对“语料”中数据结构的概率表示,以及LDA在主题空间的概括性,将商品在“主题空间”进行自动聚合,并通过将商品映射到“主题空间”,建立商品的特征向量表示,并引入商品在不同场景卜的“语义信息”。(2)在LDA基础上,提出了结合“用户信息”的用户-主题模型U_LDA,以及结合“用户行为信息”的用户-行为-主题模型UB_LDA:改进模型引入了“用户”、“用户行为”信息对主题空间的学习,一方面将“用户”和“用户行为”信息进行在主题空间的自动聚合,并通过将二者映射到“主题空间”,表达对“用户”、“用户行为”的矢量化表示,反映“用户”和“用户行为”在时间维度不同场景下的“语义信息”。(3)在实际的淘宝数据集上进行实验,分别考察模型的推荐结果的准确率、召回率和F1值,并给出了模型与其他推荐算法的对比结果。实验结果表明,改进的主题模型相比于传统的SVD框架具有对隐含空间更好的挖掘能力。
其他文献
超快激光与气体介质相互作用成丝产生太赫兹波是当前产生宽频谱、高强度太赫兹辐射的一个重要途径。本文分别探讨了几种模型下单色场(波长为0.8微米)超快激光和双色场(波长为 0.
<正>2015年11月29日,是中国首款自主研制的喷气式支线客机ARJ21-700"出嫁"成都航空的"大日子"。天公作美,已经连续几日阴雨绵绵的成都迎来了难得的大晴天,蓝天白云仿佛也在期
为了提高基于固态变压器的永磁风电并网系统中直流母线电压的稳定性,在低压直流侧,通过双向DC-DC加入超级电容器。文章基于Boost电路建立混杂系统模型,引入类滑模控制策略,利
在20世纪文化研究大潮的影响下,当代西方文学研究逐步偏离了审美化的研究模式,从单纯地分析作品本身转向了对作品语境的社会政治学批评。从积极的方面上讲,这种全新的理论视角大
<正>庐剧起源于皖中地区,荟集门歌、秧歌、茶歌、民歌、大别山歌等各种小调,广泛流行于皖中、皖西、沿江的大片地区和江南的一部分地区。庐剧的形成已有200多年历史,流行区的
目前有多种方式用来抑制调速系统中调节器饱和引起的Windup现象。其中跟踪反计算控制策略,由于其采用线性反馈作用原理来减小调节器饱和时的积分累加值,因此对于这种策略的研
在全球能源问题和环境问题趋于严峻的今天,低硫、低芳的清洁柴油替代汽油作为主要的车用燃料已成为一种趋势,柴油的深度脱硫技术是其应用的关键。络合脱氮-加氢组合技术因其
根据我国住房和城乡建设部2016年发布的第一批127个特色小镇名录和《小城镇基本信息表》中所示,将特色小镇划分为商贸流通型、工业发展型、农业服务型、旅游发展型、历史文化
<正>随着监狱体制改革的深入推进,制约监狱发展的源头性、根本性、基础性问题逐步得以破解,公正、廉洁、文明、高效的新型监狱体制逐步建立。如何在新形势下推动监狱工作科学
随着计算机技术的进步,各高校已经陆续的开始利用教务管理系统进行学校的日常管理,但多数是基于B/S架构开发,甚至有的还是基于C/S架构开发,不论哪种架构,都依赖于PC机,不能满