【摘 要】
:
近些年很多基于深度学习的推荐模型被提出,这些模型通过对特征的处理和改变深度网络结构来解决推荐系统数据稀疏和冷启动的问题.然而现有的方法忽略了特征与特征之间的交互对深度网络的影响,限制了模型的学习能力.为了给用户推荐更感兴趣的项目和信息,本文提出了分解机深度网络(Factorization Machine Deep Network,FMN)模型.该模型将因式分解机和深度神经网络结合,首先利用因式分解机在特征之间进行交互以充分学习交叉项特征,然后利用深度网络学习高阶非线性特征.进而,分解机深度网络将特征的隐藏
【机 构】
:
哈尔滨师范大学 计算机科学与信息工程学院,哈尔滨150500
论文部分内容阅读
近些年很多基于深度学习的推荐模型被提出,这些模型通过对特征的处理和改变深度网络结构来解决推荐系统数据稀疏和冷启动的问题.然而现有的方法忽略了特征与特征之间的交互对深度网络的影响,限制了模型的学习能力.为了给用户推荐更感兴趣的项目和信息,本文提出了分解机深度网络(Factorization Machine Deep Network,FMN)模型.该模型将因式分解机和深度神经网络结合,首先利用因式分解机在特征之间进行交互以充分学习交叉项特征,然后利用深度网络学习高阶非线性特征.进而,分解机深度网络将特征的隐藏信息充分发掘出来并拥有高阶的非线性特征学习能力.两个真实数据集的实验表明,本文提出的模型在推荐性能上有着明显的提升.
其他文献
近日,华中科技大学计算机学院“Time·前沿”论坛第三期成功举办,论坛邀请了美国南加州大学著名教授Viktor K. Prasanna作主讲,论坛采用线上形式进行.rn图神经网络(GNN)在机器学习领域的应用非常广泛,但计算开销制约了GNN的扩展性,Viktor教授介绍了GNN的发展现状及应用情况,分析了数据规模、数据复用、随机访存、负载不均和异构内核等GNN加速面临的挑战.针对这些问题,Viktor教授重点介绍了两项突破性研究成果,对优化下游应用性能具有重要意义.
针对突发重大疫情或灾害后实施应急救援过程中的物资调配急迫性与时效性以及多车型运输问题,本文构建了一种选址-调度双层模型.即,上层以总的运输代价最小化为目标,下层以配送代价(时间、距离和满意度)最小为目标的双层动态交互模型,同时考虑时间窗、配送覆盖范围限制以及运输车辆容量限制及距离等约束条件.根据模型特点,设计了一种混合嵌套算法,上层为新型排球超级联赛算法(New Volleyball Premier League Algorithm,NVPL),下层为改进的遗传算法(Improved Genet-ic A
针对现有基于自编码器(AE)的过程监测方法在故障隔离和识别方面存在的缺陷,提出了一种基于去噪自编码器(DAE)的故障隔离与识别方法,其主要思路是通过在DAE的优化目标函数中引入未知的故障子空间实现故障的隔离和识别.考虑到故障的特性,引入了l1正则化项以实现稀疏隔离,并设计了基于自适应矩估计(ADAM)的优化问题求解方法.与传统方法相比,基于去噪自编码器的故障隔离与识别方法在非线性过程故障诊断中具有更好的效果.在Tennessee Eastman(TE)过程和高炉炼铁过程中的应用验证了所提出方法的可行性.
基于矩阵分解的推荐方法易受到数据稀疏性问题的影响,常见的解决办法是向矩阵分解模型中融入评论文本信息,但是这类方法通常假设用户是独立存在的,忽略了用户之间的社交关系.现实世界中用户的行为与喜好往往会受到其信任好友的影响,因此本文提出一种融合评论文本和社交网络的矩阵分解推荐方法(Review and social probabilistic matrix factorization,RSPMF).首先设计了深度神经网络模型用于学习评论文本的上下文特征;其次,设计了信任传播模型用于根据社交好友的特征修正用户的潜
针对经典粒子群优化(PSO)算法在算法前期易陷入局部极值、后期收敛精度低的问题,提出一种结合引力测度和质心变异策略的混合粒子群优化算法(GMCMPSO).首先,在算法初始阶段采用精英分组策略,以方便获取种群的优秀信息;其次,对两个子群采用引力测度策略,以达到种群间信息的高效共享;最后,在引力测度的引导下对一部分普通粒子进行随机变异、对剩余的普通粒子进行质心变异,以使得算法能够有效跳出局部极值和开发最具潜力的区域,并提高算法的收敛精度.将所提出的算法和经典粒子群优化(PSO)算法、萤火虫和粒子群的混合优化(
网络测量为网络运营,服务质量保证,拥塞控制,数据中心和骨干网中的异常检测提供了关键信息.为了应对日益增大的流量规模,减少流量统计的内存开销,基于Sketch的流量统计方法成为流量统计的研究热点.文章对Sketch统计方法进行研究,针对基于Sketch的Top-k流统计问题进行分析,根据Sketch的结构特点,将Sketch分为基本Sketch、面向热流的高精度统计Sketch、冷热流自适应的精确统计Sketch.另外研究了Sketch面向场景的实现方法.最后分析了Sketch算法未来的研究方向.
作为自然语言处理任务的基础,中文分词的准确率直接影响命名实体识别、信息检索等任务的效果.针对现有分词模型使用的静态词向量精确表征能力较差和专业领域分词中模型适应性差等问题,本文提出一种使用字根信息为辅助特征的中文分词模型.模型分为主任务和辅助任务,主任务中使用ALBERT语言模型训练词向量,利用去池化卷积残差神经网络提取特征,与辅助任务抽取的特征融合后进行分词.辅助任务使用字根向量表示文本,通过浅层卷积提取特征,进行序列标注.借助损失函数利用辅助任务对主任务进行纠正,协助主任务实现中文分词.在BakeOf
虽然缓存内容复用是命名数据网络的显著特征,但是传统方法的缓存内容利用率并不理想.为了提高命名数据网络中缓存内容的利用率,提出了一种基于缓存价值的缓存策略.本缓存策略在保证内容流行度和兴趣源距离外,还充分考虑了缓存内容大小及多样性因素,由此可有效优化缓存空间,提升缓存的价值.此外,还设计了相应的缓存内容定期更新策略.对比实验结果表明,提出的缓存策略与经典的缓存策略相比,可以有效提高缓存内容的命中率、降低内容平均访问时延和平均路由跳数.
针对GWO算法易早熟收敛、寻优速度和精度不高等问题,提出一种基于双权重因子的改进鲶鱼效应灰狼优化算法(IGWO).首先,采用Logistic混沌映射初始化灰狼种群,提高种群初始化位置的质量;然后针对头狼扰动和个体搜寻步长引入两种不同的权重因子,用来平衡算法局部开发和全局搜索能力;最后引入改进的鲶鱼效应策略,保证种群活力,进一步提高算法收敛精度,避免算法陷入局部最优解.仿真结果采用10个标准测试函数与其他智能优化算法进行低维和高维寻优对比,并与其他改进灰狼优化算法进行对比,结果表明,改进的灰狼优化算法具有较
随着后摩尔时代的到来和Dennard缩放规律的终结,CPU处理能力增速趋缓.超大规模数据中心网络中的流量却呈现持续的指数增长态势.数据中心网络堆栈功能开始向硬件转移,旨在节省CPU时钟周期的新型智能网卡(SmartNICs)应运而生.系统结构和网络领域顶会两年来发表多篇相关研究成果.本文首先介绍了智能网卡研究背景,并归纳了网卡智能化的演进过程;其次,重点阐述超大规模数据中心时代的智能网卡研究挑战以及在网络加速、数据传输、新型调度器和性能隔离等方面的最新研究进展;随后,介绍了工业智能网卡研发现状;最后,给出