基于特征与域感知的点击率预估方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:y886520520886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
点击率预估是推荐系统中的核心任务,其关键是学习有效的特征交互,但现有基于深度神经网络的点击率预估方法未考虑冷启动问题,导致准确率降低.结合特征信息和域信息的嵌入,提出一种特征交互的点击率预估方法FF-GNN.利用基于图神经网络的交互模块分别提取特征嵌入和域嵌入的结构信息,建模细粒度的特征交互和粗粒度的域交互过程.同时通过设计图神经网络的权重计算模块,交叉引用特征图神经网络和域图神经网络的低阶特征信息,实现特征交互和个性化建模域交互.在此基础上,采用注意力机制融合特征交互和域交互模块的结果预测点击率.在Criteo和Frappe公开数据集上的实验结果验证了FF-GNN方法的有效性,其AUC指标相较于同类型Fi-GNN方法分别提高0.57和0.85个百分点,能够同时关注特征和域信息,提高点击率预估的准确度.
其他文献
为了改善在远程共享时,易出现的实时性差以及数据信息安全性能低问题,提出一种基于粒子群优化的数据库信息远程共享方案.根据网络实时环境及数据库信息特征整理,构建整体远程共享构架,使用粒子群优化法计算数据库信息中目标函数,将待实现优化的数据库作为粒子,实施初始化参数操作,并采取分组形式实现粒子运动位置的实时更新,再将最优粒子替换较差粒子,直到全部信息符合共享条件,最优信息经过数字转换机制实现格式转换,输入到具有兴趣约束的远程共享平台中,完成信息的远程共享.仿真结果证明,所提方法可实施性强且共享整体效率较高,有效
针对传统方法数据修复率较低,修复耗时较长,修复准确性较低的问题,为提高通信网络链路非平稳数据修复效果,设计了一种通信网络链路非平稳数据自动修复方法.采集通信网络链路传输数据,并构建非平稳数据噪声模型,对采集的数据进行去除噪声处理.根据噪声处理结果采用遗传算法对非平稳数据进行检测,并采用决策树方法对非平稳数据进行自动修复.实验结果表明,所设计方法的数据修复准确性较高,非平稳数据自动修复率较高,并且修复耗时少,证明了所研究的修复方法提高了非平稳数据的修复效果,具备实际应用意义.
目前多数文本分类方法无法有效反映句子中不同单词的重要程度,且在神经网络训练过程中获得的词向量忽略了汉字本身的结构信息.构建一种GRU-ATT-Capsule混合模型,并结合CW2Vec模型训练中文词向量.对文本数据进行预处理,使用传统的词向量方法训练的词向量作为模型的第1种输入,通过CW2Vec模型训练得到的包含汉字笔画特征的中文词向量作为第2种输入,完成文本表示.利用门控循环单元分别提取2种不同输入的上下文特征并结合注意力机制学习文本中单词的重要性,将2种不同输入提取出的上下文特征进行融合,通过胶囊网络
吞吐量的准确预测对于港口的发展具有重要意义,传统的单一模型在预测的精度或稳定性上都存在局限性.为提高吞吐量预测精度,引入Stacking算法的思想建立组合模型,并在此基础上提出了利用PCA-BP模型修正Stacking算法误差的误差修正模型;同时以1998-2017年深圳港集装箱吞吐量为实证研究对象,进行了基于BP神经网络和NARX神经网络单一预测模型、误差修正Stacking算法的预测模型及其它组合模型的预测对比分析,结果显示误差修正Stacking算法模型预测精准度最好,验证了模型的可行性,为港口的吞
传统的数据挖掘算法在面向大规模高维数据的挖掘过程中,存在数据特征捕捉准确率低、节点负载不均衡、数据交互频繁、频繁项集紧凑化程度低等问题.提出基于MapReduce的并行挖掘算法PARDG-MR,结合高维数据特征,设计基于维度粒化算法和负载均衡算法的DGPL策略,并对数据进行预处理,以解决高维复杂数据特征属性捕捉困难及数据划分中节点负载不均衡的问题.通过构建基于PJPFP-Tree树的频繁项集并行挖掘策略PARM,实现频繁项集的并行化分组过程,从而提高数据处理的运行效率.在此基础上,提出基于剪枝前缀推论的整
实体对齐表示在不同的知识图谱中查找引用相同现实身份的实体.目前主流的基于图嵌入的实体对齐方法中的对齐实体通常具有相似的属性,有效利用属性信息可提升实体对齐效果,同时由于不同知识图谱之间的知识分布差异,仅考虑单个方向的对齐预测会导致预测结果出现偏差.针对上述问题,提出一种改进的跨语言实体对齐方法.利用融合属性信息的双向对齐图卷积网络模型,将前馈神经网络编码实体对应的属性信息与初始的实体嵌入相结合,得到联合属性信息的实体表示,并使用双向对齐机制实现跨语言的实体对齐预测.在3个跨语言数据集上的实验结果表明,该方
以降低软件高速缓存侧信道对用户的危害指数,提升软件的防御能力为目的,研究移动终端软件高速缓存侧信道脆弱性识别方法.通过信号渗透率挖掘脆弱点,转换数据流脆弱点为网络关键节点,以节点度为依据,利用判决门限保持虚景概念和漏检概念平衡.通过筛选节点挖掘缓存侧信道脆弱点,比较其可能存在的不同缓存访问地址,根据脆弱点的可利用性,实现移动终软件高速缓存侧信道脆弱性的识别判断.仿真结果表明,上述方法具备较强的脆弱点识别能力,检测出脆弱点数量较多,同时具备较强的信号抗干扰能力及识别效率,可有效提升信号响应性能和脆弱点识别能
知识图谱在医疗、金融、农业等领域得到快速发展与广泛应用,其可以高效整合海量数据的有效信息,为实现语义智能化搜索以及知识互联打下基础.随着深度学习的发展,传统基于规则和模板的知识图谱构建技术已经逐渐被深度学习所替代.梳理知识抽取、知识融合、知识推理3类知识图谱构建技术的发展历程,重点分析基于卷积神经网络、循环神经网络等深度学习的知识图谱构建方法,并归纳现有方法的优劣性与发展思路.此外,深度学习虽然在自然语言处理、计算机视觉等领域取得了较大成果,但自身存在依赖大规模样本、缺乏推理性与可解释性等缺陷,限制了其进
使用特定数学模型的路由转发算法难以满足用户多样化的服务质量需求,基于深度学习的智能路由方案因具有准确性、高效性、通用性等优势,成为路由决策的发展方向.然而,目前多数智能路由算法在网络拓扑动态变化时需要重新训练,造成路由更新不及时,难以应对网络拓扑动态变化.提出一种基于图卷积神经网络(GCN)的智能路由算法.线下利用提前采集的网络信息,根据路由开销标签训练GCN智能路由模型,通过该模型输出单跳路由开销.线上采集实时信息并根据模型输出的路由开销结果对网络层路由协议进行调整,计算最小路由开销的路由路径,实现自适
COVID-19的世界性大流行对整个社会产生了严重的影响,通过数学建模对确诊病例数进行预测将有助于为公共卫生决策提供依据.在复杂多变的外部环境下,基于深度学习的传染病预测模型成为研究热点.然而,现有模型对数据量要求较高,在进行监督学习时不能很好地适应低数据量的场景,导致预测精度降低.构建结合预训练-微调策略的COVID-19预测模型P-GRU.通过在源地区数据集上采用预训练策略,使模型提前获得更多的疫情数据,从而学习到COVID-19的隐式演变规律,为模型预测提供更充分的先验知识,同时使用包含最近历史信息