双结构网络中基于深度学习的新闻推荐技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:redblackzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,互联网上的信息正以指数级速率爆炸性增长,人们越来越难以为自己有限的需求快速地找到有用的信息,摆脱垃圾信息的困扰。双结构网络主张在互联网主结构的基础上增加基于“辐射-复制”模型的播存次结构,以物理变革和二元结构的创新思路对当前互联网主结构实施“深度去冗”,并提供个性化信息服务,以帮助用户快速选取有用信息。传统基于用户的协同过滤方法,先计算用户和用户的相似度,然后给用户推荐和他相似的用户浏览过的物品,整个计算过程严重依赖用户物品评分矩阵,如果评分矩阵过于稀疏就会导致相似性计算的不准确,难以直接运用在双结构网络个性化推荐服务中。因此,如何在最大程度避免数据稀疏性问题和冷启动问题的影响,并快速地产生准确的推荐信息是双结构网络推荐机制面临的一个难题。针对双结构网络的需求和特点,本文设计了一种面向双结构网络的基于深度学习的协同过滤算法(Deep Learning Based Collaborative Filtering Algorithm For Dual-Structural Network,DLCFA-DSN)以帮助用户进行个性化信息推荐。将卷积神经网络引入信息分类领域,设计了一种多分支卷积神经网络(Multi Branch Convolution Neural Network,MBCNN)进行新闻信息分类。在此基础上提出一种基于边缘去噪自动编码机的协同过滤算法(Margialized Denoising Autoencoder Collaborative Filtering Algorithm,MDACFA)部署于边缘服务器。为进一步提升推荐效果,提出T-WORD2VEC推荐算法在用户终端深入挖掘个体用户兴趣爱好。具体如下:1)针对传统分类算法难以对新闻网页准确分类,影响到双结构网络中推荐效果的问题,提出了一种多分支卷积神经网络MBCNN算法进行新闻信息分类。首先进行网页预处理提取出文本特征。然后从新闻网页源代码中抽取出HTML特征,之后将HTML特征和文本特征融合后输入MBCNN算法进行分类。MBCNN包含多个MbcModule,每个MbcModule拥有5个分支,每个分支学习不同特征增强了模型的表达能力。最后针对MBCNN算法定义其损失函数,提出其训练算法,将MBCNN分类结果封装成UCL发送到边缘服务器作为推荐算法的输入。2)针对传统推荐算法难以适应双结构网络的特定需求,提出一种面向双结构网络的基于深度学习的协同过滤算法DLCFA-DSN,包括MDACFA协同过滤算法部署于于边缘服务器,将MBCNN分类结果作为物品属性特征,输入MDACFA协同过滤算法。针对MDACFA算法定义其损失函数,利用物品和用户属性特征拟合评分矩阵进行训练,训练完成后只需物品属性特征和用户属性特征便可计算出评分信息,能够避免评分数据稀疏性对算法带来的影响,在一定程度上解决了冷启动问题。为进一步提升推荐效果,提出T-WORD2VEC推荐算法在用户终端深入挖掘个体用户兴趣爱好。3)在双结构网络原型系统的基础上,设计并实现了基于上述算法的双结构网络新闻信息推荐系统,并在相关数据集上对MBCNN和DLCFA-DSN算法的可行性及其性能进行了验证。实验结果表明,MBCNN算法可以对新闻信息进行有效地分类,相比于传统机器学习分类算法,准确性更高。DLCFA-DSN算法能够充分结合双结构网络特点,相比于传统的推荐算法受数据稀疏性问题影响更小,准确率更高。
其他文献
目的:通过探索两种不同无创通气策略治疗新生儿呼吸窘迫综合征(NRDS)的疗效,进一步探索无创通气失败预测因素及相关病原菌的分布特点,为NRDS患儿寻找更好的通气方案及抗感染治疗提供理论依据。方法:1.选取2017年10月-2020年1月中国人民解放军南部战区总医院NICU收治的148例NRDS患儿,排除出生48小时内无创通气失败44例,最终纳入104例NRDS患儿。根据不同通气策略,将104例NR
加工制造企业处于实现原材料价值增值的中间环节,其盈利能力和盈利空间是有限的,加工制造企业主要通过控制加工成本实现货物价值增值以及企业利润,生产性物资管控是加工制造
目前,农地流转问题受社会各界人士重视。伴随社会经济的发展,自给自足的小农经济无法满足日益增长的社会物质需求,农地流转顺势而生。农地流转的产生,重新分配和组合各个生产
中国画作为中国独具特色的绘画,展现了多姿多彩和百家争鸣的景象,尤其是中国工笔画的快速发展,更彰显了中国画的博大精深。随着当今经济与文化的不断发展,工笔画也融入了更多
为了应对当今建材紧缺问题,同时满足发展绿色混凝土的要求,选取瓷砖行业产生的抛光瓷砖粉废料为研究对象,将其进行粉磨处理,得到3种不同细度的抛光瓷砖粉,将其作为矿物掺合料用于胶凝材料中,研究其对于水泥净浆、砂浆及混凝土的工作性能、力学性能和耐久性的影响。主要结论如下:1.对抛光瓷砖粉进行粉磨可以改善其颗粒粒形,使其更加圆润,并且可以显著降低抛光瓷砖粉的平均粒径和粒径分布跨度。2.不同细度的抛光瓷砖粉对
毫微微蜂窝网络,又称为家庭蜂窝网络,在增加无线网络的系统容量、提高无线网络覆盖率方面提供了一个有效的解决方案。其低成本、低功耗、易部署的优点也符合移动通信网络的发
随着科技的日益进步以及“互联网+”的迅猛发展,全球智能手机的使用频率越来越高,目前Android智能手机的市场份额已经达到85%,成为人们购买智能手机的首选。在Android智能设
职业网球发展迅速,每年赛事数量众多,级别奖金各不相同,分布在世界六大洲近四十个国家举行。整个赛季比赛周期长,场地类型繁多,休赛期短。随着2019年ATP赛制的改革,职业网球男子运动员如何通过科学合理的选赛将积分奖金最大化,以此来维持团队良性运转,便成为了一个急需解决的问题。本文运用文献资料法、专家访谈法、数理统计法、逻辑分析法、问卷调查法,对2019年职业网球男子单打运动员年度选赛的数量、胜率、级
江永,治学严谨精益求精,精通小学、经学、天文历算学等各个方面。一生蛰居徽州以著书立说、课业授徒为己任,完成著作三十九册二百六十余卷,被《四库全书》收入一百五十九卷。
在全球工业化快速发展的今天,环境污染和能源危机已越来越成为影响人们的生产生活和人与自然的和谐发展的关键问题。自从1972年Fujishima和Honda在TiO2电极上发现水的光解反