社交网络下的垃圾信息处理算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:chenshunsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着Web2.0的发展,社交网络在人们的生活中扮演了越来越重要的角色,如今主流的社交网络平台有新浪微博、百度知道、微信、QQ、一直播、知乎、豆瓣等,同时,随着手机等通讯工具的普及,为人们随时随地通过网络进行网上阅览、分享信息、互动提供了便利。然而,正是这种便利性,催生了一大批垃圾用户,这些用户在平台上发布恶意链接、推广虚假广告、恣意中伤他人、传播各类谣言等等,严重影响了用户体验,给人们的生活带来了困扰,其消极影响愈加显著。因此,如何识别并检测这些恶意用户、屏蔽垃圾内容,成为当下研究的热点问题。本文选取了时下主流的社交平台——新浪微博,以及知识共享平台——百度知道,利用机器学习技术以及排序思想分别对两个平台的垃圾信息进行处理,设计了针对微博的垃圾信息检测算法以及针对百度知道的隐性垃圾答案沉降算法。本文的主要内容如下:首先,介绍了社交网络的定义发展以及常见的网络中的垃圾信息问题,分别针对微博和问答网站进行了垃圾问题概述,包括垃圾信息的分类、处理技术。其次,针对微博中的垃圾信息,提出了基于颜色的可视化垃圾行为特征提取和基于词项黑名单的垃圾内容特征提取,同时,在这两种特征集合的基础上,提出了基于贝叶斯网络的垃圾信息检测算法。实验证明,基于贝叶斯网络的垃圾信息处理算法分类结果要优于朴素贝叶斯算法,同时优于分别针对垃圾行为和垃圾内容检测的算法。最后,针对问答网站中的垃圾信息,先将垃圾答案分为显性和隐性,对较难用技术手段分类的隐性垃圾答案提出了沉降算法,引用物理学物体下落的思想,结果证明,该算法能够有效地将垃圾答案沉到答案序列的底端。
其他文献
设施布置问题的优化研究广泛存在于制造企业中,在实际的应用中,设施布置的优劣严重影响着企业的生产成本与效率。随着经济技术、经济全球化的发展以及全球化市场环境的全面形成
Robonova-I是高性能的仿人形机器人,主要用于教学、竞赛与娱乐等领域。Robonova-I除了可以用脚走路外,更可以表现各种高难度的仿人动作,可实现跑步,翻跟头(侧翻、前滚翻、后
每当谈到学生语文素养的培养,一个具有东方文化特质的字——“悟”,便会浮现在我的脑海里。悟是什么?悟是主体通过感受、理解、体会而获得的一种能触类旁通的知觉或直觉,是主客体的交融、渗透与契合,是一种独特的认知方式和审美体验,通俗地说,就是心领神会。  就语文学习来说,悟是阅读主体对语言材料直觉的、整体的把握,是言语体悟与生命体验的融合。语言的领悟力是语文能力的核心。由于一直以来在教学中充斥着大量单调乏
期刊
随着林业技术的发展,林业种植与管理正逐步从粗放经营向集约化经营过渡,林业种植的单位面积产量和质量也随之提高,这也成了当今世界林业发展的重要趋势之一。本文主要从速生杉木