面向微博水军识别的有效特征选择

来源 :第二届中国互联网学术年会 | 被引量 : 0次 | 上传用户:ffftty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别微博水军对互联网信息安全具有重要意义,而目前对微博水军识别并没有有效和准确的特征,本文借鉴相关文献中提出的用户特征从用户静态描述属性定义了6个特征,基于用户行为构建了5个特征,以此对微博中的水军用户进行识别,并通过实验验证了本文所提特征的有效性。同时,识别水军时有很多的特征可以选择,不同的识别方法采用不同的特征。为了有效的选择识别水军的特征降低统计大量特征带来的高复杂性,本文分别采用C4.5和SVM分类器进行了单一特征、同类型特征组合、不同侧面特征组合等一系列分类试验,从提出的11种特征中选择了4种最有效特征。试验数据集来自微博的真实用户样本。试验结果表明使用本文提出的特征能较好地识别水军,行为特征优于属性特征,特征组合优于单一特征,而粉丝值、好友值,非空转发比,URL使用率4个特征组合在识别结果和计算时间取得了最佳平衡。
其他文献
“在那山的那边海的那边,有一群小股民,他们辛勤又努力,他们选股又割肉,他们不论何时上班下班都在看信息,他们偶尔还要拿跳水冠军。噢,苦B的小股民,噢,可怜的小股民……”《
适应值的逼近决定子代个体的位置,能快速找出最优个体.但容易陷入局部解,本文提出了更新个体的新策略, 使进化向高适应值区域搜索.通过引入进程实现个体不等几率地产生新个体
请下载后查看,本文暂不支持在线获取查看简介。自编手机铃声请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online
期刊
菲律宾椰子局的数据表明,2009年9月菲律宾9种非传统椰子出口产品排行榜居前列,该月出口额均达到10万美元以上。 Data from the Philippine Coconut Bureau show that in Sep
随着信息技术的快速发展,特别是大数据的出现,企业需要充分利用网络虚拟化技术带来机遇,构建自己的虚拟化平台或租用其他公司提供的虚拟数据中心。多租户共享网络作为一种新
会议
目前网络中大量服务由中间盒提供。由于中间盒会带来鲁棒性、安全性等问题,最新的研究提出可采用服务外包的形式解决中间盒带来的问题。利用FPGA平台在可重构和处理报文等方
会议
目前,主动网络测量工具一般运行于商业PC上,其成本低,但其主要适用于一般测量。测量结果的精度容易受操作系统和网卡性能的影响。所以,传统的软件方法难以满足高带宽低延迟网
由于中国从主要出口国进口复合橡胶实行了零关税政策,2009年中国的复合橡胶进口首次超过100万t。 As China introduced zero-tariff policy on imports of composite rubber
(4)因为伴音低放电路设计为 OCL 电路,确定伴音低放电路是否引起无伴音故障时,大家可以测量伴音低放电路中点电压,看看此电压是否等于伴音低放电路电源供电电压的一半。如果
良好的网络测量平台应该具备分布、被动、实时、可重构及易部署实现等特点.针对目前网络测量工具功能单一、不具系统性而网络测量平台不易部署、不可重构,获取精准网络性能参