基于谱聚类的虚假评论群组检测

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:hrbhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了从数据集更有效地检测出虚假评论群组。提出一种基于谱聚类的检测算法。对数据集中的多维数据样本进行分析,确定衡量用户之间相似程度的指标;利用用户相似度指标构造一幅以用户为节点、用户之间相似度为边上权值的带权评论者图;将该图的邻接矩阵作为相似度矩阵,利用谱聚类算法对其进行群组检测,将所有用户分为15个候选群组;对检测出的候选群组进一步挖掘,分析其内部特征。将不同方法检测得到的候选群组内部特征进行比较,结果表明该算法具有更高的有效性。
其他文献
针对知识图谱(KG)在知识驱动的人工智能研究中发挥的强大支撑作用,分析并总结了现有知识图谱和知识超图技术。首先,从知识图谱的定义与发展历程出发,介绍了知识图谱的分类和架构;其次,对现有的知识表示与存储方式进行了阐述;然后,基于知识图谱的构建流程,分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节,分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外,以
基于嵌入式系统设计课程知识点多、硬件型号繁多、结构差异、软件与硬件结合紧密的特点,分析理论教学与实践教学中的问题、主动学习与被动学习的关系,提出半翻转课堂、立体化
目前区间值信息系统的不确定性度量方法大多基于粗糙集的粗糙度度量。实例分析表明该度量方法不满足严格单调性,为了解决这一缺陷,将粒计算方法引入区间值信息系统中,提出一种区间值信息系统的信息粒化模型。引入区间值信息系统的知识粒度和粗糙熵两种度量方法,理论分析出它们具有的严格单调性,在区间值信息系统的不确定性度量方面具有更好的优越性。实验验证了知识粒度和粗糙熵均比传统的粗糙度具有更好的不确定性度量效果。
地理信息系统是由采集、储存、管理、分析、描述和应用于一体的一种重要手段,主要用于获取全部或部分地球表面地理空间分布的数据信息,属于当今最先进的计算机软件系统,在城
轨迹推荐在轨迹数据挖掘中尤为重要,可以帮助用户从大量轨迹数据中快速找到满足用户需求的路线。现有的轨迹推荐方法通常是在原始轨迹数据上考虑特定代价标准最优的前提下返回出行路线,无法体现不同用户的不同行为习惯。针对此问题,将用户前后连贯的活动刻画为行为,提出基于矩阵分解的用户行为概率学习方法。基于学习的用户行为概率,将寻找概率最大路线问题转换为在行为图中寻找最短路径的问题。在真实数据集进行一系列实验,验
针对大数据技术课程教学存在的典型问题,基于OBE理念提出教学目标和评价方案,并以学生问卷调查入手,从平台层、数据层、预处理层、模型算法层、应用层及数据可视化分析层介绍大数据技术实践架构的创新设计,全面阐述课程的3个实验项目设计内容与要求,并给出线上实验指导与评价方法。在综合设计方面提出全面参与竞赛的项目策划,分别以全国大数据应用创新竞赛和“手写数字识别”项目为例,说明竞赛项目的良好效果。
为了改善云平台中多工作流调度时的执行代价和资源利用率,提出一种满足实时云任务需求的主动响应式工作流调度算法。该算法可以分别针对新工作流的到达、任务完成后的虚拟机资源提供、紧迫任务到达等做出主动的实时响应调度策略,从而充分利用虚拟机资源的空闲时槽和更大化的任务并行程度,以混合形式调度来自不同工作流的任务。在确保截止期限约束的同时,有效满足实时云任务的调度需求。大量实时工作流的仿真测试表明,与另外几种
先前事件检测算法需要大量训练样本并且不能动态检测事件。为了从微博短文本中检测金融事件,提出一种从微博中检测公司金融事件的新模型。结合词嵌入与数据流集成分类算法,词嵌入和触发词典用于中文微博文本表示。带有动态时间窗的集成数据流分类算法(DSESVM)用于在线事件分类,大大减少了训练数据并动态检测事件。使用五家上市公司的微博文本作为语料库进行测试,实验结果表明,该方法不仅降低了训练样本的比例,还检测了
为了系统地了解类脑神经网络电路,在对类脑神经网络进行简要介绍的基础之上,重点阐述两种类别的神经形态器件及功能,包括不同类型的浮栅管和不同工艺材料的忆阻器来模拟单个神经元和突触可塑性功能;然后,以神经形态器件为基础,分别介绍了基于浮栅管和忆阻器实现神经网络电路;最后总结当前神经形态器件及类脑神经网络芯片存在的问题,并对有关类脑计算研究方向进行了展望。
基于空间非迭代的Oseen格式,以软件FreeFem++的MPI功能为平台,提出时间解耦的局部并行方法来求解Navier-Stokes/Navier-Stokes耦合方程。通过解耦复杂区域,将耦合方程的求解转换为并行区域上单一非定常Navier-Stokes方程的求解。在空间上利用Oseen格式一步线性校正,时间上按照步长直接推进。数值实验表明,与空间非迭代Oseen格式的欧拉时间推进方法相比,该