基于统计机器学习的互联网暗链检测方法

来源 :计算机应用研究 | 被引量 : 6次 | 上传用户：gdgyhp

【摘要】

：

互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索

【作者】

：

孟池洁王伟耿光刚

【机构】

：

中国科学院计算机网络信息中心,中国互联网络信息中心

【出处】

：

计算机应用研究

【发表日期】

：

2015年09期

【关键词】

：

暗链链接隐藏方式锚文本机器学习文本分类 hidden hyperlink hyperlink hiding techniques anchor te

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于语义的物流云服务发现技术研究

针对云物流系统中物流云服务的发现需求,依据本体论的基本原理和云物流系统中云服务和物流任务的特点,给出了物流云服务和云物流任务的本体形式化描述方法,设计了物流云服务发现模型的流程图。同时构建了物流云服务领域本体,提出了整合语义解析、本体推理、功能匹配算法和非功能匹配算法的物流云服务发现算法,该算法在不同阶段设置不同阈值,过滤低于阈值的服务,减少下一阶段物流云服务的匹配样本数量,从而降低运算复杂度。通

期刊

物流云服务形式化描述服务发现领域本体语义logistics cloud service formalization service disco

基于引用启发式和URL语义相结合的会话识别方法

会话识别是Web日志的用户行为分析的关键步骤,精准的会话识别是有效进行用户行为分析的基础。已有的会话识别方法不能有效地动态适应不同的用户(如多IP单用户、单IP多用户)行为,在Web日志分析的基础上,提出了一种基于引用启发式和URL语义相结合的会话识别方法。实验结果表明,改进后的会话识别方法能更有效地识别出用户的真实会话。

期刊

WEB日志挖掘会话识别数据预处理引用启发式URL语义Web mining session identification data pre-proces

基于R-SVM与SVDD的部位外观模型

为克服现有基于HOG特征的部位外观模型未考虑不同细胞单元的不同作用以及不能准确表征相似度的缺陷,提出了一种基于递归支持向量机(R-SVM)和支持向量数据描述(SVDD)算法的人体部位外观模型。所提外观模型由两个分类器构成,利用R-SVM进行特征选择并建立的分类器用于判断图像某区域是否属于人体部位类,利用SVDD建立的相似度分类器用于计算属于人体部位类的图像区域与外观模型的相似度。将所提部位外观模型

期刊

人体姿态估计部位外观模型递归支持向量机支持向量数据描述梯度方向直方图human pose estimation part appearance mo

一种分层次B帧双向预测直接模式

分层次B帧是一种基于闭环运动补偿的时域可伸缩性视频编码,其特点是解码重构后的B帧可作为参考帧。针对分层次B帧的特点,提出一种新的B帧双向预测直接模式。通过挖掘相邻帧间的时域相关性,利用B帧作为参考帧时的前后向运动矢量进行时域缩放,精细当前块在直接模式下的运动矢量精度。仿真实验证明,该方法相对于传统的编码方式,编码性能增益平均提高0.46 d B。

期刊

可伸缩性视频编码分层次B帧运动补偿时域滤波B帧预测模式直接模式双向预测scalable video coding hierarchical B p

广义非局部均值算法的图像去噪

NLM(non-local means)滤波成为图像去噪关注的热点。该方法利用在图像中的结构特征冗余,对消除白噪声的效果较好,但对有色噪声效果不理想。对其作了改进,引入广义高斯分布模型以及马氏距离来取代欧氏距离,并且将其推广到图像序列的去噪领域中。结果表明,相较于NLM方法,该方法能够较好地抑制有色噪声,明显地改善了去除噪声效果,在保留图像纹理边缘的同时,有效地去除了图像中的噪声信息。

期刊

图像去噪广义高斯模型信噪比非局部均值image denoising generalized Gaussian model signal to noi

云存储中基于对称谓语加密的可控隐私保护搜索方案

针对传统加密方法在搜索云服务器数据时存在的效率不高和密钥泄露问题,提出了一种具有可控隐私保护搜索函数的对称谓语加密算法。首先,密钥所有者公布一些公共参数,并生成主密钥;然后,服务器端检查密文的属性是否满足令牌的谓语,并利用谓语令牌搜索匹配的密文;最后,密钥所有者或受委托人利用解密程序获取相应的明文。安全性分析表明,该方案在语义安全、属性隐藏和密钥保密方面都具有较好的安全性;性能比较表明,相比其他几

期刊

云存储对称谓语加密可控隐私保护授权搜索语义安全属性隐藏cloud storage symmetric predicate encryption

基于坡度的鲁棒优化方法

提出一种基于坡度的鲁棒性评价指标,通过三阶反距离平方权差分算法计算坡度,以坡度指标来反映函数的变化趋势和平滑程度,从而设计了一种求解鲁棒优化问题的多目标进化方法,仿真实验证明其有效性。实验还表明该方法在解的分布性与区分度上更有优势。

期刊

进化算法鲁棒优化问题坡度工程最优性鲁棒性evolutionary algorithms robust optimization problem（ROP

矩阵奇异值和矩阵范数的保密计算服务协议

鉴于目前尚未研究矩阵奇异值和范数的保密计算,提出了矩阵奇异值和范数的保密计算服务协议,将矩阵作变换后,求出矩阵特征值,进而保密地求出矩阵奇异值和范数。通过广泛接受的

期刊

保密计算服务协议矩阵奇异值矩阵范数保密性secure computation service protocol matrix singular v

高质量重建海洋微生物数字同轴全息图的研究

数字全息技术在海洋微生物的研究中占据越来越重要的位置,然而获得的数字全息图常常受到条纹噪声和散斑噪声的影响,进而对微生物重建像的质量造成严重影响。另外重建像还会受到重建距离的影响。为了获得高质量的数字全息重建像,首先利用局部阈值法对数字全息图频谱进行处理,以抑制条纹噪声;然后利用比值聚焦函数取极小值法对重建距离进行确定,并计算其重建像;最后通过Lee滤波对重建像进行处理,以抑制散斑噪声的影响。实验

期刊

数字全息术条纹噪声自动聚焦散斑噪声局部阈值法digital holography stripe noise auto focus speckle

基于统计机器学习的互联网暗链检测方法

其他学术论文