【摘 要】
:
互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索
【机 构】
:
中国科学院计算机网络信息中心,中国互联网络信息中心
论文部分内容阅读
互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索引擎打击链接隐藏的作弊行为提供了理论和实践支撑。
其他文献
针对云物流系统中物流云服务的发现需求,依据本体论的基本原理和云物流系统中云服务和物流任务的特点,给出了物流云服务和云物流任务的本体形式化描述方法,设计了物流云服务发现模型的流程图。同时构建了物流云服务领域本体,提出了整合语义解析、本体推理、功能匹配算法和非功能匹配算法的物流云服务发现算法,该算法在不同阶段设置不同阈值,过滤低于阈值的服务,减少下一阶段物流云服务的匹配样本数量,从而降低运算复杂度。通
会话识别是Web日志的用户行为分析的关键步骤,精准的会话识别是有效进行用户行为分析的基础。已有的会话识别方法不能有效地动态适应不同的用户(如多IP单用户、单IP多用户)行为,在Web日志分析的基础上,提出了一种基于引用启发式和URL语义相结合的会话识别方法。实验结果表明,改进后的会话识别方法能更有效地识别出用户的真实会话。
为克服现有基于HOG特征的部位外观模型未考虑不同细胞单元的不同作用以及不能准确表征相似度的缺陷,提出了一种基于递归支持向量机(R-SVM)和支持向量数据描述(SVDD)算法的人体部位外观模型。所提外观模型由两个分类器构成,利用R-SVM进行特征选择并建立的分类器用于判断图像某区域是否属于人体部位类,利用SVDD建立的相似度分类器用于计算属于人体部位类的图像区域与外观模型的相似度。将所提部位外观模型
分层次B帧是一种基于闭环运动补偿的时域可伸缩性视频编码,其特点是解码重构后的B帧可作为参考帧。针对分层次B帧的特点,提出一种新的B帧双向预测直接模式。通过挖掘相邻帧间的时域相关性,利用B帧作为参考帧时的前后向运动矢量进行时域缩放,精细当前块在直接模式下的运动矢量精度。仿真实验证明,该方法相对于传统的编码方式,编码性能增益平均提高0.46 d B。
NLM(non-local means)滤波成为图像去噪关注的热点。该方法利用在图像中的结构特征冗余,对消除白噪声的效果较好,但对有色噪声效果不理想。对其作了改进,引入广义高斯分布模型以及马氏距离来取代欧氏距离,并且将其推广到图像序列的去噪领域中。结果表明,相较于NLM方法,该方法能够较好地抑制有色噪声,明显地改善了去除噪声效果,在保留图像纹理边缘的同时,有效地去除了图像中的噪声信息。
针对传统加密方法在搜索云服务器数据时存在的效率不高和密钥泄露问题,提出了一种具有可控隐私保护搜索函数的对称谓语加密算法。首先,密钥所有者公布一些公共参数,并生成主密钥;然后,服务器端检查密文的属性是否满足令牌的谓语,并利用谓语令牌搜索匹配的密文;最后,密钥所有者或受委托人利用解密程序获取相应的明文。安全性分析表明,该方案在语义安全、属性隐藏和密钥保密方面都具有较好的安全性;性能比较表明,相比其他几
提出一种基于坡度的鲁棒性评价指标,通过三阶反距离平方权差分算法计算坡度,以坡度指标来反映函数的变化趋势和平滑程度,从而设计了一种求解鲁棒优化问题的多目标进化方法,仿真实验证明其有效性。实验还表明该方法在解的分布性与区分度上更有优势。
鉴于目前尚未研究矩阵奇异值和范数的保密计算,提出了矩阵奇异值和范数的保密计算服务协议,将矩阵作变换后,求出矩阵特征值,进而保密地求出矩阵奇异值和范数。通过广泛接受的
数字全息技术在海洋微生物的研究中占据越来越重要的位置,然而获得的数字全息图常常受到条纹噪声和散斑噪声的影响,进而对微生物重建像的质量造成严重影响。另外重建像还会受到重建距离的影响。为了获得高质量的数字全息重建像,首先利用局部阈值法对数字全息图频谱进行处理,以抑制条纹噪声;然后利用比值聚焦函数取极小值法对重建距离进行确定,并计算其重建像;最后通过Lee滤波对重建像进行处理,以抑制散斑噪声的影响。实验