【摘 要】
:
将SVM和KNN算法结合在一起,组成一种新的Web文本分类算法——SVM-KNN算法。当Web文本和SVM最优超平面的距离大于预选设定的阈值,则采用SVM进行分类,反之采用SVM作为代表点的KNN算法对样本分类。实证结果表明,SVM-KNN分类算法的分类精度比单纯SVM或KNN分类算法有不同程度的提高,为Web数据挖掘提供了一种有效的分类方法。
论文部分内容阅读
将SVM和KNN算法结合在一起,组成一种新的Web文本分类算法——SVM-KNN算法。当Web文本和SVM最优超平面的距离大于预选设定的阈值,则采用SVM进行分类,反之采用SVM作为代表点的KNN算法对样本分类。实证结果表明,SVM-KNN分类算法的分类精度比单纯SVM或KNN分类算法有不同程度的提高,为Web数据挖掘提供了一种有效的分类方法。
其他文献
针对传统IP时间隐蔽信道传输速率低,在广域网中缺少一种稳定的时间同步机制,难以实现收发双方间可靠、稳定传输隐蔽信息的问题,提出了一种可靠网络隐蔽信道的模型。这种信道利用在固定时间窗口内发送的IP数据包数量作为载体传输隐蔽信息。通过引入一种新的信息编码机制,显著提高了网络隐蔽信道的传输带宽。进一步提出了一种比特块定界方法,解决了传统IP时间隐蔽信道的时间同步问题。实验结果表明,提出的可靠网络隐蔽信道
针对大规模地形动态漫游提出实现流程和算法框架,基于分层分块地形LOD组织存储策略完成数据预处理,绘制阶段提出视点相关的地形调度和简化算法,利用多线程处理机制进行地形块裁剪和内外存数据交换,借助GPU硬件实现场景加速绘制算法,并提出分块地形和纹理数据的无缝拼接策略。真实数据实验的算法比较和性能测试结果表明,该方法具有支持数据量大,绘制效率高、实用性强等特点。
传统的访问控制方式已不能满足多域环境下的资源共享和跨域访问的安全需求,建立安全互操作模型是进行安全互操作的有效途径。针对现有域间安全互操作模型未考虑用户平台的问题,提出了一种基于可信等级的域间安全互操作(TLRBAC)模型。该模型引入了用户可信等级、平台可信等级和域可信等级,制定了域间安全互操作方法。分析表明该模型既保证了用户的可信接入,又能有效地控制因平台环境而引起的安全风险问题。
针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化
根据家纺花样图案设计的特点,引入等汉明重量的视觉密码,提出了一种基于视觉密码的家纺花样签证的方案。以家纺花样主次图案为平台,融数字签名、时效性、视觉密码为一体,并由可信第三方仲裁。实验表明,该方案解决了家纺花样的版权所有问题,增强了对图像内容的验证功能,提高了抗简单能量攻击的能力。
针对二维人脸识别对姿态与光照变化较为敏感的问题,提出了一种基于三维数据与混合多尺度奇异值特征MMSV(mixture of multi-scale singular value,MMSV)的二维人脸识别方法。在训练阶段,利用三维人脸数据与光照模型获取大量具有不同姿态和光照条件的二维虚拟图像,为构造完备的特征模板奠定基础;同时,通过子集划分有效地缓解了人脸特征提取过程中的非线性问题;最后对人脸图像进
在CDMA2000蜂窝网络和WLAN组成的异构无线网络中,呼叫接纳控制算法对于提高系统资源的利用率有着非常重要的作用。根据WLAN的网络负载情况和移动用户的速度来判决是否接入WLAN;提出一种基于概率机制的CAC算法,WLAN能够限制来自于蜂窝网的VHO呼叫,减少不必要的VHO处理负荷;对新呼叫阻塞率和DVHO呼叫阻塞率进行理论分析和推导。仿真结果表明,该CAC算法能够减少不必要的重复上下垂直切换
针对喷涂机器人离线轨迹规划系统中路径顺序与喷涂方向同时影响喷涂效率的特点,将喷涂路径的组合与排序问题建模成开环式广义旅行商问题,并建立了相应的代价矩阵与优化目标;提出了一种基于分布式估计的路径组合优化算法,该算法在遗传算法中引入统计学习的手段,采用基于概率的模型学习和采样算法实现更好的进化效率,从而能够更加有效地获得全局最优解。通过多组数据的仿真,验证了该算法解决路径组合问题的有效性与可行性。
针对遥感图像分类问题提出了一种基于遗传算法和K近邻的SVM决策树方法。算法以基于类分布的类间分离性测度为准则,利用遗传算法对传统的SVM决策树进行优化,生成最优(较优)决策树。在分类阶段,对容易分的节点利用SVM进行分类,而对可分离性差的节点采用SVM和K近邻相结合的分类方法,最终实现多类别分类。实验结果表明,与传统的分类方法相比,该算法的实验效果较好,可有效地提高遥感图像的分类精度。
针对图像融合效果评价问题,将处理模糊信息的中介数学系统引入到图像融合效果评价中,以中介真值程度的数值化度量为基础,提出了一种基于中介真值程度的图像融合效果评价方法。该方法结合先验知识和选取的定量评价指标,并引入了理想融合图像的概念,以中介真值程度的数值化度量中的距离比率函数度量作为图像融合结果的优劣评判标准,实现对各个融合图像效果的综合评价,兼顾了实际评价工作中的通用性和特殊性要求。实验结果表明,