【摘 要】
:
针对高维数据的聚类问题,提出一种基于间隔Fisher分析(MFA)的半监督聚类算法。该算法首先使用已标记样本进行MFA映射,得到投影矩阵W后,再利用求得的投影方法对未标记样本进行降维;然后在低维空间引入基于约束的球形K-means(PCSKM)算法对降维后的数据进行半监督聚类,根据第一次的聚类结果,交替进行降维与聚类操作,直到算法收敛为止。该算法利用监督信息有效地集成了数据降维和半监督聚类。实验结
【机 构】
:
山东师范大学信息科学与工程学院,山东省分布式计算机软件新技术重点实验室,山东师范大学管理科学与工程学院
【基金项目】
:
国家自然科学基金资助项目(61170038), 山东省自然科学基金资助项目(ZR2011FM001), 山东省软科学重大项目(2010RKMA2005)
论文部分内容阅读
针对高维数据的聚类问题,提出一种基于间隔Fisher分析(MFA)的半监督聚类算法。该算法首先使用已标记样本进行MFA映射,得到投影矩阵W后,再利用求得的投影方法对未标记样本进行降维;然后在低维空间引入基于约束的球形K-means(PCSKM)算法对降维后的数据进行半监督聚类,根据第一次的聚类结果,交替进行降维与聚类操作,直到算法收敛为止。该算法利用监督信息有效地集成了数据降维和半监督聚类。实验结果表明,该方法能够有效处理高维数据,同时能提高聚类性能。
其他文献
以流道间隙处熔体体积均匀变化为条件,对管材挤出成型机头内腔的形状曲线进行了分析优化,并且导出了一个优化曲线。
鉴于特征属性选择在网络流量分类中占据重要地位,为了确定最优特征子集,利用CFS作为适应度函数的改进遗传算法(GA-CFS),从网络流量的249个属性空间中提取主要属性并最终选定18个特征组合作为最优特征子集。通过AdaBoost算法把一系列的弱分类器提升为强分类器,对网络流量进行了深入的分类研究。实验结果表明,基于GA-CFS和AdaBoost的流量组合分类方法较弱分类器具有较高的分类准确率。
在现存的多层路由中,上层Overlay网络在路由决策时通常对底层的IP网络性能和状态缺乏有效的协调和感知,致使上层Overlay路由和底层IP路由常常处于非协同、非优化工作状态,产生大量路由抖动和次优路由。为解决这些问题,提出了一种底层IP网络友好的Overlay路由机制,其基本思路为:增加Overlay网络的层感知能力,减少路由抖动,增加Overlay路由的稳定性。Overlay网络根据底层IP
为解决状态空间系统的预报误差与系统参数之间的非线性、非凸性给参数估计带来的困难,提出了状态空间系统的梯度优化辨识方法。分析了基于局部线性化的梯度辨识原理,给出了基于QR分解、奇异值分解(SVD)确定参数搜索方向的实现方案,得到了估计系统参数的迭代辨识算法。探讨了算法的收敛性,给出了算法收敛速度的解析表达式,最后进行了数值仿真,实验结果说明了所提出方法的有效性。
转换乘法为平方运算,是一种快速计算椭圆曲线密码点乘的代数方法。利用此方法,提出了素域Fp上雅可比坐标系下的3P和3kP算法,其运算量分别为6[M]+10[S]和(6k)[M]+(10k)[S],与已有的最好算法相比,算法效率分别提升了11.8%和10.5%。另外,还在文献[1,2]基础上,对素域Fp上仿射坐标系下的2kP和3kP的算法进行了改进,其算法效率比文献[1,2]分别提高了6.3%和3.3
本文介绍了从零件加工工艺过程角度出发,利用工艺尺寸链作综合分析和计算,合理地确定加工过程中各工序余量、工序尺寸及公差,为工艺设计提供了更加经济、合理的工艺参数,较好地解
2012年01月05日,恩德斯豪斯-中国,2012迎新答谢酒会及媒体见面会伴着冬日和煦的阳光在北京亦庄隆重举行。公司领导及员工代表、自动化仪表学会及协
针对互联网中常见的VoIP应用类型,重点从分类特征的选取出发,提出了一种基于C4.5决策树算法的VoIP流量识别方法,并分别利用模拟数据和真实网络数据对其进行了测试。结果表明,
为解决应急物流组织的知识共享及互操作问题,基于ABC上位本体,定义了应急物流本体模型ELO_Ontology,形式化表示为应急物流组织概念、关系、函数、公理和实例的五元组。最后,以四川省汶川大地震中的应急物流组织片段为实例进行了知识表示,结果表明,ELO_Ontology模型能够有效构建应急物流组织的知识体系。
当输入维数高时神经网络结构复杂、体系庞大,导致其收敛速度慢。为克服这个缺点,提出了基于决策规则的神经网络,利用粗糙集理论从数据样本中获取最简的决策规则,按决策规则语义构建一种不完全连接的神经网络。根据决策语义规则,计算并初始化网络的参数,减少网络训练的迭代次数、提高网络的收敛速度;同时利用蚁群算法对网络输入的连续属性的最优离散化值进行寻优,从而获得最优的网络结构。最后通过实验结果将本文方法与传统神