基于PCA和K-均值聚类的有监督分裂层次聚类方法

来源 :计算机应用研究 | 被引量 : 16次 | 上传用户:XDCHZHTXZHY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新的基于PCA和K-均值聚类的有监督二叉分裂层次聚类方法PCASHC,用K-均值聚类进行逐次二叉聚簇分裂,选择PCA第一主成分相距最远样本点作为K-均值聚类初始聚簇中心,解决了K-均值聚类初始中心随机选择导致结果不确定的问题,用聚簇样本类别方差作为聚簇样本不纯度控制聚簇分裂水平,避免过拟合,可学习到合适的聚类数目。用四组UCI标准数据集对其进行了10折交叉验证分类误差检验,与另外七种分类器相比说明PCASHC有较高的分类精度。
其他文献
针对现有的门限秘密共享方案在处理参与者集合动态变化时灵活性差和许多多重秘密共享方案不能一次恢复出多个秘密(需要进行很多轮的计算)这两个缺点,提出了一个新的方案,给出了一个简单实用的La-grange插值的方法。该方案可以动态添加或删除参与者,无须重新分发子秘密,参与者的子秘密由自己选取和保存,可以在不安全的环境中传送;同时公开的只是子秘密的影子,子秘密可以重复再用,在秘密的恢复阶段可以一次恢复多个
提出了一种光谱图像的快速获取和有效压缩算法。将一幅三原色图像转换为光谱图像,其像素被通过查找光谱调色板后所确定的相应的光谱反射因子取代,该反射因子的色度值与原像素最为接近。此时转换所得的图像并没有真实光谱数据而只有基于调色板的伪光谱值,它可用于模拟原始RGB图像在不同光源条件下的颜色外观。奇异值分解法对于光谱图像的压缩是非常有用的,人们可以对局部子块图像中经过重新排列后的36个像素×36个光谱波段
采用Gleeble3800热模拟机对TRIP钢拉伸试样进行不同工艺条件的快速热处理模拟实验,并采用金相分析、显微硬度测试等方法对试样进行组织观察和性能测试,目的是通过适宜的热处
为了量度硼工业生态化进程中所处的发展阶段、存在的差距以及可以采取的有效措施,本研究建立了一个多维度的综合性评价指标体系及模糊综合评价方法,并以辽宁硼工业为例进行了
通过光学显微镜、扫描电镜和X射线衍射仪研究了Mg-5Sn-5Zn-xSr(x=0,0.5,1,2)4种铸造镁合金的显微组织和相组成.结果表明:在Mg-5Sn-5Zn合金中加入质量分数为0.5%~2%的Sr元素后,不
用焦炉煤气生产直接还原铁既可解决气源问题,又可高效利用焦炉煤气.目前我国还没有成熟的焦炉煤气竖炉法生产直接还原铁工艺,本文通过热力学分析,从还原剂和载热体两方面来探
通过水模型实验和数值模拟,研究了两流非对称中间包采用不同控流装置时流体流动的特性.结果表明:圆形湍流控制器与单挡墙组成的控流装置中间包两出口流体流动差异较大;非对称
采用云南东川天然立方体黄铁矿,用透射电子显微镜(TEM)选区电子衍射对黄铁矿结构进行表征.沿黄铁矿的200,202和111等为轴倾转得到一系列电子衍射谱:沿200倾转得到[001][012][
针对Vega Prime自带海洋模块中海浪随机性不强和海面网格划分简单的不足,以OpenGL为基础将基于Perlin噪声的海面仿真应用到Vega Prime中。Perlin噪声的生成采用计算机运算最快的位运算方法,减小海面高度场的计算时间;通过采用投影网格的方法实现视点相适应网格的计算,生成自然的投影网格,并利用CG对显卡编程进行实时光照渲染。测试结果表明该方法的帧数大于Vega Prime(ve
针对DEM数据的特点,研究适合地形绘制的小波基函数的选择;针对地形绘制中不同分辨率地形平滑过渡的视觉要求,研究基于视点距离和地形复杂度的小波系数阈值筛选和小波渐近重构方法。分析了由于分块小波变换而带来的几种边界问题,并提出了相应的解决方法。最后提出了基于硬件加速的小波变换算法,以提高实时绘制的效率。