类保持拉普拉斯特征映射维数约简方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wwkuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今科学技术的迅猛发展,高维海量数据的现象使得维数约简成为人们关注的焦点。拉普拉斯特征映射(LE)是一种经典的非线性维数约简方法,它在降维过程中保持原数据集的局部近邻关系。尽管LE及改进的方法已经被广泛地应用在分类、人脸识别、可视化等众多领域,但仍存在对参数敏感、只考虑数据局部结构等问题,从而在降维过程中不能很好地保持数据的类结构。本文在经典LE及现有的改进的LE方法基础上,通过自适应地构造同类近邻样本阈值和异类近邻样本阈值,并将信息熵和粗糙模糊集理论引入到非线性降维方法中,提出了两种具有类保持特性的拉普拉斯特征映射维数约简方法,具体研究内容如下。针对具有类标记信息的全监督数据集,本文通过自适应地分别确定同类样本近邻和异类样本近邻结构提出了有监督类保持拉普拉斯特征映射维数约简方法(SCPLE)。该方法依据数据集的类信息、同类样本间相似度及异类样本间差异自适应地构造出两个近邻图:类内近邻图和类间近邻图,确保同类近邻图的边权值大于0.5。通过同时最大化异类近邻样本之间距离和最小化同类近邻样本之间距离,SCPLE可使降维后同类样本被映射的更近,异类样本被映射的更远,且保持原数据集的类结构。将SCPLE方法与三种常用的非线性降维方法在4个人脸数据集上进行对比实验,实验结果验证了SCPLE方法的有效性和优势。针对半监督类标记信息的数据集,本文将信息熵和粗糙模糊集理论引入到非线性降维中提出了半监督粗糙模糊拉普拉斯特征映射维数约简方法(SSRFLE)。基于信息熵理论确定数据集中样本属性的权重,并通过建立数据集的模糊相似性矩阵及近邻粗糙模糊集模型确定样本间的权值,构造出刻画样本间近邻结构和样本与类中心的拓扑结构的加权近邻图和加权类相关图。通过同时最小化近邻样本间距离和样本与类中心间距离,确保同类样本被映射更近且更紧凑的围绕类中心,从而保持原数据集的类结构。最后,将SSRFLE方法与常用的半监督非线性降维方法在混合数据集上进行对比实验,实验结果证明了SSRFLE方法在分类精度和数据可视化方面有较好的优势。
其他文献
采用裂区试验设计,研究了施肥量和播种量及其组合对草坪型多年生黑麦草种子生产性能的影响。结果表明,施肥量处理间以N∶P∶K 比例为80∶30∶30 (kg/hm 2)的种子产量最高;播种量对多年生黑麦草结
江苏省职业学校技能大赛刚刚落下帷幕,酒店服务专业技能比赛无论在竞赛内容还是在竞赛形式上都有了很大的突破,是检验江苏省职业学校酒店服务专业教学成果的一次盛会,也是展
目的:通过采用RT-PCR法及免疫荧光标记-流式细胞仪检测慢性阻塞性肺病(COPD)患者外周血单个核细胞CCR5 mRNA表达水平及CCR5阳性细胞的比率,探讨趋化因子受体5(CCR5)在慢性阻塞性肺
钛酸钡(BaTiO3)陶瓷具有良好的压电与介电性能,在传感器、超声换能器、微位移器和其它电子元器件等方面得到了广泛的应用,是目前为止最具有应用前景的无铅压电陶瓷材料。但传统
改革开放40多年来,全面深化改革背景下的中国社会治理面临新的矛盾、任务和挑战,需要以全新的眼光来谋划,以科学性、系统性、有效性为目标推进社会治理现代化。一是遵循历史
电力负荷预测已成为电力工程的重要研究内容之一,其是一个复杂的多变量、多维度的估计问题。智能电表及传感器的应用,提供了不同形式分布式能源的大量历史数据,进一步增加了问题的复杂性。传统的负荷预测方法无法准确跟踪负荷随机变化,准确性较差,但基于人工智能的机器学习算法因具有数据建模的灵活性和精确性,具有提高负荷预测准确性的潜力。本文给出了人工神经网络(ANN)短期预测方法和支持向量机(SVM)的短期负荷预
菊糖,也称菊粉,是一种果聚糖,通过D-果糖分子经β(1→2)糖苷键连接而成,主要来源于菊芋和菊苣块根中。本试验旨在研究饲粮添加不同水平菊糖对肉仔鸡生长性能、主要臭气化合物
粪臭素是微生物降解L-色氨酸(L-try)的代谢产物,是引起鸡排泄物产生恶臭的主要物质之一。大豆低聚糖(SBO)是以大豆及其加工副产品为原料生产的,含有一定量的水苏糖(STA)、棉
抛物型偏微分方程是描写热传导、扩散和渗流等过程的重要数学物理方程。传统数值方法目前仍是求解抛物型偏微分方程的主要方法,但其网格限制的缺陷也日益暴露,因此有必要探索
复杂疾病是一种遗传、环境及生活方式等多种原因共同导致的疾病。由于其致病机制复杂,复杂疾病难以通过遗传概率来估计个体患病的风险、也难以诊断、治疗及预后。疾病是面对