【摘 要】
:
降维是高维数据分析中最为关键的部分。随着人工智能时代的到来,蕴含宝贵资源的数据呈井喷式增长。如何从海量工业监测数据中提取有效信息成为核心问题,现有数据普遍存在空间维数高导致数据稀疏性强、矩阵分解难度增加等问题,从而加大数据分析的难度。针对以上问题,本文在研究传统降维算法的基础上,提出了一种分步式降维框架,并对增量正交成分分析算法进行改进,通过仿真试验证明该降维框架和改进算法的性能有所提高。论文中的
论文部分内容阅读
降维是高维数据分析中最为关键的部分。随着人工智能时代的到来,蕴含宝贵资源的数据呈井喷式增长。如何从海量工业监测数据中提取有效信息成为核心问题,现有数据普遍存在空间维数高导致数据稀疏性强、矩阵分解难度增加等问题,从而加大数据分析的难度。针对以上问题,本文在研究传统降维算法的基础上,提出了一种分步式降维框架,并对增量正交成分分析算法进行改进,通过仿真试验证明该降维框架和改进算法的性能有所提高。论文中的研究内容包括以下几个方面:1、对多种基础降维算法及改进算法进行学习,实现算法并通过可视化空间观察不同算法的降维效果;2、提出一种基于聚类的分步式降维框架,将聚类算法和降维算法进行高效结合建立相关模型,分析降维效果。用于线性和非线性高维数据,仿真结果表明该降维框架提高了分类精度,其准确率在一定情况下可提高16.9%;3、对分步式降维框架进行改进,在模型的处理前期对数据维度进行预分类,代替通过先验知识选取聚类算法的参数。将改进后的模型用于大面积轴温缺失数据的恢复,从时间和数据恢复精度两方面分析该框架的有效性和数据恢复情况,并对该降维框架的有效范围进行验证。仿真结果表明在误差精度保证的情况下时间效率提高14.25%,多维缺失数据恢复的平均精度可高达99.75%;4、对增量正交成分分析算法进行改进,从概率论角度出发,选取贝塔累积分布函数作为自适应阈值函数,建立增量降维模型。该模型在计算特征空间的过程中,引入施密特正交使得特征空间满足标准正交性。最后通过仿真试验该算法的有效性,可通过调整阈值函数的参数更新目标维数,寻找二者之间的平衡点,为处理高维动态数据提供了有效的方法和手段。
其他文献
2000年以来,江苏省的粳稻品质改良取得了显著成绩,育成了48个品质达国标三级以上优质稻谷标准的优质粳稻新品种。但品质突出的优质品种不多,尤其是食味品质不能满足消费者的
经过了近20年的飞速发展,保健食品行业发展面临着一系列的机遇和威胁,一些保健食品生产企业也具备了一定的优势,同时也存在一些不足,如何促进保健食品生产企业业绩实现可持续
<正>近年来,随着计算机、通信、网络以及蓄电池等新技术的发展,变电站的现代化和自动化水平都有了很大的提高。随着这些新技术的不断应用,对环境温度也提出了更高的要求。
<正> 三、电解抛光和化学抛光在1930年首先应用铝的电解抛光后一直成为装饰性光亮阳极氧化前的必然工序;这是因为进行机械抛光后的铝制品,虽然已经取得光亮的表面,但仍然不能
以高峰林场桉树林为研究对象,利用Landsat TM影像、数字高程模型,结合2009年森林资源二类调查数据,探讨桉树人工林生物量遥感估测方法。从研究区的桉树小班中随机抽取346个小
作者以企业标准化作用为依据,以温州发电有限责任公司标准化建设为例, 对企业标准化建设的现状与问题进行了分析,并据此提出了相应的改进对 策,指在能对企业标准化建设起到持
不少读者来信,要求本刊举办一些表面处理工艺、镀层镀液测试以及废水、废气治理方面的基础讲座。现先试办铝阳极氧化方面的这个讲座,内容包括铝和铝合金材质,机械抛光,电解抛
采用示踪实验研究紫外线消毒器的水力特性。结果表明,进出口方向和相对位置对反应器的水力特性没有显著影响,随着雷诺数的增大,反应器的水力特性参数逐渐接近于推流条件。同
本文以协同理论、个性服务理论为指导,论述了当前快递业在电子商务下改变原有发展形式的重要性,通过对快递业现有模式和发展现状进行分析,针对目前快递行业与便利店合作存在
介绍了焊接接头组织模拟的现状,阐述了组织模拟的主要方法:Monte Carlo方法、Cellular Automaton方法及相场法,分析了不同方法在模拟凝固及固态相变过程中的晶粒生长、组织形貌