学习驱动的概率重构与数据可视化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hachu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个信息爆炸的时代,处理与分析大规模的高维数据已经成为数据挖掘与机器学习领域的重大挑战之一。为了获取以及直观理解隐藏在大数据下的潜在信息,一种有效的数据可视化技术是不可或缺的。数据可视化技术能够将复杂的高维数据信息展示在低维的图表上。根据低维的数据图表,我们能够对原始数据的结构信息有一个直观地理解,而且有助于后续的数据探索与模式识别。在一些传统的数据可视化算法的基础上,本文做了如下工作:(1)提出了基于ANNOY的快速近邻搜索算法。该算法在随机投影树的基础上通过近邻拓展的方法进行近邻点的搜索,在保证近邻搜索准确率的基础上大大提升了近邻搜索的速度。(2)提出了基于近邻关系与类别信息的概率重构算法。该算法首先通过近邻拓展的方法构建近邻关系图,然后基于近邻关系与类别信息对原始数据样本之间的相似性进行概率重构。该算法可以更为准确的描述高维数据样本之间的相似关系。(3)提出了基于P-BGLL的可视化算法。该算法在BGLL算法的基础上,使用概率作为空间中样本之间的连接权值,从而提出了P-BGLL算法,并基于P-BGLL算法进行可视化操作。相比于传统的数据可视化算法,基于P-BGLL的数据可视化算法能够更好的保留高维数据的全局结构与局部结构,取得良好的可视化效果。(4)提出了基于Feature-Net的可视化算法。该算法首先利用Feature-Net网络模型对数据特征进行提取,以便过滤掉噪声与冗余信息,然后利用获取的类别信息与近邻关系对概率进行重构。该算法对于原始样本间的相似性描述更为准确,其在可视化上的表现更加优秀。
其他文献
外尔半金属是研究外尔费米子的重要材料,其在磁学和电学性能上具有不同寻常的行为表现。单硅化合物(CoSi、FeSi、Rh Si、Mn Si等)—一类外尔半金属材料,随着技术的进步正在被
我国是人口大国,也是资源消耗大国,生产和生活排放的大量废物,全靠大自然的降解是不现实的,且有些有机物几乎不可能自然降解,迫切需要大量的光催化剂加速其降解。如何提高二氧化钛在可见光范围内的光催化性能是目前光催化领域的热门课题。本文为铬、硫掺杂锐钛矿相二氧化钛体相性质的研究。用Material Studio软件的CASTEP模块,系统地研究了Cr/S共掺杂锐钛矿型二氧化钛体系的电子结构和光学性质。在4
牙轮钻头滑动轴承的前期损坏限制了钻头使用寿命和工作性能,是目前石油钻井领域亟需解决的问题之一。近年来一些理论和实验已证实合适参数的仿生表面织构引入牙轮钻头滑动轴
ZnO纳米材料具有诸多优异性能,凭借其多种形貌的纳米结构,在制备气敏传感器件、光电器件和太阳能电池等方面具有广泛的应用。由于ZnO纳米材料自身具有本征缺陷,从而限制了它
镁合金具有密度低、比强度高、抗阻尼性能好、易回收等优势,是汽车、航天航空、电子信息等领域极具潜力的轻质结构材料,然而,镁合金的耐腐蚀性能很差,限制了其广泛使用。本文
M50Nil钢是在M50钢的基础上,通过减少C元素含量并增加Ni元素含量发展出的新一代轴承钢。M50Nil钢在经过表面渗碳渗氮后可以在芯部保持较高韧性的同时,具备较高的表面硬度与耐
本论文研究了廉价金属催化的叠氮化合物的酰基迁移反应和叠氮基酰胺的重排反应,主要由以下部分构成:第一章是文献综述,总结了近年来有机叠氮化合物胺化反应的研究进展,从过渡
NZP族磷酸盐陶瓷是一类具有相同晶体结构但化学组成各异的精细陶瓷,因其具有低热膨胀特性,在抗热震结构陶瓷领域有重要的应用价值。本论文分别以NZP族化合物KZr_2(PO_4)_3(简称KZP,属于碱金属系列)以及CaZr_4(PO_4)_6和SrZr_4(PO_4)_6(简称CZP和SZP,属于碱土金属系列)为例,着重研究了固相法制备NZP族陶瓷粉体的适宜球磨时间、反应物源、水热晶化条件以及煅烧条
随着现代分析仪器和手段的快速发展,分析研究人员可以在相对较短的时间内获得样本的大量信息。但是,仅仅通过常规方法很难直接定性和定量地分析复杂体系中的多个目标组分。因
环氧树脂胶粘剂在缺少活性反应基团的低表面能高分子聚合物表面难以浸润,产生了一系列的粘接问题,导致了航空航天、生物医药、机械制造等诸多军事以及民生领域的发展瓶颈。具有一对孤电子轨道结构的卡宾自由基,能够无选择性地瞬间“插入”与之相邻的C-H、C-C、N-H和C-N等键。因此,卡宾自由基团也被称之为“万能交联剂”,与聚合物表面形成永久性的共价键结构,具有解决低表面能界面粘接问题的潜质。双吖丙啶结构作为