基于取样的张量公因子分析算法及其应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wuyuwei1210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
张量在大数据处理领域中的兴起,推进了基于张量的数据分析算法的发展,其中包括高阶维度约简算法。一个好的维度约简算法不仅能够降低原始数据维度,还能提升数据分析的准确度。张量公因子分析作为一种新的高阶维度约简算法被提出,其借鉴同步矩阵分解近似的方式寻找原始高阶数据集合的一组多方向投影矩阵,从而做到将原始的高阶高维张量数据投影到一个维度较低的同阶张量空间中,以此得到约简后的特征集合。该维度约简算法形式统一,执行效率高。但是庞大的数据集合本身对维度约简算法的执行也造成了困难,为了解决数据量大,运算复杂,耗时严重等问题,两种基于取样的改进算法被提出,通过对原始数据集合进行取样,从而降低算法的输入数据量,减少算法执行时间。借鉴矩阵CUR分解中的随机列取样和交叉近似的方法,分别设计了加快奇异值分解运算速度的矩阵列取样策略和通过对原始张量集合交叉取样的最大子张量取样策略。这两种取样方法分别从不同的层面对原始数据进行取样,从而通过对样本数据进行分析达到和对原始数据集合同样或者近似的效果。最后,通过对两个常用的多媒体数据集合进行分类实验,证明了这两种取样策略的有效性,并通过在传统KNN分类器中加入张量距离度量,进一步提升了分类实验效果。
其他文献
背景:胃癌是世界范围内致死率最高的恶性肿瘤之一,根据2018年全球肿瘤数据(Global Caner Statistics),2018年将近一半的新发病例和死亡病例发生在中国。我们观察到胃癌患者即使在相同的TNM分期,其预后也存在显著差异。年龄,性别和肿瘤大小等变量同样影响着患者的预后。欧洲肿瘤医学协会(ESMO)和国家综合癌症网络(NCCN)指南推荐进展期胃癌患者可根据不同分期采用不同的新辅助治
随着大数据时代的到来,人们越发关注数据的内容和价值。对于图像、音频、视频等多媒体信息,传统的检索方法已经不能满足人们的需求。kNN查询、范围查询和正交范围查询是常见
随着信息技术和国防工业的不断发展,不但AC-DC变换器的需求指数增长,而且技术指标也越来越高。相较于AC-DC变换器的定制开发,模块化开发具有开发周期短、通用性强的优点,已经广泛应用于各种AC-DC供电系统的构建中。集成PFC和隔离DC-DC于一体的大功率隔离AC-DC电源模块不但可以解决传统PFC电源模块级联隔离DC-DC电源模块中因工作时序造成的控制复杂问题,而且具有模块数量少、成本低、可靠性
正交异性板因为其质量轻、强度高、跨度大等优点,在近代大跨度桥梁建设中应用广泛,但因其结构焊缝数量多、构造复杂、焊接残余应力大,在长期的车辆荷载的作用下容易发生疲劳问题,严重阻碍了正交异性板的推广应用。为改善正交异性板的疲劳性能,提升结构疲劳寿命,在分析总结国内外研究学者针对正交异性钢桥面板疲劳性能的改进方法的基础上,提出全曲线波形板—UHPC组合桥面板概念,并对其设计参数进行优化,最后对比传统正交
城市基层已经成为我国社会治理体系的重要组成部分,在维护社会和谐稳定中发挥着极为重要的作用,随着社会治理模式不断创新,城市基层社会治理体系构建逐渐成为变革的焦点。当前,我国正处于社会转型的关键时期,国家针对城市基层社会治理模式创新和探索提出很多新的要求,人们参与社会治理的热情也在不断提升,在社会治理中发挥的作用也越来越大。随着社会治理体系不断向前发展,政府、社会、市场都在扮演着不同的角色,单纯依赖政
司法实践当中出现了大量的仲裁欺诈现象,仲裁欺诈行为侵害了案外第三人的合法权益,浪费了有限的司法资源,对司法秩序和法律公信力都造成了极大的破坏,这是一个亟待解决的问题。虽然我国现行法律对仲裁第三人权益保护已有涉及,但是由于相应的救济渠道单一,仲裁第三人维权存在困难。有限引入仲裁第三人制度,设立案外人撤销仲裁裁决之诉可以有效的弥补现有救济制度的不足。仲裁非诉讼化理论、司法审查能动性理论和程序当事人理论
膨胀管技术是石油钻井行业中迅速崛起的一项新技术,可明显降低钻井及完井成本。该技术的最终目的是实现单一井径钻井完井,制约膨胀管技术发展及应用的关键是膨胀管材料的选择
无人机及其相关设备在使用过程中难免会发生故障。如果故障发生的突然且没有相应的应急措施的话,势必对任务的执行造成一定影响,甚至发生事故。本文针对无人机日常维护使用的
本实验通过分子设计,首先得到一系列含有具有光响应性的偶氮苯基单体,通过适当的反应得到了新型偶氮功能化聚合物。实验合成了具有端羟基的偶氮苯基反应基本单元,4,4’-二羟
随着web2.0向web3.0的过渡,社交网络得到了空前的发展,各大社交平台层出不穷。新浪微博作为国内第一大社交平台,凭借信息量大、传播速度快、用户交互性强、使用方便等特点,得到了众多用户的青睐。海量的数据由用户产生,其中包含大量突发事件信息。带有负面情感的信息在社交群体中相互传播、相互作用,从而导致舆情爆发。突发事件具有突发性、导向性,如果不加以监管,其引发的舆论信息会随着互联网四处传播,不仅会