基于矩阵因式分解的多源数据融合方法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:sxfylhd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,合理的处理和利用所获取的数据可以产生极大价值。如何充分挖掘这些多源数据信息,并通过数据融合对其进行分析从而得出决策,正是目前的研究热点。在这样的背景下,多源数据融合作为一项智能化信息处理技术,所发挥的作用至关重要。本文在当前主流矩阵分解算法的基础上,设计与实现面向多源数据的矩阵分解融合算法,应用数据融合来量化推断两个目标对象之间的关联关系。主要工作如下:(1)针对数据融合方法关联预测精度不高的问题,本文提出基于相似度的矩阵因式分解算法。首先对多源数据构建多类型关系网络,使用三因式协同矩阵把数据源间的多重关系分解为低秩矩阵,加入不同对象类型属性间的相似正则项,对目标函数进行求解优化,最后利用优化后的低秩矩阵重构关联矩阵,提升算法关联预测精度。实验结果表明,算法相比于现有的多源数据融合经典方法在关联预测上获得了更好的表现,在精度方面有一定的提升。(2)针对融合算法缺少对数据源的差异划分,本文提出一种基于加权矩阵因式分解的融合算法。在基于相似度的矩阵因式分解算法的基础上,该算法对异质数据源和同质数据源的关联网络引入权重,并使用正则项对目标函数进行平滑以防止过拟合,在求解过程对同质和异质网络的权重以及关系的低秩矩阵共同优化,最后重构关联矩阵以预测潜在的关联。实验结果表明,基于加权矩阵因式分解的融合算法相比于其他方法,提升精度降低误差率,反映了在数据融合方面,区分数据源差异有重要意义。(3)本文将基于加权矩阵因式分解的融合算法应用于生物医学领域,以多源基因疾病数据为基础,研究三种特定疾病与长链非编码RNA的关系。预测结果与数据库实证对比,表现出良好的预测能力,进一步证实了算法的有效性。
其他文献
电机作为一种能量转换设备,在人们日常生活和工业生产中都有着广泛应用。在工业生产中,电机由于长时间高速运转、高负荷的工作状态,加之可能缺乏足够的日常维护,给电机的运行留下了安全隐患。电机一旦出现故障,不仅会影响设备的平稳运转,使企业造成一定的损失,甚至可能威胁现场工作人员的人身安全。因此,为保证电机运行的平稳性、高效性及可靠性,对其进行远程监测和故障诊断十分重要。本文以异步电机为对象,结合深度学习理
学位
随着城市化的不断发展,地铁交通越来越受到青睐。在地铁建设中,盾构法修建隧道具有对周围环境影响小、自动化高、优质高效、安全环保等优点。盾构刀盘是实现盾构机掘进的关键部件,由于我国岩土结构复杂多变,掘进过程中刀盘与土体不相适应的问题多有出现。其中钙质结核是一种力学特性极不稳定的地层,也是事故多发地层,因此基于钙质结核地层开展对盾构刀盘的掘进力学特性研究具有重大的现实意义。本文以郑州地铁10号线某区间盾
学位
斜拉桥具有跨度大、自重轻、施工相对简单等优势,已经成为大跨度桥梁的主要桥型之一。斜拉索是斜拉桥的主要承重构件,保证其使用安全是整座桥梁能够正常运营的基础。为保证斜拉桥正常使用,对斜拉索结构的使用性能进行研究具有重要的意义。本文在对斜拉索结构病害进行调查并查阅了大量文献的基础上,对斜拉索结构的使用性能进行了研究,主要成果如下:(1)针对斜拉索的构造特点分析了斜拉索损伤的原因和机理。外护套破损导致索体
学位
聚合物混凝土材料是一种利用水泥混凝土制造方法,通过更换部分或全部水泥,利用聚合物与粗细骨料混合拌制而成的新型混凝土材料,具有施工后硬化快、耐腐蚀、对环境无污染等优点。因此利用聚合物混凝土这些特点,将其应用于混凝土破损区域来提高结构承载力,延长其服役寿命,应用范围广阔。但大多数学者对聚合物混凝土材料基本性能进行研究,对其与水泥混凝土粘结共同工作性能等研究较少。因此本文对聚合物混凝土与水泥混凝土粘结抗
学位
随着计算机的广泛使用以及互联网的迅速普及与发展,人们可获取的信息量与信息种类也随之增多,并且大多以文本形式存在,如何快速、准确获取自己所需信息则成为目前研究的热点问题之一。本文的工作重点从文本分类的特征选择出发,对文本分类技术进行更加深入的分析与探讨。首先,基于文本分类的整个过程,对其基本理论进行简介,主要从六个方面进行说明,包括有数据采集、文本的预处理、模型表示、特征选择、特征加权以及分类器评估
学位
随着人们生活水平的提高,旅游已经成为大家日益关注的焦点。国内外学者也对此研究颇多,关于旅游发展与经济增长的关系主要存在四种定论,但至今也并未形成统一的观点,因此本文主要研究我国31个省市的旅游发展与经济增长的关系,判断在我国现今二者之间的关系是两者之间互为影响作用。本文通过2000-2018年省际面板数据,以旅游专业化和人均GDP分别作为转换变量,同时选取固定资产投资、产业结构、政府规模、旅游基础
学位
当下各领域利用统计回归分析建立模型研究问题时往往忽略模型中的多重共线性问题。多重共线性是由于变量间的高度相关性造成的,当模型存在严重的多重共线性时会导致系数符号与现实相反,参数估计难以通过显著性检验进一步使得模型的拟合效果不佳甚至模型失效。所以处理共线性问题对模型整体来讲显得尤为重要。本文对处理多重共线性问题的两种常用方法—主成分回归和偏最小二乘回归进行对比分析,发现偏最小二乘回归分析法优于主成分
学位
随着我国城市化进程不断推进,人们对生活质量的追求发生了深刻的变化,由单纯追求生存质量向追求多层次、全方位的生活质量转变,因此构建合适的评价指标体系对我国城市居民的生活质量进行客观评价和分析,以及深入探究我国城市居民生活质量之间的差异具有重要应用价值。本文结合生活质量的内涵和我国城市居民的生活特征,从收入水平、消费水平、居住条件、教育文化、生活环境、就业水平、医疗水平、社会保障和交通设施9个方面选取
学位
多孔碳材料因其高的比表面积和发达的孔隙结构,在超级电容器、催化、污染物移除等领域受到广泛关注。为了进一步发掘多孔碳材料的结构优势以满足不同应用环境的需求,对其进行功能化是最为简单有效的方法。在超级电容器领域,多孔碳材料通常作为典型的负极材料来使用,通过原位负载具有高氧化还原活性的金属氧化物,可扩展其在超级电容器正极材料领域中应用;对于涉及气体产物生成的电化学反应(如析氢反应(HER)和析氧反应(O
学位
为了客观评价新时期我国绿色经济效率,呈现其时空演变分布特征,并把握有效提升我国绿色经济效率的路径及方向,文章结合使用包含R&D投入和“绿色地区生产总值”的Super-SBM模型与理想窗宽的DEA窗口模型,测度了2008-2017年我国绿色经济效率,并对其时间趋势变化情况进行了分析;通过计算全局和局部Moran’s I指数以及绘制空间分布地图,研究了2008-2017年我国绿色经济效率的时空演变分布
学位