基于张量分解的癌症亚型分析算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:z7120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过形态学或所属组织器官命名的癌症并不准确,癌症的临床治疗需要更精确的亚型才能对症下药和靶向治疗。通过对基因芯片数据如m RNA、mi RNA、DNA、蛋白质等数据的分析能发现和识别出更准确的癌症亚型。整合多源基因组数据不仅能够发现肿瘤与基因组数据的关系,而且可以发现各基因数据之间对肿瘤的协同共作用关系。综合考虑不同基因数据,在不丢失信息的前提下分析不同数据相互之间的共享结构是分析癌症亚型的难点。本文使用多维阵列的张量结构来整合多源基因组数据,不经过中间数据转换,保留的原始单一基因数据的特有信息,同时挖掘不同基因数据之间的协同致病模式。本文介绍了张量模型的原理和框架,在基于乳腺癌的基因表达谱数据和DNA甲基化数据上构建了张量模型,构建的方法是对预处理的芯片数据做差异表达分析,有明显差异的基因在张量中置位1或者保留原芯片值。表达正常或没有明显差异的基因则稀疏化为0。这样基因表达谱数据和甲基化数据就整合为一个三维张量。在现有的CP-ARP分解算法的基础上,本文针对基因芯片数据高维度小样本的数据特征和基因功能差异表达和表达水平正常的两极化特征,引入了非负和稀疏性限制条件,优化了CP分解模型。改进的模型使用基于随机梯度下降的ALS优化方法,在计算性能上有所提升。使用改进的分解方法在与已经验证的乳腺癌五种亚型对比结果证明了张量分解模型在癌症分型应用上的有效性。通过对癌症分型的结果分析,验证了Her2这种临床已证明存在的亚型。从平均轮廓系数和生存分析等角度证明了算法的性能和所分亚型的有效性。证实了本文提出的方法在癌症的分型以及癌症诊断治疗上能提供一定的参考和借鉴。
其他文献
随着“一带一路”战略的不断深化,昆明作为新一轮国家战略的在建区域国际中心城市,迎来了推进国际化发展的大好机会。许多本土企业,尤其是传统制造业相关企业,如茶业企业,逐
作为锂离子负极材料,硅的理论比容量高,但它的循环稳定性和库伦效率差,该问题是阻碍锂离子电池向高容量方向发展的世界性难题,困扰有关研究人员已有30余年,至今未找到合理的解决办法。目前锂离子电池容量偏低阻碍了电动汽车和无人机等先进技术的发展。为了解决它所存在的问题,在本论文中主要围绕两个思路展开工作:一是优化工艺,通过选用纳米硅合金粉末并复合不同比例人造石墨为锂离子电池负极活性物质制成电极片,最后确定
金属氧化物在微电子、铁电和光电子领域有广泛的研究与应用,特别是过渡金属氧化物和钙钛矿氧化物在半导体中的广泛应用,为现代信息技术提供良好的物质基础。基于金属氧化物材料的阻变存储器具有组成结构简单、密度高、功耗低、持久性强、读写和擦除速度快、可伸缩性好等优点,是下一代非易失性存储器主要的候选者之一。随着研究的深入,可调制的阻变存储器得到应用,人们通过掺杂、金属-半导体界面、温度等方法调节存储器阻变特性
外国文学近年来越来越多地被引入中国,而随着我国翻译事业的发展,引入的外国文学类别越来越丰富,读者不满足于单一类型的作品,而对外文作品的翻译质量也有了更高的要求。本文
轴承作为机械传动中最为基础的部件,其中角接触球轴承在高速旋转的机械设备中更发挥着重要的作用。在性能上,角接触球轴承能够同时承受径向力与轴向力。在轴承的高速运行中,
弗里德里希·席勒是德国古典美学史上一位伟大的美学思想家。席勒美育思想的核心是“美是现象中的自由”,与“自由”相联系的另一重要概念是“游戏”。“只有当人是完全意义
马来西亚是我国的重要经济贸易合作伙伴。目前,中国-马来西亚“两国双园”项目正在如火如茶地进行,促进了两国之间的产能合作、联合招商,在此背景下,两国之间的交流合作尤为
随着经济全球化的发展以及中国加入世界贸易组织,中国与世界经济交流空前广泛。作为银行业一大支柱,银行贷款产品对于中国银行产业的发展起着十分重要的作用。为了顺应激烈的
为了进一步优化单晶硅(c-Si)太阳电池的各项输出参数,研究开发了隧穿氧化物钝化接触(Tunnel Oxide Passivated Contact,TOPCon)太阳电池。TOPCon太阳电池是一种用超薄氧化硅(Si O_x)和高掺杂多晶硅(poly-Si)来制备载流子选择性钝化接触结构的新型太阳电池。由于高质量的掺硼(B)p+-poly-Si/Si O_x结构(p-TOPCom)更加兼容现有P
MicroRNA(mi RNAs)是治疗包括肿瘤在内的许多人类疾病的富有吸引力的候选靶标。然而,体内有效递送microRNA至肿瘤部位面临着挑战。miR155在许多肿瘤组织中都存在表达异常,很