论文部分内容阅读
本文主要通过一系列的多尺度数学模型与统计分析,来解决大数据驱动下计算生物标识研究中的若干问题.当前,生物医学研究已经由宏观上脑组织结构的形态与功能水平,进入到微观上细胞和神经网络的结构与功能水平,并进一步深入发展到基因组与蛋白质组乃至生物分子网络水平.在此期间,在大脑、神经和基因等多个领域已经积累了海量的数据.这些多尺度多模态的数据急待开发研究,以建立生物标识揭示背后隐藏的系统机制.但由于研究中所涉及领域的多样性与交叉性,不可避免地遇到了很多复杂棘手的问题.因此在这里发展一套新颖有效的数理统计方法,以推动脑影像、神经网络及基因组等各个领域生物标识的找寻工作就显得格外迫切.基于如上考虑,本文首先对脑成像技术,基因组分析以及影像遗传学等背景知识做了简要分绍.随后应用了一系列数学模型与方法对注意力缺陷多动障碍(Attention Deficit Hyperactivity Disorder, ADHD)疾病的生物标识进行挖掘,并实现了疾病的模式识别.为了实现大数据驱动下ADHD疾病影像遗传学的联合分析,我们提出了一种全新的全脑关联分析方法(Brain-wide Association Study, BWAS),并与全基因组关联研究相结合,融合了多尺度多模态的统计工具,最终对ADHD疾病在脑影像和基因组层面上的生物标识进行了全面深入的解读.为了进一步应用和推广我们所提出的全脑关联分析方法,并探索其背后的工作机制.我们关注了BWAS方法所获结果的鲁棒性,以及与一些传统统计方法如双样本t检验、置换检验和Logistic回归的统计功效比较.另外,我们还针对在生物细胞水平以及弥散张量成像原理中的分数扩散方程等研究中扮演重要角色的分数阶动力系统,提出了一种新颖的识别算法,对具有高维稀疏结构的分数阶系统进行参数识别,这将有助于揭示在大样本实验观测数据背后的动力学模型.最后,对本文的全部研究工作进行了总结和展望.