组学交互网络回归模型的构建策略与方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yetigai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂疾病是跨组学生物标记联合作用的结果,但也绝不是它们之间的简单叠加和堆积,这些不同层面的组学标记,往往有基因组→转录组→蛋白组→代谢组→表型组的生物信息流时间的先后顺序,研究需遵循该连续谱的顺序,连续谱间相互错综,交织成一个组学生物网络系统,正是这个网络系统控制着疾病的发生、发展和转归进程。复杂疾病的多层面组学标记具备“高维”、“网络性”特性,传统的组学标记筛选策略和方法多数忽略了这两个特性,势必损失信息,甚至导致错误结果的出现。同时,生物分子之间的关系呈现出不同的非线性模式,简单的线性相关不足以刻画。本研究在网络医学框架下,首先引入点互信息用于表征组学交互网络中的“边效应”,并借助二维核密度方法估计、度量点互信息的取值,进而构建融组学交互网络的“点效应”、“边效应”为一体的组学交互网络回归模型,即点互信息组学网络回归模型。统计模拟用于评价该模型在不同的样本含量、不同的“边效应”模式,及其不同网络结构下I类错误率的稳定性和检验效能,来自GEO数据库的187例吸烟者的基因表达数据用来进一步验证该模型的实用性。方法生物分子之间存在复杂的相互调控关系,统计学中常用的简单线性相关,难以刻画这种复杂的调控关系,点互信息不仅可以度量两个变量之间的线性相关关系,同时也可以度量出两变量间的非线性相关关系。本研究首先引入点互信息,来表征组学生物网络中不同网络节点之间的相关关系,即网络的“边效应”,并利用二维核密度估计的方法,来估计两个组学网络节点间的点互信息值。进一步在logistic回归模型框架下,构建基于点互信息的组学网络回归模型,来识别整个组学交互网络、网络某特定组学标记节点或网络节点生物分子间的相互关系,如基因表达网络中的调控关系等,检验它们与复杂疾病的发生是否有关。本研究设计了两个模拟方案用,以评价模型的有效性和科学性:1.组学交互网络的网络结构固定不变,即每次模拟时,样本间网络差异节点和差异边都是固定不变的;2.随机指定样本间网络差异节点和差异边。在每个模拟方案下分别考虑两种不同的模拟情景:(1)网络中节点间的相关性是简单线性相关;(2)网络中节点之间的相关性是非线性相关。进一步,在每个模拟情景下设置四种网络差异情况:①网络中只有节点存在差异;②网络中只有边存在差异;③网络中节点和边都有差异,且差异的边与差异节点相连;④网络中节点和边都有差异,但差异边与差异节点不相连。这一系列的模拟,可从多角度评估本研究所构建的基于点互信息的组学网络回归模型,与生物信息学中常用的基于积距项的网络回归模型相比,在I类错误率控制表现和检验效能方面的科学性和有效性。结果根据研究的模拟结果显示:1.在两节点间的关系为线性时,两模型在不同情形下都能较好地控制I类错误率,且稳定在所设定的0.05左右。在差异节点的识别上,点互信息组学网络回归模型与积距项组学网络回归模型具有类似的检验效能,但与积距项组学网络回归模型相比,点互信息组学网络回归模型在差异边的识别上相对较弱;2.在两节点间的相关性为非线性情况下,积距项组学网络回归模型在差异节点的识别上具有较低的效能,在差异边的识别上,积距项组学网络回归模型几乎无法识别出差异边,而点互信息组学网络回归模型能够较好的识别出差异边,且同样具有很好的I类错误率的控制表现。将两个模型应用于187例吸烟者的基因表达数据,点互信息组学网络回归模型识别出了三个基因位点(AKT2、BAD和JAK3),积距项组学网络回归模型识别出来的二个基因位点(BAD和JAK3)。与此同时,点互信息组学网络回归模型识别出了四条条差异边(RAF1-MAP2K1、ERBB2-TGFA、CASP9-AKT2、PIK3CD-EML4),积距项组学网络回归模型未能够识别出差异边。文献检索发现,这些识别出来的差异节点和差异边,具有很好的生物学解释,进一步说明本研究提出模型具有很强的实用性。结论点互信息能够较好的提取组学交互网络中不同模式的“边效应”,在不同的模拟情形设置之下,点互信息组学网络回归模型均具有很好的I类错误率控制表现,无论组学生物网络中节点间存在线性或者非线性相关关系,点互信息组学网络回归模型能够较好地识别出差异节点和差异边,且对于不同的网络结构,点互信息组学网络回归模型的识别能力稳健性较好。
其他文献
目的:探讨卡托普利舌下含服与硝酸甘油静脉滴注治疗高血压急诊患者的疗效。方法:选取进行高血压治疗的患者122例,将其随机分为对照组(单纯使用硝酸甘油静脉滴注)和观察组(采
目前正在开展的保持共产党员先进性教育活动,不仅是保持党的先进性、提高党的执政能力、完成党的执政使命的重要举措,而且也为我们探索执政党建设问题提供了一个更加广阔的视
目的探讨浅快呼吸指数(RSBI)对慢性阻塞性肺疾病(COPD)患者机械通气撤机的预测价值。方法符合撤机条件的70例COPD机械通气患者在无任何呼吸支持条件下测定RSBI值,然后进行撤
<正>一、积极推动内蒙古养老产业发展重要意义人口老龄化与养老问题是全球共同面临的热点和难点问题,要真正实现"老有所养、老有所医、老有所为、老有所学、老有所乐"的社会
从山东地区农产品微信营销现状出发,对烟台市农产品微信营销进行了SWOT分析;并通过文献分析、网络调查和实地采访调查等方法得到数据,从物流成本高、顾客信任度低、时间成本
目的:研究分析老年患者经尿道膀胱肿瘤电切术的护理措施和临床价值。方法:筛选膀胱肿瘤患者共160例作为本次对比试验的研究对象,对照组患者进行常规的围手术期护理工作,试验
<正>病例资料患者女性,57岁,退休护士。因"咳嗽伴皮下结节3月余,发热10天"于2014年7月入院。患者入院前3月余前受凉后出现咳嗽,少量白粘痰;伴劳力后胸闷气促、休息后可减缓;
目的:探讨有机磷中毒治疗过程中体温与阿托品用量合适度的关系。方法:选取8份既往身体健康、住院期间无感染疾患,全程监控的病例,排除物理降温后30 min内体温,结合患者当时的
没有比光传播更快的东西。任凭最近媒体繁复的报导,这一断如过运河一样依然正确无误。虽然如此,过运河20年中的实验迫使我们重新考查“东西”这一字眼的含意。美国普林斯顿日电