基于Bagging Dtrace模型的基因差异网络分析

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:jsyzcqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同病理状态下的基因调控网络模式发生改变,表明其对应的基因连接关系已改变。本文尝试寻找那些连接关系改变的关键基因,以区分不同亚型的癌症。从研究历史文献发现,通常采用直接法和间接法来估计差异网络。当考虑到时间花度和预测精度时,我们一般选择直接估计法。由于样本数据较少,因而,这些差异网络估计法可能未能充分的利用其样本信息。基于此,文本提出采用Bagging算法集成直接估计法来估计差异网络,通过有放回的采样,增加了数据的多样性以及对数据的充分利用。在模拟数据上,将本文提出的模型与Dtrace模型进行对比分析,模拟实验结果显示本文提出的模型比Dtrace模型效果更优。在真实数据集分析,将我们的方法应用到不同亚型乳腺癌基因表达数据的分析上,采用稳定性选择算法选择调优参数,最后模型确定了5个关键基因。通过调查研究文献发现,本文找到的5个关键基因对区分不同亚型的乳腺癌有非常重要的作用。
其他文献
嵌合抗原受体(Chimeric Antigen Receptor,CAR)修饰的T细胞在血液恶性肿瘤治疗领域已取得了巨大的成功,然而在实体瘤治疗领域仍然存在许多挑战。表皮生长因子受体(Epidermal Growth Factor Receptor,EGFR)EGFR287-302表位仅仅暴露在某些肿瘤细胞中的过表达EGFR以及EGFR变异体如表皮生长因子受体Ⅲ型变异体(EGFRvⅢ)的表面,而在
脑岛是大脑皮层的一个隐藏部分,不仅参与了人类的众多认知过程,还与精神疾病密切相关。以往有关脑岛功能的研究主要关注内感觉信息的加工,关于外感觉信息(例如听觉)在脑岛内
为了维护国家木材产业安全、加大森林资源的保护力度,国家决定停止天然林商业性采伐。于是曾经在山场工作的林区职工的工作就发生了变动。原来在木材生产一线工作的全民职工
重金属污染对人类健康及生态环境的危害日益严重,建立灵敏且选择性强的重金属检测方法十分重要。荧光蛋白在生物传感器、生物学标记、荧光成像等方面具有重要的应用价值,近几年从蓝细菌光敏色素中发展的荧光蛋白由于分子量小,荧光量子产率高及光谱多样性受到广泛的关注。本研究通过PCR技术从盐泽螺旋藻S.subsalsa FACHB351中扩增出蓝细菌光敏色素SPI1085g2编码基因SPI1085g2,采用分子克
近年来,遥感卫星、卫星遥感数据采集领域发展日渐活跃,其产生的卫星大数据应用前景广阔,已经成为航天大国的核心空间基础设施,成为经济发达及新兴国家进入航天的首选领域,巨大的市场空间与良好的发展前景给B公司带来实现跨越式发展的机遇。为了完善产业链布局B公司一方面不断提升自身的技术实力,另一方面积极拓展市场空间,在卫星服务业方向上不断拓展,不断推动自身发展,致力于成为卫星大数据采集、处理及服务领域内具有领
本文旨在对初中高三个不同水平的汉语课堂中口语交际部分的协商互动情况进行研究。研究从二语(汉语)课堂实录话语语料库中选取初中高三种不同水平的汉语课堂口语交际语料,对
明治时期是日本开始实行文明开化政策,积极引进西方自由主义思想的时期。因此,怎样处理传统儒学思想与近代自由主义思想之间关系的问题,是这个时代不可避免要考虑的课题。当
特朗普政权的诞生,意味着日美关系进入了一个新调整期。与历任新总统的战略调整相比,“特朗普冲击”波及至地区和全球体系变革的速度和影响更快、更大。对日本来说,“特朗普
个人收入与其所受教育程度之间的关系可以通过教育收益率来测量。教育收益率是指受教育者因增加其受教育的数量而得到的未来净经济报酬的一种测量,它是评价教育生产力的一个
电子政务被广泛认为是一种为所有发达国家和尼泊尔等发展中国家提供具体服务的有效工具。本调查的动机是为了解电子政务对尼泊尔农村健康的影响,并找出在尼泊尔农村健康实施