乳腺癌基因芯片实验数据分析与挖掘

来源 :重庆医科大学 | 被引量 : 0次 | 上传用户:listen342325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:乳腺癌是一种严重危害妇女健康的、发病率较高的恶性肿瘤,从基因水平上认识乳腺癌的发病过程与发展机制在癌症研究中具有重要意义。基因芯片技术可以自动化、大规模、快速方便地测出癌组织与癌旁正常组织的基因表达水平,将实验得到的数据进行对比,运用数学与计算机的方法进行数据分析与挖掘,可望找出在不同样本中呈现差异表达的基因及其相关基因。而目前大量基因芯片实验结果已公开发布在互联网上,利用互联网可以开放共享这些实验数据。本研究旨在对互联网上下载得到的基因芯片实验数据进行分析与挖掘,以验证挖掘方法的可行性,并且寻找与乳腺癌疾病相关的差异表达基因及其相关基因、开关基因,为进一步研究提供候选基因,并为构建基因调控网络打下基础。方法:本研究运用显著性分析(Significant Analysis of Microarray, SAM)方法、顶级评分基因对(Top-Scored Pair, TSP)方法,来寻找癌组织与癌旁正常组织中呈现差异表达的基因;运用数据挖掘中的关联规则(Association Rule)方法、协同过滤(Collaborative Filtering)方法,来寻找具有相似或相反变化规律的共调相关基因、开关基因。首先从互联网上搜索得到基因芯片实验的原始数据,然后进行必要的数据预处理,再利用SAM、TSP、关联规则、协同过滤等方法,对数据进行分析与挖掘,找出差异表达基因及相关基因。结果:本研究将以上方法运用于乳腺癌的基因芯片实验数据的分析与挖掘,寻找到若干在癌组织与癌旁正常组织中呈现差异表达的基因,其中部分基因已被数篇文献报道过,认为其确与乳腺癌的发生与发展有密切的关系;同时寻找到若干变化规律相似或相反的基因及部分具有开关效应的基因,其中部分基因经查询可知确为在生物学意义上具有相关性的基因。结论:综合运用SAM和TSP方法来初步筛选显著性差异表达基因是有效的,它能在维持较低错误发现率时,发现较多数量的显著性差异表达的基因;运用关联分析和协同过滤方法来初步寻找相关基因是可行的,这样找出的基因确实是在生物学上具有共调节作用、因而具有共同变化规律的基因。寻找到的差异表达基因及相关基因可用于进一步的研究,并且为初步构建基因调控网络发挥基础作用。
其他文献
综述了透明聚丙烯(PP)的国内外研究现状,介绍了透明PP的制备方法、增透机理以及影响其透明度的主要因素(成核剂的用量、PP结构、增韧剂、挤出工艺等)。最后,针对国内透明PP研
议论文的论据有两种,一是道理,二是事实。用事实作证据来论证论点,能增强文章的说服力。今年高考的作文,一般考生都能运用史实中的事例来阐明论点。但是即使运用了同一事例
期刊
背景众所周知,肿瘤的形成是涉及到多种基因异常,最终导致细胞生长失控的病理过程。其发生、发展在本质上是由于细胞原癌基因的激活和抑癌基因的失活所致。以往对于基因表达异
从实际开发过程中来阐述设计理论,整篇文章体现了制动系统的复杂性和多样性。
在小学语文教学中,低年级的识字教学占据十分重要的位置,识字要为阅读和写作打下夯实的基础。中华民族文化博大精深,在识字教学过程中,不但要关注识字的数量与速度,更应该关
5月22日,由公安部、科技部和解放军总装备部共同批准举办的第6届中国国际警用装备博览会在北京国家会议中心开幕。作为2年1届的综合性警用装备展,中国国际警用装备博览会是唯一
路基土石混合填筑法能够弥补传统路基填筑材料粒径值小、承载能力差的问题,在高填方路基填筑过程中,能够削减填筑量,提高施工效率。以某山区高速公路土石填筑路基压实施工项
研究目的:运用糖蛋白质组学结合糖组学的研究方法,对不同恶性程度的肝癌患者血清蛋白质进行研究,结合蛋白水平及糖水平来探究肝癌转移相关的分子标志及其机制。研究背景:蛋白
本文设计了符合我国特点的生活事件调查表和量表,对100例确诊癌症病人进行了全面回顾性调查,并随机抽样,配对调查了100个年龄,性别、地区、职业相同的非癌症者,实验与对照组