乳腺癌组织学分级特征基因提取及基因集富集分析

被引量 : 4次 | 上传用户:ycl12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是女性最常见的恶性肿瘤之一,而且也是妇女恶性肿瘤主要的死亡原因之一。乳腺癌多发于西方欧美国家,尽管死亡率已经逐渐得到控制并有所下降,但发病率一直居高不下。近年来,原为乳腺癌低发区的亚洲国家发病率也呈逐年升高的趋势。乳腺癌严重威胁着妇女的健康,但乳腺癌病因相当复杂,与遗传因素、激素、免疫及各种环境因素(理化、生物因子、生活方式等)有关。影响乳腺癌的预后因素很多,从病理角度分析,肿瘤的组织病理学类型和组织学分级是重要的预后因素。由于乳腺癌组织学分级能够提供重要的预后信息,在临床上早已得到医学工作者的认可。目前应用得最广泛的乳腺癌分级方法是B-R分级,也被称为诺丁汉分级系统。这个分级方法以肿瘤细胞的形态学和细胞学特征作为评价依据,综合腺管形成的程度、细胞核的多形性和核分裂计数3个方面的得分,将乳腺癌分为Ⅰ级(G1,高分化,生长慢),Ⅱ级(G2,中分化),Ⅲ级(G3,低分化,高度增生)恶性肿瘤。对大量病人进行的多变量分析表明,未治疗G1病人的5年生存率为95%,而G2和G3的乳腺癌5年生存率则分别只有75%和50%。因而,组织学分级可以独立于淋巴结和肿瘤大小,作为预测乳腺癌复发和死亡的一个重要的指标。虽然组织学分级对于判断预后的重要性已越来越受到重视,但由于在分级评估过程中存在着一些主观的成分,而且操作比较繁琐,所以乳腺癌分级的可重复性还不够理想,即在不同的观察者之间存在着不一致性,通常其重复性只有60%-85%。肿瘤的基因组表达模式反映了肿瘤的生物学特性,基因表达谱可用于区分无法用病理学方法区别的肿瘤类型,为乳腺癌的生物学研究和预后提供了一种全新的方法。通过基因芯片表达数据可以获得与乳腺癌组织学分级相关的分类特征,实现乳腺癌的正确组织学分类,为乳腺癌的诊断和预后提供可靠的预测依据。已有研究者利用基因芯片分析获得了乳腺癌预后的标记基因,这种方法比传统的预后标记能更准确地判断乳腺癌的预后,且在随后的实验中也进一步证实了结果的可靠性。然而,这些研究还存在缺陷,即预测和验证都采用同一组数据,进一步验证也没有采用其他数据集。另外,基因芯片表达谱中许多被测基因与样本的区分没有很大关系。在分类问题中引入这些不必要的基因,将增加分类问题中样本的维数,导致计算复杂度的增加,同时可能会产生一些不必要的噪声数据。如果存在能将两类区分开的较小的基因子集,将有利于生物医学工作者专门研究这些基因的功能,了解其生物意义,开发基于这些基因的价格低廉的癌症诊断芯片。因此,特征提取是DNA微阵列研究的一个很重要的内容,通过特征提取找到足够少的能够进行有效分类的基因子集是非常必要的。不同分级对应于不同的细胞分化程度,低分化的肿瘤通常预后更差。肿瘤细胞的分化程度基于病理上的组织学分级分类,虽然低分化的肿瘤预后更差,然而其中的分子机制却仍然不清楚。肿瘤细胞具有无限增殖维持肿瘤克隆生长的能力,这与干细胞最重要的特性之一——自我更新能力存在着惊人的相似性,表明肿瘤可能起源于正常干细胞或者其祖细胞。目前已经发现很多致癌基因可以干扰正常细胞的分化,这些基因同样也可以影响肿瘤细胞的分化。因此,控制干细胞功能的某些调控网络,可能在某些肿瘤中也同样发挥作用。我们通过对不同分化程度乳腺癌基因表达谱的基因集富集分析,以期发现不同分化程度的乳腺癌的基因表达差异,并能用于改善乳腺癌组织学的分级,从而更好地了解肿瘤细胞分化的分子机制及与正常胚胎干细胞是否存在联系。研究内容主要分为三个部分:第一部分:芯片数据质量控制从NCBI共享数据库GEO(http://www.ncbi.nlm.nih.gov/geo/)下载乳腺癌相关的基因芯片数据,登录号为GSE2109、GSE5460、GSE1456和GSE3494。用dChip对芯片数据进行预处理,以总荧光强度为中位数的芯片为基准,对所有芯片进行标准化,以PM/MM模式均一化各芯片中所有基因的表达水平。同时,对有污染的芯片进行校正,还原原始芯片扫描图像,生成芯片质量报告。根据探针污染率和探针交叉杂交率判别芯片的质量,将校正后探针交叉杂交和污染仍大于5%的样本分样本和临床数据缺失的样本排除在下一步分析之外。共有676个乳腺癌芯片样本达到质控标准,可以用于后期的数据分析,GSE2109、GSE5460、GSE1456和GSE3494分别有186、109、147和234个样本。表达谱的基因表达值以2为底进行对数转换,选择PM-only模式分析得出各芯片中所有基因的表达水平,随后按以下标准进行过滤:0.5<标准差
其他文献
本文以中国的西北地区为研究范围,从装饰艺术学科专业特色出发,对西北织毯装饰图案中的植物图案、几何图案、动物图案和宗教图案进行详细研究,并着重结合地域宗教,分析其文化
从2005年11月初至12月底,黑龙江省人大代表翟玉和出资10万元,组织3个调查组,历时50天,踏访31个省(自治区、直辖市),行程5万多公里,走访了万余名农村老人,对我国部分地区农村老
<正>五率是指开工率、竣工率、交付使用率、审计决算率、资金结算率,是集体企业对主业单位"三率合一"的进一步细化、分解与延伸。"五率同进"既是集体企业工程管理的目标,也是
目的:探讨使用消风散加减联合富马酸依美斯汀滴眼液治疗过敏性结膜炎的效果。方法 :选取近期江苏省中西医结合医院眼科门诊收治的71例(142只眼)过敏性结膜炎患者作为研究对象。随
本文从大学图书馆的选址、造型等方面,对高校图书馆人性化建筑理念进行分析。并结合东北大学图书馆建筑具体实例,剖析图书馆人性化建筑设计理念的实际价值和意义。
<正>2008年7月,河南省普通高中全面实施了新课程标准,从而拉开了河南省新课程改革的序幕。信息技术作为普通高中新课程的必修课程,改革的最终目标是要提升学生的信息素养。通
<正>《中国信息技术教育》杂志是中华人民共和国教育部主管,中央电化教育馆等单位主办的中央级刊物,是全国中小学、普通高校信息技术创新与实践活动(NOC活动)指定刊物。2013
室内软装饰设计是一个新的艺术设计门类,新的环境艺术设计理念与精装修房的大力推进给室内软装饰提供了广阔的平台与天地,从事室内软装饰设计与室内配饰工作的企业也在各地大
荧光增白剂(FWA)是一种光学增白剂,其二苯乙烯类产品广泛应用于纸张、纺织品等的增白,而其中的液体剂型产品又是最重要的一种。本文在已有的研究成果基础之上对二苯乙烯类液体F
水下海参自动识别是水下机器人捕捞海参的关键技术,为解决水下海参识别,基于深度残差网络构建了水下海参识别自动识别算法.研究图像数据采集自山东省海阳市千岛湖海参养殖场,