论文部分内容阅读
乳腺癌是女性主要恶性肿瘤之一,在我国其发病率呈不断上升趋势,在北京、天津、上海等大城市已跃居女性恶性肿瘤首位,10年来我国城市、农村的乳腺癌死亡率均上升了约40%。尽管近年来乳腺癌的诊疗水平得到了长足的进步,但总的来说其现状仍远不能令人满意。目前乳腺癌诊断主要依靠自我检查、临床体检及影像学检查如钼靶摄片、B超等,但对于肿块较小甚至不能触及肿块的患者,以及对大部分乳腺组织较致密、脂肪组织不多而不适于钼靶诊断的东方女性而言,仅依靠上述传统手段进行诊断往往存在一定的困难。乳腺癌的术后疗效评价、预后估计和随访目前也主要依赖于上述经典手段,但效果往往难以令人满意。上述领域存在的问题使临床寄希望于理想的乳腺癌肿瘤标志物的帮助。现有的乳腺癌肿瘤标志物如CA15.3、CA27.29、CEA等普遍存在阳性率低、灵敏度和特异度难以兼顾的问题,早期诊断价值低,虽在乳腺癌复发和转移的监测中有一定参考价值,但远不能满足临床实际应用的需要。寻找灵敏、特异、检测方便的新肿瘤标志物己成为基础研究向应用研究过渡的热点之一。 蛋白质而并非核酸才是生命活动的具体执行者和体现者,因此深入研究乳腺癌的发病机制,寻找特异、灵敏的标志物用于早期诊断和术后随访监测,客观上要求在蛋白质组的水平进行进一步探索。近年来开展的表面加强激光解吸电离-飞行时间质谱(Surface Enhanced Laser Desorption/Ionization Time-of-Flight MassSpectrometry,SELDI-TOF-MS)技术为这一探索提供了优良的技术平台。这一方法最大的优势在于高通量、高灵敏度的实现了质谱技术对临床样本的直接检测。 生命科学的迅猛发展使人们从基因组学、蛋白质组学等研究领域中收获了大量的数据。对如此浩如烟海的数据进行处理,仅仅依靠传统的数理统计手段是很难胜任的,生物信息学的发展为收集、存储、分析其数据,并从中获取有用的生物学信息提供了重要的手段。浙江大学博士学位论文 本课题旨在应用SELDI蛋白质指纹图谱和生物信息学技术从血清中筛选乳腺癌蛋白质肿瘤标志物并构建检测模型(pattem);建立组织蛋白质指纹图谱的检测方法从而寻找乳腺癌/正常乳腺组织间的差异表达蛋白质;并利用生物信息学方法 .如君对乳腺癌6DNA微阵列数据进行分析。以期找到适合乳腺癌早期诊断、复发转移监测的候选肿瘤标志物,为其分离、纯化、解码、相应单克隆抗体和多肤瘤苗制备等进一步研究提供资源和基础,为探索乳腺癌发病机制提供新思路,并为进一步SELDI蛋白质指纹图谱和cDNA微阵列的联合检测打下生物信息学基础。第一部分血清蛋白质指纹图谱在乳腺癌诊断中的研究 首先通过对芯片变异系数(C约的比较确定C犷值最小、稳定性和重复性最好的CM10芯片用于血清检测。用该芯片检测139例血清标本(乳腺癌63例、乳腺良性疾病36例、健康人40例)的蛋白质指纹图谱。得到的指纹图谱数据经校正、过滤噪音和聚类等预处理后,用t检验或Malm.认飞ithey秩和检验进行比较,寻找各组间的差异表达蛋白质峰。结合前一步比较所得P值和ROC曲线下面积(AUC)初步筛选、评价差异表达蛋白质峰。 乳腺癌患者和健康人之间找到表达差异有统计学意义的蛋白质峰39个(P<0 .05),其中7个峰的AUC值大于0.7。运用支持向量机1 000次5倍交叉验证从这7个峰中筛选出区分两组的最佳预测模型:3932m/Z+5635m/z,盲法验证总准确率为872%、灵敏度82.3%、特异度95.3%,Youden指数0.776,这一结果也得到了支持向量机“留一法”、人工神经网络5倍交叉验证和判别分析等其它生物信息学方法的验证,该模型对早期乳腺癌患者的检测能力不亚于对中晚期患者 (P>0.OS)。乳腺癌患者3932 mjz表达低于健康人,5635m/z表达高于健康人。乳腺癌患者和乳腺良性疾病患者之间找到表达差异有统计学意义的蛋白质峰18个,运用判别分析从中筛选出区分两组的最佳预测模型:2489、2976、16356、2024、2597和3443m/Z共6个蛋白质峰的组合,交叉验证准确率 80.8%、灵敏度82.5%、特异度77.8%,该模型对早期乳腺癌患者的检测能力也不亚于对中晚期患者 (P>O.05)。乳腺癌/健康人检测模型中的3932m/z和5635n订z在乳腺良性疾病患者的表达与乳腺癌患者相似。比较有/无淋巴结转移乳腺癌患者的指纹图谱数据,找到两组间差异有统计学意义的蛋白质峰9个(尸<0 .05),其中5个的组合(2565、浙江大学博士学位论文4073、40300、2160和2685m龙)可达到区分有无淋巴结转移的最佳效果,总准确率87.3%。第二部分血清蛋白质指纹图谱在乳腺癌术后随访中的初步研究 前一部分63例乳腺癌患者中的57例I~m期患者至今未出现复发、转移,收集其中6例患者术后不同时期的血清标本共8份,另有确诊复发或转移的乳癌患者8例,检测该16例血清的蛋白质指纹图谱,同前进行数据预处理和差异表达蛋白质峰的寻找。将6例无瘤生存患者的术前指纹图谱分别与其术后图谱、第一部分中健康人图谱进行比较,得到两次比较中均有统计学意义的蛋白质峰2个:3932m厄和5635m龙。比较6例术后无瘤生存和8例复发转移患者的指纹图谱,得到9个蛋白质峰的表达差异有统计学意义,其中包括5635m/z,但3932m/z的差异无统计?