NER通路多个SNP对肺癌易感性的交互作用研究

来源 :复旦大学 | 被引量 : 7次 | 上传用户:lele5126596
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景肺癌是当前全球受累人数最多的恶性肿瘤之一,人群流行病学及基础病因学研究已经证实肺癌发生是遗传和环境因素的共同作用。在肺癌发生过程中,人类的防疫机制起着重要保护作用。目前已知人体内至少有130种DNA修复基因。这些DNA修复基因的多态性现象可能通过改变DNA修复能力,从而增加个体患肺癌的风险。NER修复通路就是其中一个重要的DNA修复系统。目前关于NER通路基因多态性与肺癌易感性关系的研究非常热门。然而由于生物学方面的因素,以及研究设计和统计分析方面的因素影响,即使是同类问题的关联性研究,其结果却很不一致。其中,最主要原因是由于样本量所限,不可能对各种可能的关联性分析到位,都是在某种角度上进行分析。目前,分子流行病学界比较关注的是基因与基因对患病的交互作用以及基因与环境对患病的交互作用。用于多基因联合分析的方法除了传统的多元Logistic回归模型外,还有报道多因子降维法(Multifactordimensionality reduction,MDR)、分类回归树(Classification and regression tree,CART)等数据挖掘方法,各种分析方法都存在一定的优势和缺陷,对其结果和作用都存在许多值得讨论和商榷的地方。关联规则分析被认为是可以从大量数据中筛选新颖、潜在未知的知识和信息的一种有效工具,可以为发现各种属性包括属性组合之间的复杂关联提供许多有益的信息,因此我们考虑利用关联规则对于样本量较大的基因多态数据进行筛选,找出比较理想的信息,为进一步分析中的Logistic回归模型提供有效的待选协变量(基因)。研究目的研究NER通路基因单核苷酸多态性(single nucleotide polymorphism,SNP)与肺癌易感性的关系,寻找多个SNP对肺癌的交互作用,以及合适的筛选和分析方法。研究方法基于NER通路SNP数据的特点,拟制定关联规则筛选准则并联合Bootstrap技术,筛选出那些包含肺癌患病可能的交互作用信息的SNP组合,然后用Logistic回归模型做确认性质的回归分析和检验。为了初步证实上述分析方法的有效性,采用小规模的随机模拟方法,设定随机模拟模型的参数,产生与实际资料性质基本相似的模拟数据;采用上述筛选和分析策略以及对应的统计方法对模拟数据进行分析,比较模拟数据分析结果与模拟模型设定的参数的差异,由此验证上述方法可行性以及其他相关方法(MDR)的适用情况。其中SNP数据模拟是根据特定的生物学背景和随机模拟模型,设置模型参数,通过MATLAB7.0软件编程实现,对应的病例对照疾病状态模拟数据根据模拟模型通过SAS9.13软件编程完成。关联规则挖掘采用经典的Apriori算法,选择Lift、Fisher’s确切概率P值、支持度和可信度作为关联规则的客观评价指标,通过这些指标的不同取值制定规则筛选准则,根据各个准则应用于模拟数据的结果对各准则进行评价,从中选择一种最有效的筛选准则用于实际资料分析。关联规则分析的过程采用SAS9.13软件编程实现。评价指标:①筛选准则的评价指标:100个模拟样本的规则集合中包含模拟模型预定变量及交互项的平均频数(Mean of Frequency,MF)、标准误(Standard Error,SE)、MF的95%可信区间(Confidence Interval,CI),以及筛选出的规则总数。②模型评价指标:Logistic回归模型参数估计的偏倚(Bias)、偏倚程度(Degree ofBias,DB)、95%可信区间的覆盖率(Coverage)。研究结果对初步的模拟数据分析发现:关联规则分析确能发现大量数据中各变量之间的可能潜在关联,包括变量间的交互作用。以Lift和Fisher’P值作为关联规则客观评价指标,结合Bootstrap抽样技术制定的规则筛选准则,确实能够有效地筛选出包含模拟模型中预定变量的规则。为了保证规则挖掘的成功率,应当将关联规则参数最小支持度(min_sup)和最小可信度(min_conf)设置的比较低。Bootstrap抽样技术的应用使得关联规则结果更稳定可靠。MDR方法的模拟数据结果提示:应用MDR方法不能得到真正意义上的交互作用,应避免误用。通过对实际资料分析,寻找到与肺癌易感性相关的两个基因多态位点XPG-rs732321和DDB2-rs830083,以及两个交互作用项ERCC1-rs3212930×ERCC1-rs3212951和ERCC2-rs13181×XPG-rs873601。XPG-rs732321的突变基因型(CC+AC)为肺癌的保护基因型(OR=0.54,95%CI=0.35~0.85)。基因位点DDB2-rs830083的突变基因型(GG+CG)为肺癌的危险基因型(OR=1.32,95%CI=1.03~1.70)。ERCC1基因rs3212930、rs3212951两个位点对于肺癌患病具有协同作用(OR=2.75,95%CI=1.1 8~6.64),同时携带这两个位点突变基因型的个体,相比仅有1个位点突变的个体,具有更高的肺癌患病风险。ERCC2-rs13181和XPG-rs873601两个基因位点间也存在交互作用(OR=2.43,95%CI=1.09~5.44),这两个位点同时突变的个体,相比仅有其中1个位点突变个体,以及两个位点都不突变的个体,都具有更高的肺癌患病风险。结论以关联规则客观评价指标支持度、可信度、Lift和Fisher’P值制定的规则筛选准则,联合Bootstrap抽样技术,确实能够有效地筛选到有价值的关联规则,发现数据中各变量之间的潜在关联,包括变量间的交互作用。以筛选到的SNP和SNP组合作为建立疾病相关的多因素Logistic回归模型的待选协变量,在Power较大的情况下,可以有效地找到与疾病相关的SNP和SNP间的交互作用。将本研究方法应用于NER通路SNP实际数据的分析,找到了与肺癌易感性相关的两个SNP位点和两个交互作用项。这些阳性结果均可以从生物遗传学角度得到合理解释。
其他文献
直接甲醇燃料电池(direct methanol fuel cell,DMFC)具有燃料廉价易得、储运方便、高效无污染等特点,作为便携式移动电源在通信、军事、交通运输等领域有广阔应用前景。但是,DMFC
合作学习是一种富有创意的教学理论与策略,简单的说:“合作学习就是以合作学习小组为基本形式,系统利用教学动态因素之间的互动,以团队成绩为评价标准,共同达成教学目标的教
舞蹈艺术是人类文化重要的组成部分之一,其来源于人们的生活实践,也是人们对更高层次生活的一种追求。随着农村经济水平的不断提高,农民的基本生活问题得到了解决,所以其有时
目的:观察加减黄连温胆汤对膳食诱导的MS大鼠的干预作用,并以脂肪细胞因子和内皮功能为切入点探讨该药作用的分子机制。方法:雄性SD大鼠60只随机分为两组,正常组10只,实验组50只,分
1977年,武威西郊林场西夏墓出土了31块彩绘木板画,木板画的出土为研究西夏绘画艺术、丧葬习俗以及服饰等提供了重要的实物资料。学术界一般认为武威出土的这批西夏木板画是墓
我国是农业大国,玉米是很多农户选择的经济作物。然而玉米种植中经常发生各种病虫害,若是没有先进的种植技术作为保障,便会影响玉米的正常生长。基于此,本文首先介绍了玉米种
自1990年我国上海证券交易所成立以来,客户证券交易结算资金一直采用证券公司存管模式,即由证券公司独立保管客户资金。由于该模式存在制度设计缺陷,加上证券公司法人治理结
目的分析基于中医护理干预探讨穴位按摩联合耳穴贴压对鼻窦炎患者疗效及安全性的影响。方法选择2018年1月—2019年5月在该院接受治疗的122例鼻窦炎患者。按照随机分组方法,将
宽带雷达在杂波抑制、检测与跟踪、目标识别、反侦察、抗干扰等方面潜在性能明显优于传统窄带雷达,是现代雷达技术的重要发展方向之一。但是宽带信号检测理论还没有建立起来,
目的应用个案追踪法对脑血管病患者营养管理流程进行分析,以改进临床护理质量。方法以患者个体进行个案追踪,从患者角度“看”医疗服务,分析一线临床工作人员及各部门的执行