论文部分内容阅读
研究目的:(1)基于转录组数据及分子生物学验证,筛选慢乙肝(CHB)及非酒精性脂肪肝(NAFLD)“异病同证”潜在特征m RNA。(2)计算CHB及NAFLD肝胆湿热证中医证候特征与核心基因之间的动态关联,探讨CHB及NAFLD“异病同证”关系机制,为CHB和NAFLD辨证施治提供客观依据。研究方法:(1)针对转录组表达谱数据的特征,设计随机方差模型RVM算法,利用GEO数据库中现有的表达谱数据进行RVM算法训练,获得差异表达基因筛选的最优参数。(2)收集CHB和NAFLD肝胆湿热证患者中医证候信息,采集CHB、NAFLD及健康志愿者血淋巴细胞样本,检测样本转录组(m RNA)表达谱数据,利用RVM算法筛选差异表达基因,对差异表达基因进行基因本体(GO)、KEGG等功能富集分析,获得CHB和NAFLD肝胆湿热证的特征生物物质基础;(3)利用Cytoscape程序构建CHB及NAFLD肝胆湿热证共表达基因调控网络。利用Cluster ONE程序进行网络核心Cluster筛选并重构核心Cluster网络,计算网络拓扑结构参数并筛选Cluster网络的核心节点作为重要的特征生物物质(m RNA);(4)分别对CHB及NAFLD肝胆湿热证中核心特征生物物质(m RNA)进行q RT-PCR验证,运用多元逐步回归、ROC分析方法确定CHB及NAFLD“异病同证”的核心特征生物物质。设计DFAA关联算法进行CHB及NAFLD肝胆湿热证特征生物物质与中医证候特征的动态关联分析,从物质基础及证候特征层面揭示CHB及NAFLD肝胆湿热证“异病同证”的内涵及关系机制。研究结果:(1)高通量转录组数据的随机方差模型RVM算法实现。以GEO数据库中GSE121248数据进行RVM算法训练,结果表明RVM算法可有效提高差异表达基因筛选效率。(2)CHB及NAFLD肝胆湿热证特征生物物基础。利用RVM算法分别对CHB及NAFLD肝胆湿热证的差异表达基因进行筛选,在p<0.001的条件下,CHB肝胆湿热证中获得有1618个差异表达基因,其中表达上调的基因有622个,表达下调的基因有961个;NAFLD肝胆湿热证中获得有343个差异表达基因,其中表达上调的基因有227个,表达下调的基因有116个。共表达基因分析显示CHB及NAFLD中有305条共表达基因,其中134条基因再两组中的表达趋势一致,171条在两组中表达趋势不一致。基因本体(GO)及KEGG通路分析显示这些共表达基因在CHB及NAFLD“同病异证”关系机制中具有重要作用。(3)利用Cytoscape软件构建CHB及NAFLD肝胆湿热证共表达基因调控网络,运用Cluster ONE方法对网络中的核心Cluster进行筛选并重构Cluster网络,计算Cluster网络的度分布(Degree)、拓扑系数(Topological Coefficient)、聚类系数(Clustering Coefficient)、中介中心性(Betweenness Centrality)、接近中心性(Closeness Centrality)等参数,按照参数平均值以上为标准筛选8个核心节点作为CHB及NAFLD肝胆湿热证共表达核心特征生物物质,分别为AK1、BLVRB、GLUL、NFIX、PTPRC、RIOK3、SHARPIN及SPTB。(4)运用q RT-PCR方法对CHB及NAFLD肝胆湿热证核心特征生物物质进行验证,多元逐步回归及ROC分析结果显示这8个核心节点是CHB及NAFLD“异病同证”关系机制中重要的特征生物物质。利用DFAA算法对CHB(n=385)及NAFLD(n=355)肝胆湿热证109个中医四诊信息与8个共表达基因进行关联分析并提取出25个与CHB及NAFLD“异病同证”关系机制密切相关的中医证候特征。结论:本研究通过随机方差模型RVM算法对CHB及NAFLD肝胆湿热证的差异表达基因进行筛选,并获得了305个共表达基因。利用Cytoscape软件构建CHB及NAFLD肝胆湿热证共表达基因调控网络并获得8个核心基因,分别为AK1、BLVRB、GLUL、NFIX、PTPRC、RIOK3、SHARPIN及SPTB。q RT-PCR验证及数据分析显示这些核心基因可能是CHB及NAFLD“异病同证”关系机制中重要特征生物物质。进一步对CHB(n=385)及NAFLD(n=355)肝胆湿热证109个中医四诊信息与8个共表达基因进行动态关联度分析,提取出25个中医特征信息可作为CHB及NAFLD“异病同证”关系机制的中医证候特征,并与8个核心共表达基因一起参与CHB及NAFLD肝胆湿热证病证关系机制的调控。