基于non-local先验的贝叶斯变量选择方法及其在极高维数据分析中的应用

来源 :山西医科大学 | 被引量 : 2次 | 上传用户:h_heart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:本文通过模拟研究比较基于non-local先验的贝叶斯变量选择方法、ISIS-SCAD、ISIS-MCP在极高维数据分析中的表现,并将其应用到弥漫性大B细胞淋巴瘤(DLBCL,diffuse large B cell lymphoma)基因表达数据中,找出与DLBCL分型有关的基因,为临床上DLBCL的诊断和治疗提供依据。方法:介绍基于non-local先验的贝叶斯变量选择方法—乘积逆矩先验(piMOM,product inverse moment)的基本原理,并将其与ISIS-SCAD、ISIS-MCP方法应用到二分类logistic回归中。模拟研究中,根据协方差结构的不同将协变量间相关程度分为三种情况:相互独立、复合对称相关、自回归相关;样本量n=50、100、200、400、600;自变量维数p=1000、3000,从模型相合性和模型预测准确性两个方面,评价不同极高维情况下三种变量选择方法的表现。实例分析中,将包含350个病人,3237个基因的DLBCL数据分为训练集(n=245)和测试集(n=105),分别运用piMOM、ISIS-SCAD、ISIS-MCP方法进行建模并验证,用AUC评价三种模型的优劣。结果:模拟研究发现:在p=1000和p=3000情况下,三种方法筛出的变量平均真阳性数大致相等,ISIS-SCAD、ISIS-MCP方法的平均假阳性数和预测均方误差、回归系数均方误差却明显高于non-local先验方法,且non-local先验方法随着维数的增加波动较小,较ISIS-SCAD、ISIS-MCP方法稳定。DLBCL基因表达数据经piMOM分析发现4个有意义的基因(MYBL1,CYB5R2,MAML3,BTLA),AUC为0.989;ISIS-SCAD发现7个有意义的基因(MYBL1,CYB5R2,MAML3,TNFRSF13B,S1PR2,SLC25A27,GAB1),AUC为0.981;ISIS-MCP发现5个有意义的基因(MYBL1,CYB5R2,MAML3,CHST2,SUB1),AUC为0.962。三种方法均筛出的基因为:MYBL1,CYB5R2,MAML3。结论:基于non-local先验的贝叶斯变量选择方法在模型选择和预测准确性方面优于传统的惩罚类方法,在一定程度上可以较好地控制假阳性率。MYBL1,BTLA,CYB5R2,MAML3可能与DLBCL分型有关。
其他文献
篮球人盯人防守原则和防守体系马新民篮球运动是由进攻与防守两方面组成的.是一项集体的对抗性运动。由于比赛中进攻与防守反复交替,所以决定了篮球运动的进攻和防守处于同样重
美术教育作为审美教育的重要内容,担负着幼儿认知能力的发展,它是幼儿心理发展的感性表现,是幼儿情绪的表达,并能启迪幼儿的创新能力,从而对幼儿人格的全面和谐发展起到协调
目的:研究中药鳖甲煎丸对慢性肝炎肝纤维化的治疗作用.方法:用肝穿或RIA法测定血清肝纤维化指标如透明质酸(HA)、Ⅲ型前胶原(PCⅢ)及层粘蛋白(LN)等,筛选出肝纤维化指标明显
美术教育理论学习是艺术教育的重要组成部分,美术教育理论遵循自身的发展轨迹,有着深厚的理论内涵,其分野与融合所呈现的理论体系对于开展美术教育活动提出许多新挑战、新命
舞蹈音乐是舞蹈表演的重要基础和组成内容,舞蹈音乐结构也因此在很多方面影响着舞蹈表演。本文从舞蹈音乐结构和舞蹈表演之间的关系着手,论述了两者如何实现统一,实现舞蹈的
<正>摄影术自1839年诞生以来,先后经历了达盖尔摄影法、卡罗摄影法、湿版摄影法、干版摄影法与胶片摄影法,近百年来,无论在专业摄影还是业余摄影中,使用最广泛、影响最大的是
儒家文化是中国传统文化的主流之一。中国古典舞是从古至今都受着这种传统文化的影响,继承着这种民族哲学的思想和审美原则。它运用了中国传统文化《易经》中的世界观(阴阳),
第一部分超声测量兔眼动脉及视神经的可重复性及一致性研究目的探讨彩色多普勒血流显像技术(CDFI)测量兔眼动脉(OA)血流动力学参数以及经眼眶超声(TOUS)测量兔视神经直径(OND
本文通过对陕西凤翔传统泥玩具泥塑虎的用途、造型、图案和色彩的逐一分析,尝试挖掘出传统泥玩具所传达出的人文内涵,寻找泥塑玩具的设计原点,探讨新时代泥塑玩具所应具备的
本报讯(本报记者 刘蓟奕 特约通讯员 李林峰)6月21日,江津区德感工业园与重庆红蜻蜓油脂有限责任公司签订15亿元投资协议,在江津粮油生产加工基地建植物蛋白加工厂及粮油物流
报纸