论文部分内容阅读
全基因组关联分析(GWAS)是研究复杂疾病相关位点的有效方法.在基因不确定情形下,传统方法利用基因填补方式估计基因概率,继而展开后续基因关联分析。我们对大样本基因考虑一个非参数可加模型对可加分量维数大而非零加性分量数目小的基因数据进行建模,其中加性分量利用B样条基函数的线性组合工具来近似拟合基因概率对性状表征的效应关系;选择非零分量是利用组Lasso惩罚来获得初始估计量。最后我们利用蒙特卡洛模拟证明,可加模型的组lasso方法在基因表达样本中的效果良好。