论文部分内容阅读
对于许多复杂的癌症疾病,单一的基因效应或单一的环境效应不能进行有效的预测判断,识别与复杂疾病相关的基因–环境交互作用成为了高维数据下病理学和生物信息学研究的一大挑战。对于生存数据高维度、异质性、删失性等问题,我们提出了一种基于AFT模型的识别基因–环境交互作用的方法。该方法创新地通过采用LAD损失函数和SCAD惩罚函数相结合的目标函数减除数据不平衡带来的影响并选出服从主效应与交互效应间的强层次结构的交互项,并利用CCCP算法对目标函数进行优化求解。利用R进行了仿真研究和实证研究,从这两方面验证了该方法能稳