论文部分内容阅读
实证研究中的真实数据往往不完全符合模型的分布假设,存在污染数据的情况。大数据时代,大规模数据集的污染情况更加普遍。针对当数据存在不同来源污染时,构建基于最小密度势差异准则的成组Bridge模型,并设计有效算法完成稀疏成组变量选择。数值模拟研究说明该方法在不同污染数据情形及污染比例下具有良好的稳健性与稀疏性。关于婴儿出生体重影响因素的实证研究展示了该方法在应用研究中的优秀表现。