论文部分内容阅读
迄今为止,市场上超过70%的重组治疗药物是由CHO细胞所生产。根据细胞株和产品特点个性化设计CHO细胞培养基,可以提高产量和保证质量。而以往企业大多使用市售的通用型商业培养基,不仅配方保密难以满足优化需求,且供应存在不确定因素、价格较为昂贵。因此,近年来随着自主研发实力的增强,个性化定制培养基的需求愈发凸显,成为如今的发展趋势。CHO细胞培养基成分繁多,统计学作为一种节省人力物力的实验设计方法,被广泛用于CHO细胞培养基的开发。然而,传统DOE难以处理高维数据,依赖研究人员的知识和经验锁定研究范围,使得培养基开发周期随研究员素质波动,限制企业内部培养基开发流程的运行效率。因此,为了解决培养基开发的尾端问题,有必要引入高维算法并将各个环节进行整合优化,建立一个更加通用的CHO细胞培养基开发流程,为培养基的开发和生产提供相关指导建议。首先,本研究对历史实验数据进行分析,确认数据特征以指导方案设计。然后基于最大欧式距离选择培养基库,采用单纯形格子点设计生成混合实验。基于欧式距离的培养基库选择工具与传统的PCA选择方法相比,实验设计的线性相关性从0.60降低到0.50,设计空间从1.30扩大到1.80,数据利用率得以提升。随后采用非参数局部回归LOESS作为全局变量重要性分析方法解析培养基组分和产量间的关系,细胞株A实验结果表明,与传统商业软件SIMCA中的PLS相比,基于LOESS的分析准确率从20%提高至60%,更有助于认识培养基组分和产量间关系,从而指导后续预测模型的建立。根据产量非单峰分布特征,引入GMM联合GBDT建立预测模型,并确认叠加LOESS分析算法带来模型预测效果的提升。随后,基于预测模型对比遗传算法和不确定性分析的优化效率。细胞株A实验结果表明,遗传算法所生成配方较混合实验最优点产量提高5%,而不确定性分析提升24%,因此定为后续优化算法。另一方面,与传统PLS建立预测模型相比,GMM-GBDT模型平均预测准确率提高了 14个百分点,最高达87%。基于产量预测模型,引入LIME算法分析配方,发现对于细胞株A,B301/FM3F为最稳定的培养基组合,而S204B/S204F更易造成产量波动。进一步分析局部CPP得到配方中对产量影响较大的关键培养基组分,经假设检验发现局部CPP在±10%波动对产量具有显著影响,B301/FM3F和S204B/S204F配方组合稳定性存在显著差异,由此可验证配方分析工具的有效性。据此可评估产量可接受波动范围下的组分浓度控制范围,为生产稳定性控制提供指导建议。最后,采用上述建立的培养基开发方法,以表达IgG1抗体的细胞株B为对象进行应用。结果表明,通过不确定性分析优化算法得到4套培养基组合,产量从2.74 g/L提高至4.36 g/L,较混合实验提高了 59%;GMM-GBDT预测模型准确率达84%,据此进行配方分析发现BM31D/FM12D为最稳定的培养基组合,波动范围仅为配方BM38D/FM12D的64%;最后通过对局部CPP单因素实验结果进行假设检验验证了配方稳定性分析和局部CPP分析方法的有效性。通过本文研究,针对性地将培养基开发的各个环节进行整合,成功建立了一种更加通用的CHO细胞培养基开发方法,可对小样本进行多个指标分析,且对使用人员的专业要求降低。作为传统DOE软件的一个有力辅助工具,该流程可为培养基的生产提供相关控制指标,在保证稳定的前提下追求高产。