论文部分内容阅读
目的:数据核查是临床试验质量的保证,也是数据管理的核心部分。只有真实可靠、完整规范的数据才能保证临床试验结果的客观可信,试验药品的安全性才能得到保障。随着药物研发的日益增多和临床试验内容复杂性的增加,传统纸质问卷已经不能满足临床试验不断发展的需要,电子数据采集(EDC)系统成为临床试验中常用的数据录入工具。EDC系统中嵌入的核查功能能够对缺失值,异常值,逻辑错误等数据问题进行核对并改正。通过EDC系统的核查功能,最大限度的减少了错误数据和缺失数据。临床试验过程中安全性评价是临床试验能够顺利进行的首要条件,而不良事件是临床试验质量控制的重点,也是临床研究评价药物安全性的重要数据。临床试验研究中不良事件的核查一般通过人工核查实现,如出现不良事件而接受医疗处理的受试者,就需要在合并用药中寻找医疗处理记录,并比较不良事件与合并用药记录的一致性及时间的合理性。这种做法需要专业的医学人员或有经验的临床监查员(CRA)去完成,耗费人力及时间,且容易产生人为错误。因此本研究的目的是通过机器学习的方法,学习不良事件数据及合并用药数据之间的映射关系,并将这种关系嵌入EDC系统中。方法:本研究通过随机森林的方法学习不良事件与合并用药的关系,采用R语言Ranger包实现代码。将每个不良事件与所有合并用药建立模型,得到每个不良事件所对应合并用药的重要性排序,取前30位结果查看是否有合理的合并用药,将合理的合并用药作为该不良事件对应的合并用药;为了进一步增加筛选结果的合理性,将每个合并用药与所有不良事件建立随机森林模型,得到每个合并用药对应的不良事件的重要性评分排序,若不良事件学习出的合并用药与合并用药学习出的不良事件相符合,则认为两者的关系是合理的。结果:研究中包含524种不良事件,684种合并用药。随机森林学习结果显示,常见且病因单一的不良事件学习效果较好,能够学习出合理的合并用药,如高血压、腹泻、掌跖红肿综合征等;当病因多样或不良事件是某疾病的伴随症状时,通过不良事件学习出来的合并用药效果较差,如血碱性磷酸酶升高、头晕等。在现有EDC系统中内置了相应算法,能够指导不良事件的漏报核查。当EDC中录入不良事件及合并用药后,系统能够自动审核不良事件与合并用药之间对应关系,通过合并用药的使用与否去追踪不良事件的缺失。若有缺失,系统会发出疑问提示。结论:随机森林学习的效果较好,本研究的成果将有助于研究者早期发现潜在的不良事件的缺失,提高临床试验研究的质量。