随机森林模型在数据核查中的应用研究

来源 :南京医科大学 | 被引量 : 2次 | 上传用户:jingqihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:数据核查是临床试验质量的保证,也是数据管理的核心部分。只有真实可靠、完整规范的数据才能保证临床试验结果的客观可信,试验药品的安全性才能得到保障。随着药物研发的日益增多和临床试验内容复杂性的增加,传统纸质问卷已经不能满足临床试验不断发展的需要,电子数据采集(EDC)系统成为临床试验中常用的数据录入工具。EDC系统中嵌入的核查功能能够对缺失值,异常值,逻辑错误等数据问题进行核对并改正。通过EDC系统的核查功能,最大限度的减少了错误数据和缺失数据。临床试验过程中安全性评价是临床试验能够顺利进行的首要条件,而不良事件是临床试验质量控制的重点,也是临床研究评价药物安全性的重要数据。临床试验研究中不良事件的核查一般通过人工核查实现,如出现不良事件而接受医疗处理的受试者,就需要在合并用药中寻找医疗处理记录,并比较不良事件与合并用药记录的一致性及时间的合理性。这种做法需要专业的医学人员或有经验的临床监查员(CRA)去完成,耗费人力及时间,且容易产生人为错误。因此本研究的目的是通过机器学习的方法,学习不良事件数据及合并用药数据之间的映射关系,并将这种关系嵌入EDC系统中。方法:本研究通过随机森林的方法学习不良事件与合并用药的关系,采用R语言Ranger包实现代码。将每个不良事件与所有合并用药建立模型,得到每个不良事件所对应合并用药的重要性排序,取前30位结果查看是否有合理的合并用药,将合理的合并用药作为该不良事件对应的合并用药;为了进一步增加筛选结果的合理性,将每个合并用药与所有不良事件建立随机森林模型,得到每个合并用药对应的不良事件的重要性评分排序,若不良事件学习出的合并用药与合并用药学习出的不良事件相符合,则认为两者的关系是合理的。结果:研究中包含524种不良事件,684种合并用药。随机森林学习结果显示,常见且病因单一的不良事件学习效果较好,能够学习出合理的合并用药,如高血压、腹泻、掌跖红肿综合征等;当病因多样或不良事件是某疾病的伴随症状时,通过不良事件学习出来的合并用药效果较差,如血碱性磷酸酶升高、头晕等。在现有EDC系统中内置了相应算法,能够指导不良事件的漏报核查。当EDC中录入不良事件及合并用药后,系统能够自动审核不良事件与合并用药之间对应关系,通过合并用药的使用与否去追踪不良事件的缺失。若有缺失,系统会发出疑问提示。结论:随机森林学习的效果较好,本研究的成果将有助于研究者早期发现潜在的不良事件的缺失,提高临床试验研究的质量。
其他文献
当今社会,风险已经渗透到了社会的方方面面。审计人员如何识别、评估风险,如何考虑风险对环境审计活动的影响,并采取措施来应对风险就成为现代环境审计需要关注的重要问题,而
随着计算机技术的普及和项目反应理论(Item Response Theory,IRT)的发展,计算机自适应性测验(Computerized Adaptive Testing,CAT)正日益成为国际上大型测验的主流。由于CAT
当前世界各国的养老保险制度都不同程度地面临人口老龄化的冲击,为了防范将出现或己经出现的养老基金支付危机,许多国家纷纷从建立基金积累制和相应的市场化投资运营管理体制
肺癌是临床最常见的恶性肿瘤之一。但目前西医和中医的疗效都不尽如人意。其原因首先是肺癌究竟属于中医什么疾病概念不清,以往只是简单罗列,认为属肺积、痞癖、咳嗽、咯血、
随着高精度同位素年代学研究的深入,一些长期被认为属于海西期甚至加里东期的地质体被证明形成于印支期。在新疆及其周边的广大地区,印支运动主要表现在下述3个方面:①以中酸
完善的职业教育政策支持系统是保障高技能人才健康成长发展的先决条件。通过对具有湖湘文化与工匠精神双重特质的“芙蓉工匠”进行成长轨迹分析发现,当前湖南高技能人才成长
商誉历来是会计理论界和实务界关注的热门问题之一,但是目前对于商誉问题的研究比较集中于本质、确认和计量方面,对于商誉构成要素的研究无论是国内还是国外都少之又少,而且
<正>1830年,当以雨果为首的法国浪漫派同僵死的古典主义鏖战正急的时候,当雨果的浪漫剧《欧那尼》在法兰西剧院掀起巨大的冲击波的时候,一本销路并不畅通的长篇小说在巴黎悄
自2013年起,湖南卫视每年春节走进一个少数民族村寨,用直播的形式展现当地的民俗文化活动和生产生活故事,创新打造了《新春走基层》直播节目。全方位大容量的走基层报道让贫
无线通信系统的蓬勃发展使用户不仅能在移动中保持通信,而且可以随时随地获取信息。这不仅为基于位置的服务和应用提供了广阔的市场,也使得基于各种无线网络的定位技术得到了极