不平衡数据处理方法对中药不良反应预测的应用研究

来源 :世界科学技术-中医药现代化 | 被引量 : 0次 | 上传用户:gwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:针对中药不良反应数据的不平衡性,探索并应用不平衡数据的处理方法,对中药的不良反应进行预测.本文以使用丹红注射液的患者为研究对象,对来自37家医院集中监测数据进行深度挖掘,在使用了丹红注射液的患者中预测是否发生不良反应.方法:从数据层面采用四种方法:不处理、随机欠采样、随机过采样、SMOTE采样;从算法层面采用四种模型或算法:决策树、随机森林、AdaBoost算法、Gradient Boosting算法,对数据的不平衡性进行处理.两个层面的方法两两结合,对16种方法与模型或算法组合的预测效果进行比较.结果:随机欠采样和AdaBoost算法相结合、随机欠采样和Gradient Boosting算法相结合的预测效果较为理想,recall和G-mean都达到80%以上,AUC指标也高达0.86.结论:初步探索中药不良反应可能适用的不平衡数据处理方法,预测结果结合实际经验,能较准确地预测使用了丹红注射液的患者是否发生不良反应,在临床实际应用中能起到一定的警示作用.同时,根据输出的变量重要性排名,能最大程度地避免用药后的不良反应的发生,为丹红注射液的安全性再评价提供一些科学参考依据.
其他文献
足球是世界第一运动,足球教学已成为体育教学的重要组成部分,受到了各高校乃至全国各界人士的关注.足球水平的提高要靠足球教学,而作为足球教学重要手段的足球教学方法对足球
2014年12月29日,北大荒垦丰种业股份有限公司与湖南农业大学签署校企战略合作协议。
张作霖称关玉衡为“福将”  关玉衡,名瑞玑,号玉衡,化名国尔家、郭尔佳。满族,祖先为长白山麓叶赫部落瓜尔加氏,正黄旗。1989年生于吉林省宁安县(今黑龙江省宁安市)宁古塔城。
上一期刊登的杨晓敏等[1]的研究进一步证实了许多我们已知的采用奥氮平、喹硫平和利培酮治疗近期发病的精神分裂症患者.治疗的有效率高,存在高风险的体重增加.此外,药物的疗
俄国文学理论家维谢洛夫斯基提出历史诗学的理论,他所理解的文学史不属于一般的文学史定义,而是用历史诗学的眼光观察的文学史。我们在《历史诗学》中可以发现,维谢洛夫斯基
期刊
期刊
国家统计局近日公布的数据显示,我国粮食总产量今年实现十一连增。其中,产粮大省黑龙江省粮食总产比上年增产47.6亿斤,全省粮食总产达到1248.4亿斤,占全国粮食增产总量的近一半,再
目的了解0~6岁儿童乘车安全相关行为,分析父母在儿童安全乘车方面的认知情况。方法采用自填式问卷调查的方法对0~6岁儿童父母进行调查。对0~3岁儿童家长,通过上海市长宁区10
在社会转型过程中,农村基础教育出现了“升学主义”盛行、农村学生受歧视、辍学问题突出、“留守儿童”教育缺失等问题。只有重新定位农村基础教育的价值、发挥基础教育的文化