面向非平衡数据的妊娠期高血压智能诊断与决策支持研究

被引量 : 0次 | 上传用户:xxm181512619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子病历使用的增加,医疗数据的智能化诊断具有极大的潜力。借助于人工智能技术,可避免由决策者经验不足、压力等导致的误诊,提高医院治疗质量和患者的生存率。妊娠高血压是一种常见的妊娠并发症,发生在妊娠后期,其症状包括高血压和蛋白尿。妊娠高血压的发生率在世界各地大约为2.5%~8%,可对母婴健康造成严重危害,包括胎儿死亡、早产、出生缺陷等。因此,对妊娠高血压的有效诊断和治疗显得尤为重要。本文以数据驱动的智能化医疗决策作为研究背景,以非平衡的医学数据作为输入,通过建立非平衡医学数据的分类模型实现对妊娠高血压疾病的智能诊断和决策支持。主要研究如下:第一,针对分类不平衡的医疗临床数据,本文采用了SMOTE+Tomek links混合采样算法在SMOTE过采样的基础上利用Tomek links对产生的噪声数据进行了删除,相较于其他采样算法提升了模型的分类能力。第二,针对现有的许多医疗评估模型往往只关注于获取高的预测分类精度而忽略对临床患者自身身体机能特征预先防范的重要性。基于此,本文提出一种改进的F-Score特征选择的算法。该算法通过对医疗数据中所有阳性样本和阴性样本平均值和少数类样本特征方差的计算,得到了每个特征变量的F-Score值,值越大说明特征的辨别能力越强。改进的F-Score特征选择的算法不但筛选出对于少数类分类更好的临床患者特征,保护了医疗数据的真实性的基础上给出了特征重要性的排序,提升了模型分类能力。实验证明,多个模型结合所提出的智能特征选取算法后,预测性能都有一定的提升。其中Bagging的AUC从0.640提升至0.754,Ada Boost从0.634提升至0.695。第三,针对单一模型的泛化性和预测性能不高的问题,本文提出一种两层Stacking集成模型,该模型第一层使用了10种不同的基分类器,包括SVM、XGBoost、Random Forest等,再将第一层10个模型的预测输出经过10折交叉验证后作为输入传递给第二层的LR模型并获得最终的预测结果。此外,针对Stacking中基分类器较多的情况下,性能较差的分类器会影响到全局的预测性能,本文提出一种基于遗传算法的集成策略对Stacking第一层的多个基分类器的基础上进行多点交叉、变异后用AUC作为适应度函数不断迭代选择,优胜劣汰,最终得到了最优的模型组合,解决了手动筛选分类器效率低下,不好的分类器会影响到全局分类能力的问题。实验结果表明所提出的基于遗传算法的Stacking模型的召回率、F-measure、AUC分别为0.752、0.716、0.818,优于其他多种分类模型的性能。本文所提出的模型为大型集成策略奠定了一定的基础,对我国的智能化医疗诊断做出了一定的贡献。
其他文献
坍塌压力是优化钻井液密度、维持井壁稳定的重要基础参数,对保障油气井安全高效钻井具有重要作用。为了解决传统坍塌压力预测方法存在的计算过程繁琐、预测精度较低等问题,采用随机森林、多项式回归等4种机器学习模型,建立了斜井坍塌压力机器学习预测方法,利用参数随机采样和传统解析模型生成了训练样本,优选了最佳模型,优化了训练样本数量、神经网络结构和模型超参数,并以Z-1井为例验证了该预测方法的可靠性和准确性。研
期刊
本文系统分析高湿玉米收获、青贮加工、饲用价值和经济效益以及在我国发展高湿玉米青贮的潜力和展望。相比玉米子粒直收和破碎等,高湿玉米青贮能够降低成本25%~30%,且具有和干子粒玉米相似的能量和蛋白。饲喂效果研究表明,使用高湿玉米青贮饲料产奶净能提高5%~10%,淀粉消化率提高30%~35%。同时,高湿玉米裹包青贮饲料可以安全存放2~3年。针对我国东北和黄淮海玉米主产区,玉米子粒收获后烘干、晾晒、仓储
期刊
通过使用恒温反应分光光度系统,建立基于恒温催化反应过程中实时测定吸光度的漆酶活性快速测定方法。酶的催化反应与吸光度的检测在同一时空进行,实现了检测过程中酶催化反应温度的精确控制及催化反应时长的精确计量。通过考察与催化反应体系溶氧浓度相匹配的底物2,2’-连氮基-双-(3-乙基苯并二氢噻唑啉-6-磺酸)二铵盐[2,2’-azino-bis(3-ethylbenzothiazoline-6-sulfo
期刊
在“3060双碳目标”背景下,能源高效输运与合理利用是实现碳中和的重要路径之一,而换热器在能量输运与转换中的作用至关重要。相较于传统换热器,微通道换热器在维持同等换热能力的同时,大幅减小了体积,极大提高了传热效率,在很多重要领域均有应用。超临界CO2(S-CO2)发电系统、跨临界热泵和制冷系统等因环境友好和效率高等优势,在“双碳目标”背景下具有重要的应用前景。S-CO2物性剧烈变化以及系统对高温高
期刊
在同一岩性地层中,由于钻速、转盘转速、钻压、钻井液密度和岩石密度等录井参数存在不确定性,导致基于录井参数的随钻地层压力预测存在一定的不确定性。针对该问题,分析了钻速、转盘转速、钻压、钻井液密度和岩石密度等录井参数的不确定性特征,进而采用改进的Rosenbluthe方法推导得出dc指数、上覆地层垂向应力及随钻地层压力的不确定性分析表达式,同时提出了基于录井参数的随钻地层压力不确定性分析方法,最后得到
期刊
渤中油田沙河街组地层火成岩发育、地质情况复杂,钻遇该地层常会发生裂缝性漏失。学者结合本构模型和破坏准则建立了多种解析模型和数值模拟方法,但深部地层地质力学参数(地应力大小、方向等)及岩石力学参数(泊松比、弹性模量等)呈现出较强的波动性,地层漏失压力实时预测准确度低。本文结合多元时间序列回归算法,训练得出针对渤中区域测井数据的机器学习模型,以钻井参数反演测井数据,实现了钻头处岩石、地质力学参数实时求
期刊
<正>中国是世界上最早种植茶树和制作茶叶的国家,自古以来,中国人就喜欢以茶待客、以茶交友,通过古老的丝绸之路、茶马古道、万里茶道等,中国茶传播到全世界。近年来,“茶的国度”掀起咖啡热潮,新式饮品不断推陈出新,更符合现代人健康理念、更满足中国人口味的中式咖啡正在不断涌现。
期刊
巧家县位于云南省昭通市,是典型的山区农业县,具有丰富的草地资源和饲草料资源,发展肉牛产业具有得天独厚的优势。肉牛养殖具有效益高、前景好的优点,已成为当地养殖者增收致富的有效途径和支柱产业。笔者从巧家肉牛养殖现状入手,简析当地肉牛产业发展的优势及存在的问题,探讨发展肉牛产业的相应对策,为促进当地肉牛养殖业发展提供参考。
期刊
通过1∶2的比例建立水力学模型并应用正交表L25(56)设计正交实验,对国内某公司的3t钒铁炉进行底吹N2模拟,研究三点底吹条件下不同底吹位置和底吹流量对钒铁液混匀时间的影响.结果表明,最佳的底吹方案为:模型底吹流量为1306 L/h,底吹点位置为e(0.7R)、d(0.6R)、e(0.7R);底吹流量和底吹位置对混匀时间均有显著性影响,对混匀时间进行拟合可知混匀时间与底吹流量呈幂指数关系,指数值
期刊
矿山测量工作中存在着较多的问题和误差,就必定会对矿山测量工作造成不良的影响,严重的情况下,还会致使测量工作出现失败的问题。所以,就需要对防御机制进行充分的运用,以此来防止错误不断的发生,进而保障矿山测量工作可以顺利的开展,凸显出其本身的合理性与科学性。基于此,笔者将结合自己的经验,就矿山测量工作常见失误原因及控制措施进行分析,希望可以为相关人士提供一定的参考和帮助。
期刊