基于Spark和随机森林优化的糖尿病预测

来源 :电子世界 | 被引量 : 0次 | 上传用户:jfhz2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在非平衡数据的问题上,我们实验发现随机森林无法很好的解决这一问题.本文采用了SMOTE算法,能够有效的减少和降低数据集的非平衡性.在面对医疗数据高度特征冗余的特点上,该方案使用了基于随机森林和序联合搜索的Wrapper式特征选择算法.在构造随机树时,该方案使用了Spark实现随机树的并行构建,提高了运行速率.通过对随机森林优化后的模型与随机森林、K最近邻、神经网络和向量机等模型进行对比,实验结果表明,随机森林优化算法的精度达到81.13%,优于其他的4种分类模型.
其他文献
目前,随着铁路信号设备正逐渐向模块化、电子化、智能化发展,电源设备也逐步实现了模块化、高频化.其中,PWM控制技术在电源模块中的应用最为广泛,以实现对逆变电路的控制.TL494芯片作为PWM控制芯片电路的核心器件,具有结构简单、体积小、成本低、输出电压范围宽、过压、过流保护功能易实现等特点.
期刊
室内覆盖系统作为解决深度覆盖、提升用户感知和分流业务量的有效手段,近年在国内开展了大规模建设.由于目前各运营商的移动通信业务重点领域相似,室内覆盖系统的建设目标大多重复,如果由各运营商独立建设,不但建设协调工作量大,而且重复建设带来资源浪费也非常严重.在满足运营商网络性能指标的前提下,通过对室内站点进行共建共享,可有效节约建设资源和时间,降低对环境的影响,有助于解决站址资源稀缺场所进入难等问题.
期刊
在专业音响扩音系统中,最害怕的就是系统输出功率过载烧毁喇叭,因为扬声器系统在整个扩音系统中投资占比较大,伤不起.因此,在设计大型扩音系统的时候,一般都配置了防止输出过载的周边设备——压缩/压限器.由于噪声门的工作原理与压缩器相同,只是处理的信号对象不同,所以常用的压缩/压限器大多数都带有噪声门功能.为了使读者更容易掌握此类专业设备的用法,本文以市面上较为常见的dbx266xs(如图3所示)为例来进行论述.
期刊
本文分析探讨了插针XGPON BOSA封装方式和柔板软封装的各自不同点和优缺点,提出PCB Layout等长补偿改善插针XGPON BOSA封装方式眼图质量和接收灵敏度的可行性;通过硬件测试验证结果表明论文提出的PCB Layout等长补偿确实可以较大幅度改善XGPON ONU眼图质量,并提高ONU接收灵敏度.
期刊
本项目旨在设计一款基于MUC的智能药箱,通过控制主控板操作各类模块和传感器,形成一套完整的智能化医药箱.本项目主控芯片采用STM-32F103ZET6作为中央处理器,控制WiFi模块、GSM模块、DS1302、语言播报等外部器件.使用keil编写程序实现智能药箱的全部功能.
期刊
本文通过对比“3+0”和“2+1”布置的500kV HGIS,提出2+1布置的500kV HGIS在减少断路器检修的停电时间及解决不完整串设备采购上具有一定推广性.rnHGIS设备为半绝缘组合电气,除母线外,断路器、电流互感器、隔离开关等其余设备均布置于SF6绝缘筒内,因其占地小、受外界环境影响小等优点,在新建的变电站中得到了广泛应用.国家电网典型设计方案中有6个500-B方案均采用500kV HGIS设备.
期刊
为了解决场景理解在无标签数据时难以适用的情况,以及无监督学习的场景理解存在的鲁棒性差、未能满足多任务需求等缺点,基于Mask R-CNN、struct2depth、SfMLearner模型,通过模型训练、图像预处理、多任务耦合等方法,用拍摄的实景视频验证模型效果,并和原模型处理结果作对比.实验结果表明,进行预处理后的图像结果前景轮廓更加清晰,我们的模型实现了多任务的场景理解,而原模型仅实现了单一任务.改进的无监督学习多任务场景理解算法不仅提升了鲁棒性,而且直接反映了物体到相机的距离,同时提高了深度估计的精
期刊
为了提高智能网联汽车在运动过程中的精确度,文章基于模型预测原理对智能网联汽车路径跟踪控制器进行了分析、设计和仿真,仿真结果表明,该控制器具有更好的灵活性,能够根据不同运行工况控制车辆,达到较高的跟踪精度和行驶稳定性,并为后续的研究提供重要的依据.
期刊
近年来,基于深度学习的音频事件分类方法成为研究热点,但其嵌入式实现仍存在较多难点.论文由此出发,研究嵌入式GPU下的音频事件分类算法及软硬件实现.硬件上,采用环形麦克风阵列和Jetson Nano完成音频采集及音频分类处理.算法上,研究两张基于多重卷积神经网络块结合池化层的方法,并在卷积层后叠加BN层和RELU激活函数.软件上,实现Python下的音频采集、算法实现及指标输出.实验对比证明,论文提出的网络一和网络二的分类准确指标mAP的值为0.431/0.343、AUC的值为0.973/0.965、d-p
期刊
牵引变电站既有保护采用面向设备一对一的元件保护,其后备保护通常按阶梯时限来整定,保护动作时限长,不能快速切除故障,同时不同元件的保护相互独立,信息不共享,基于本地信息的保护决策也难以对各类故障做出最优判断,不能满足目前高速铁路对继电保护更高、更严的要求.
期刊