基于云计算的食源性疾病预测分析方法的研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xianxing599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年频频发生的食源性疾病事件,使得人们越来越关注食源性疾病问题。如今,食源性疾病已经成为世界各国重点关注的事件之一,人们在日常生活中通过饮食的各方面极有可能导致食源性疾病。且从研究现状来看,食源性疾病的安全意识和相关的食源性监测系统还没有形成规范化的管理与监督,食源性疾病预测分析中仍然存在数据挖掘技术效率不高和可视化技术效果不明显等问题。针对上述问题,本文对食源性疾病预测分析方法的研究,主要从以下三个方面展开:首先本文提出了Random Forests预测分析算法(Spark-IRF,Improved Random Forests algorithm based on Spark),该算法主要是从降维和权重投票方法两个部分来改进DRF(Dynamic Random Forests)算法。接着从准确率和召回率两个方面对实验数据分析,结果显示Spark-IRF算法在准确率和召回率上相比DRF算法、Spark-MLRF(Spark Machine Learning Random Forests)算法有明显的提高。其次提出了聚类可视分析算法WIK-means(the Weighted Intelligent K-means Algorithm),解决IK-means(Intelligent K-means)算法中存在的问题,即IK-means算法在计算数据点到质心之间的距离时,同等地对待每一个特征变量属性,可能会使得距离较远或者同等重要的两个相关属性被分配到不同的簇中,而导致数据结果失真。WIK-means算法在计算距离的过程中,对每个特征属性赋予相应的权重值来计算误差平方和的最小值。最后通过不同的聚类中心点不同的迭代次数,对K-means算法IK-means算法WK-means(Weighted K-means)算法DBScan算法、K-SCP算法和WIK-means算法进行分析,结果表明我们提出的WIK-means算法在时间效率和准确率方面都具有相对明显的优势。最后本文设计并实现了基于Spark的食源性疾病预测分析系统FASBSFD(Forecasting and Analysis System Based on Spark for Foodborne Diseases)。在该系统中,食源性疾病预测分析方法采用了Spark-IRF预测分析算法及WIK-means算法进行聚类可视化展示,最后通过食源性疾病数据验证表明该系统是可行有效的。
其他文献
在船后多桨同时工作的条件下,为得到较好的推进效果,不仅需要研究螺旋桨本身的性能,还需要考虑船与桨的相互作用以及各桨之间的相互影响。本研究通过模型试验验证CFD预报螺旋
The Anhui Wanxi Feather & DownCorporation is situated in Luan City, AnhuiProvince, with an area of 66,670 sqm, includingconstruction area of 18,000 sqm. It has
期刊
<正>在橡胶工业中,橡胶与纤维织物的界面处理手段最常用的就是间苯二酚-甲醛-胶乳(RFL)浸渍体系,但RFL体系中的间苯二酚、甲醛对人体肝脏和心血管都有毒害作用。本研究开发出
会议
数控机床是集机-电-液于一体的复杂系统,在生产加工过程中消耗大量的能量。随着节能减排战略的实施,对数控机床能耗的分析和预测已成为现代绿色制造领域不可回避的问题。本文通过数据拟合建立了基于铣削实验的机床能耗预测模型。利用灰色关联分析方法分析了切削参数对切削比能的影响规律。利用MATLAB软件建立基于支持向量机的切削比能预测模型,实现对数控加工能耗定性定量的认识,进而达到节能减排,实现绿色制造。主要工
期刊
目的观察早期综合康复治疗对脑卒中后并发症的影响,分析其治疗机制。方法对2006年1月至2007年6月收治的112例脑卒中患者随机分为治疗组(52例)和对照组(60例),总结早期康复治疗对脑
探讨了不同种植密度对杉木生长的影响,以及杉木适宜的种植密度。对不同种植密度对杉木林分生长现状进行了调查,并测定了单株叶面积和叶面积指数。结果表明:在密度超过3400株/km
<正>在崇安区学习的特殊需要儿童是幸福的,因为这里有一群充满理想和人性美的特殊教育工作者,他们在特殊教育的园地始终做着一个同样的梦:梦想着学校是脱俗的,她有最人本的办
会议
目的:观察0.75%罗哌卡因用于剖宫产手术蛛网膜下腔阻滞的量效关系。方法:选择足月、单胎产妇120例,按蛛网膜下腔阻滞的用药量(0.75%罗哌卡因原液)随机分为4组:Ⅰ组为1.5 mL;