基于云平台的预测分析算法的研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:arile1027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测是依据已知事件预估未知事件的一门科学,在这个大数据盛行的时代,将机器学习用于预测能大大提升预测的精度和性能。目前,已经有很多相当成熟的机器学习算法被用于做预测,比较典型的有C4.5决策树和BP神经网络。C4.5决策树递归的利用属性的信息增益率来选择分裂属性和构造分枝,直到决策树构造完成。BP神经网络是一种利用误差逆传播来调整权值直到获得最优权值为止的非线性学习算法。迄今为止,已经有许多关于C4.5决策树和BP神经网络算法的改进,但它们仍然存在着一定的不足。C4.5决策树算法对于内存具有很强的依赖性,当训练样本集的规模超出内存允许的大小时,如果不做一些处理,根本无法构造决策树。本文针对此问题提出了先用K-means算法对训练样本集进行聚类操作,然后选取聚类中心点和距中心点大于等于一定距离的点为最终的训练数据,以达到缩减数据规模的目的。BP神经网络的计算复杂度与网络的结构有很大的关系。本文首先使用遗传算法优化网络的权值和阈值,然后利用训练时各个样本在隐含层各神经元输出的平均值的线性关系,删除冗余节点,不断缩减网络结构,选择连续若干次训练后相同的隐含层神经元个数为最佳的神经元个数。两个算法均采用公共自行车租借需求的数据进行实验验证,实验结果显示,本文提出的改进思想在精度影响可接受范围内提升了算法的执行效率。在对算法进行了改进之后,本文将算法开发成组件并集成到某企业已有的海量数据分析平台中,然后结合场景数据,开发和集成了公共自行车租借需求预测和广告点击率预测两个应用。
其他文献
目的对护生在护理技术实践操作中发生锐器损伤的原因进行分析,从而提出有效的防范措施,降低护生锐器损伤的发生率,增强护生的安全防范意识。方法采取自制问卷对我院2015级5个
铆工工艺是铆工的专业课,是数学、机械制图、公差、材料、测量等课程的综合,将理论和实际操作融合一体,按“工序模块”教学,有利于学生对知识、技能的掌握,收到了事半功倍的
<正> 6月25日,日本空天飞机研究委员会向日本科学技术机构建议,明年开始研制一种不载入的三角翼小型空天飞机,1993年在 H-2一次使用运载火箭上进行第一次发射。该委员会建议
茶文化是中国民族传统文化的重要组成,具有深厚的思想内涵和文化底蕴。本文以《六口茶》为代表的土家族茶文化进行分析,对其所涉及的专业茶语进行解读,以获得更加丰富的茶文
针对现阶段文本信息隐藏算法嵌入率低、隐匿性差、容易被机器检测等问题,本文提出一种基于句式控制的宋词载体文本信息隐藏方案。通过分析宋词格律模板中韵律与词性的关系,设
目的应用免疫组织化学和RNAscope技术分别检测胃肠道间质瘤(GIST)中程序性死亡分子-1(programmed cell death-1,PD-1)、程序性死亡配体-1(programmed cell death-ligand 1,PD-L1)蛋白和m RNA的表达,并对比分析两种方法的检测结果,探讨PD-1、PD-L1m RNA的表达与GIST临床病理参数之间的关系及其意义。方法收集华北理
涡激振动既能够引起结构部件的疲劳破坏又能够通过振动能量收集装置为人类提供新型清洁能源。因此,无论是从抑制振动角度或高效利用振动能量角度,涡激振动机理一直是流固耦合
高硬金属材料广泛地应用到齿轮、轴承、叶轮叶片等重要零部件中,而干硬切削技术具有加工精度高、加工效率高并且能够实现绿色加工等优点,从而广泛地应用到高硬金属材料加工。
中广联合会信息资源产业发展工作委员会每年举行一次论文征集活动,方便行业的经验交流,是媒体资产研究成果的重要展示平台。通过对这一平台的获奖论文的分析研究,可以一窥这
对庐山会议一般人的印象多是批判彭德怀等人的所谓"右倾"错误。然而这并非庐山会议的历史全貌,按照既定议程,"读书"被列为此次会议的"第一议题";而且会议结束后,毛泽东等中央