监督学习算法在预测太阳能生产中的应用

被引量 : 0次 | 上传用户:rabeenzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘要:太阳能是一种具有对环境污染最小和二氧化碳排放最低的可再生能源。为了避免能源危机,人们将更多的使用太阳能。因此,估算太阳能发电厂所产生的电量是很有意义的。近几年,机器学习技术在太阳能发电站的能源分析与预测中成为热点。研究表明:监督学习算法能显著提高预测能力,从而为决策者提供更加灵活的解决方案和支持其决策的测试统计模型。论文针对太阳能数据的特点,对太阳能数据的预处理和预测方法进行了研究。本文首先介绍监督学习算法及其应用,然后分析和研究数据预处理的方法。结合太阳能数据的特点,提出利用均值的方法进行缺失数据的处理。对于训练数据集和验证数据集的获取,采用K层交叉验证方法对数据集进行处理而得到,并利用可视化技术从不同角度展示数据集的特点;最后使用Gradient Boosting、Random Forests和Extremely Randomized Trees三种监督学习算法在处理好的数据集上对太阳能进行预测和分析,得出Extremely Randomized Trees算法是最佳的预测太阳能的监督学习算法。本文还利用UCI数据集对这三种算法进行比较分析,实验表明Extremely Randomized Trees算法具有比较好的准确率和稳定性。本研究中所用的软件工具是Python和R。Python主要用于数据可视化,此外,利用Python的机器学习库可实现三种算法对太阳能的预测。R则是从Python获得上述算法的结果后实现其性能的比较。
其他文献
课题在调研了热量表的研究背景、意义和国内外研究现状的基础上,按照中华人民共和国城镇建设行业标准-热量表(CJl28—2000),以TI公司的16位低功耗Soc芯片MSP430F435,使用配对PT1000热电阻温度传感器和低功耗的无磁流量计,开发一个嵌入式户用热量计量表,且该热量表预留低压电力线载波模块的通信接口。论文就热量表的原理进行了简单论述,通过把工程热力学中的能量平衡方程应用到热量表中,得
匿名通信技术是一项重要的网络安全技术,旨在保证通信双方之间通信关系的隐蔽性。为了破坏匿名系统的匿名性,攻击者通过实施各种匿名攻击,达到揭露“谁和谁”正在进行通信的目的
随着当前互联网的高速发展,软件更新换代速度极快,互联网界兴起了敏捷开发的概念,其中持续集成是其中一重要原则。但是随着软件产品规模的扩大,编译任务量也随之增大,在有限的编译
随着Web服务技术的广泛应用,如何更好地按照用户需要发现、返回最优服务已成为急待解决的问题。目前对该问题的研究主要集中在基于语义的 Web服务功能匹配,但在实际应用中非功
随着计算机网络和应用的迅速发展,网络安全问题也日益突出。曾经作为最主要的安全防范手段的防火墙和入侵检测系统(Intrusion Detection System,IDS),已经不能满足人们对网络安
论文从地震数据的特点和约简需求出发,分析传统的粗糙集和基于优势关系的粗糙集在约简算法方面存在的问题,对经典粗糙集算法作出改进,提出一个基于优势关系的粗糙集模型,并把它集
书法及水墨画是中国重要的传统文化,其特有的水墨表现方式和抽象写意的画法与西方的绘画有很大的不同。为了能用计算机绘制出中国水墨画的效果,我们设计了一个虚拟毛笔和水墨传
随着计算机网络技术、存储技术、嵌入式技术的不断发展,用户保存的媒体文件不断增多,如何有效地管理多媒体资源就成为一个亟待解决的问题。因此,作者设计了这个基于嵌入式系
道路是遥感影像中重要的地物信息,其智能识别与定位对于电子地图的动态更新、影像数据库的建立、遥感影像的分析等领域都具有重要的意义。本文针对高分辨率遥感影像城市道路的
肺癌的死亡率远高于世界上其它的癌症。在全世界,每年死于肺癌的人数超过1000000,这个数字远高于由于肠癌、乳腺癌和前列腺癌死亡的人数。对肺癌的早期诊断和治疗是降低其死亡