【摘 要】
:
机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用
【机 构】
:
桂林电子科技大学信息与通信工程学院,桂林电子科技大学认知无线电与信息处理教育部重点实验室,桂林电子科技大学广西云计算与大数据协同创新中心,桂林电子科技大学广西高校云计算与复杂系统重点实验室
【基金项目】
:
广西云计算与大数据协同创新中心;广西高校云计算与复杂系统重点实验室项目(编号1716)资助
论文部分内容阅读
机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用却极为少见.为解决斯隆数字巡天(Sloan Digital Sky Survey,SDSS)数据中恒星/星系暗源集分类正确率低的问题,引入了机器学习中较新的研究成果–XGBoost(eXtreme Gradient Boosting).从SDSS-DR7(SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源集和暗源集.首先,分别对亮源集和暗源集使用十折交叉验证法,同时运用XGBoost算法建立恒星/星系分类模型;然后,运用栅格搜索等方法调优XGBoost参数;最后,基于星系的分类正确率等指标,与功能树(Function Tree,FT)、Adaboost(Adaptive boosting)、随机森林(Random Forest,RF)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、堆叠降噪自编码(Stacked Denoising AutoEncoders,SDAE)、深度置信网络(Deep Belief Network,DBN)等模型进行对比并分析结果.实验结果表明:XGBoost在暗源分类中要比功能树算法的星系分类正确率提高了将近10%,在暗源集的最暗星等中比功能树提高了将近5%.同其他传统的机器学习算法和深度神经网络相比,XGBoost也有不同程度的提升.
其他文献
<正>"教教材"和"用教材教"是两种不同教育观念的体现。新课程改革提倡"用教材教"而不是"教教材",但一部分教师始终跳不出教材的束缚,还是以"教教材"的方式使用新的教材,没能
<正>创业培训的主要目的是通过培训把生产型农民培养成懂经营、会管理、能创业的市场型农民。我国加入WTO后,农民不仅面对农产品的国内市场竞争,而且面对国际市场竞争,农民已
<正>汉字从古老的刻画象形符号发展至今,曾经历了原始图形文字(商代之前)、古文字(商代——秦代)、今文字(秦代——至今)三个不同的历史发展阶段。从字体演变上看,汉字从甲骨
<正>一、发展绿色农业的生态基础和文明传承固始县位于河南省东南部,南依大别山,北临淮河,总面积2946km2,辖32个乡镇,601个村,7196个村民组,总人口168万,是河南省第一人口大
<正>南阳月季栽培始于唐朝,兴于明朝,发展于当代。自古以来,"花中皇后"月季以其四季开花、外形甜美、坚韧耐寒的特质受到人们喜爱,成为南阳市市花。南阳市也被国家林业局和中
国家"智能+"战略的实施,激发我国高职教育智能化相关专业布点数大幅增加。当前,我国高职教育智能化相关专业设置存在布点过热、与产业切合度低、专业特色不鲜明等问题,应该采
相关系数检验法在人口抽样调查数据质量评估中的应用佛山大学数学系白国仲佛山市统计局叶展灿1995年全国1%人口抽样调查是介于两次人口普查之间的一次最主要的人口调查,其目的就是使
长期以来,我国大学英语阅读教学重输入轻输出的现象较为严重。阅读作为接受技能之一往往与口语、写作、翻译等语言输出技能割裂开来。该文基于文秋芳教授的"输出驱动—输入促
<正>初中物理电学公式繁多,且各种物理规律在串并联两种电路中有时完全不同,使得学生极易将各种公式混淆,为了使学生对整个电学公式有一个完整的了解,形成一个完整清晰的知识