基于机器学习的大视场巡天中星系图像分类研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:baihuiguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着天文观测技术的发展和新一代天空观测设备的升空,大量的天文星系图像被采集用于天文研究。星系图像包含了许多重要的信息,通过研究星系的形成与演化,天文学家可以进一步研究宇宙的起源,因此分析这些星系图像具有非凡的意义。然而,面对海量的天文星系图像数据,传统的方法在可行性和准确性上都存在不足。本文将研究天文星系图像数据的特征提取与分类以及离群检测,具体包括四个方面:1.天文星系图像的预处理方法。一般的天文图像往往不能直接用于研究,因此需要对图像进行预处理操作。通过分析天文星系图像的物理含义,结合特征参数进行数据筛选。在数据不均衡的情况下,采用Opne CV中的图像随机旋转和翻转方法进行数据增强。该方法构建了合理有效的数据集,为网络模型的训练奠定了可靠的数据基础。2.基于卷积自编码和高斯混合模型的无监督天文星系图像分类模型。为了规避将图像直接送入无监督机器学习带来的耗时问题,利用卷积自编码器和高斯混合模型,搭建了一个基于无监督机器学习的天文星系图像分类模型。卷积自编码器负责提取天文图像的特征,高斯混合模型负责给提取到的天文图像特征聚类。实验结果证明,在图片数量为50000时,无监督天文图像分类模型能够以84%的准确率对天文星系图像进行分类。3.基于卷积自编码和k NN的无监督天文星系图像离群检测模型。天体物理学中的离群检测对研究宇宙有着至关重要的作用,为了实现离群检测,本文利用卷积自编码器和k NN算法,搭建了一个基于无监督机器学习的天文星系图像离群检测模型。结果证明,当数据量为17000时,通过我们的离群检测模型,可以以56%的召回率检测天文星系图像的离群点。4.基于注意力机制的模型改进。针对天文星系图像背景噪声影响模型性能的问题,引入了注意力机制,帮助模型在训练过程中关注重要的信息并忽略背景噪声信息,以提高网络的性能。实验结果表明,在分类模型上,经CBAM改进的模型不仅提高了网络的稳定性,还提高了8%的分类准确率;在离群检测模型上,经CBAM改进的模型更是提高了22%的召回率。
其他文献
新闻报道中的图片可以抓人眼球,引起读者阅读新闻内容的兴趣,也可以直观地传递出新闻报道的内容。本文探究人工智能技术在图片新闻领域的应用,期望可以借助机器的力量,帮助新闻编辑者自动完成为新闻配图的工作。本文首先研究了新闻图片在报道中顺序插入的问题,提出了一种基于多模态循环神经网络的模型。该模型配有编码更新机制,可以将图片以一定顺序插入到新闻文本中的适当位置。对于每幅图片的插入位置,该模型的选择标准是候
学位
南京市作为经济实力、医疗水平稳居全国前列的省会城市之一,人口老龄化的速度与规模均远超全国同类地区,妥善解决老年人的养老问题至关重要。在积极应对老龄化的战略背景下,南京市逐渐建立起较为完善的居家养老服务体系,且在全国范围内一直处于引领的状态。即便如此,随着老年人的需求日益多元化,南京市已有的居家养老服务供给体系依然面临诸多挑战。基于这一现实背景,本研究以南京市居家养老服务供给现状的分析为基础,结合老
学位
云计算是能够根据用户需要提供互联网资源的商业计算模型。用户部署在云服务器上的应用系统能够根据需求量获得云上的资源,如计算能力和存储空间,这种需求量可以是无限的,只要求用户按量付费即可。随着云计算技术的不断发展,越来越多的数据所有者选择将其数据外包给云服务器。但是,外包的数据面临着被泄露的风险。为了保护外包数据的隐私,最常见也最直接的方法是在外包到云服务器之前对数据进行加密,再将加密后的数据外包给云
学位
净水厂是电能消耗大户,其中取水泵站和供水泵站的电能消耗占净水厂电能消耗的80%以上。现阶段清洁能源产生的电能十分有限,必须要使用传统燃料来稳定地生产电能,这已然导致了全球性的气候变化和能源危机。因此在满足城市供水需求和净水厂安全生产约束的同时,对取水泵站和供水泵站进行优化调度以实现电能节约和二氧化碳减排迫在眉睫。为此,本文提出了一种取水与供水泵站智能协同优化调度方法:首先,将长短期记忆网络(Lon
学位
移动边缘计算能够通过靠近用户提供计算服务以降低任务时延和提高服务质量,不同的卸载策略会影响卸载的效率,因此制定合适高效的卸载策略至关重要。深度强化学习通过训练智能体(Agent)在与环境交互的过程中学习能够实现长期效能的行为策略,能够有效解决移动边缘计算卸载问题。因此基于深度强化学习研究移动边缘计算卸载问题,主要工作如下:(1)针对多用户单服务器集中式卸载场景中,连续卸载策略容易收敛至局部最优解的
学位
随着信息技术和深度学习技术的快速发展,手写数学表达式的应用场景大量增加,需要快速、稳定和准确的手写数学表达式识别方法。但是因为表达式本身复杂的二维结构、手写字符的不规则和离线场景下笔画信息的缺失,手写数学表达式识别成为一项具有挑战性的工作。近年来,在手写数学表达式识别问题上出现了基于深度学习的全局识别方法,这其中以编码解码结构为代表,此类方法不需要进行单独的字符切割、识别和结构解析工作。然而目前该
学位
随着云计算、物联网、多媒体技术的飞速发展,人们在音频、视频等传统多媒体业务方面获得满足的同时,开始追求触觉感官体验。融合音频、视频和触觉信息的多模态业务已被广泛认为是超五代移动通信系统时代(B5G)的杀手级应用之一,为此,跨模态通信技术应运而生。但是,在跨模态通信过程中,会存在诸多难题。第一,多模态数据在通信及传输过程中,可能会遇到无线信道噪声污染、数据丢失等问题,从而严重影响跨模态通信质量;第二
学位
当今社会,随着人工智能等信息产业大规模地飞速发展,人们在生活中无时无刻不暴露在大数据之中。在当今人们对公共安全问题愈发重视的社会背景之下,长期以来所依赖的视频监控系统却造成了越来越频繁的隐私泄露问题,这不仅会对人们的生活产生了一定的困扰,还会给社会带来巨大的损失。另一方面,视频监控技术的迅速发展也会产生大量的视频图像数据,这些数据的存储以及处理将会带来巨大的资源消耗,在一定程度上也会影响社会的发展
学位
伴随经济飞速发展,企业规模扩张意愿愈加强烈,股权质押已成为当下重要的融资渠道。作为权利质押的一种外显形式,其与传统质押存在本质区别,以股权作为质押对象,为公司获取有效融资,保障充足的流动资金,既突破了限售股制约,也能够展现股份应有的经济价值,更呈现其对经营发展所带来的显著增益。但是股权质押,往往被解读为控股股东存在资金短缺等问题,进而可能导致股权价的下跌,并将这一风险转移到质权人身上,给中小股东带
学位
数字图像是人们获取信息的重要途经。然而,数字图像在采集、传输等环节中往往会受到外界环境或自身硬件技术的局限性,使得获取到的图像中存有噪声、雨点等干扰。图像恢复一直是图像处理、计算机视觉以及相关应用领域的研究热点。近年来,相关研究人员提出了许多基于深度学习的图像恢复算法,在各项性能指标上均取得了优异的成绩,但是深度学习依赖大量的数据样本,且在图像恢复过程仍会存有噪声干扰残留的问题。为此,本文主要针对
学位