论文部分内容阅读
在并不遥远的将来,天文学家将能基于迄今为止世界上最大的射电望远镜阵列SKA探测来自宇宙再电离时期(EoR)的信号,研究宇宙的演化历史和第一代天体的形成。然而EoR信号非常微弱且受到宇宙前景辐射信号的干扰,探测的难度巨大。在各类干扰源中,以河外点源为代表的小尺度天体数量巨大,形态复杂且亮度动态范围大,已构成EoR信号探测道路上最大的障碍之一。除此之外,SKA的高灵敏度和高分辨率也将使我们能够探测到更多形态复杂且辐射强度非常微弱的点源,从而进一步影响EoR信号的探测精度。面对海量且复杂的观测数据,传统的信号处理方法存在过于依赖经验、准确率不足和鲁棒性低等弱点。深度学习作为一类重要的以数据驱动的机器学习算法,已借助其优异的特征提取和表征能力,在目标识别、图像分类和模拟等领域取得了卓越表现。本文借助CDA和FIRST等X射线和射电波段的海量观测图像和数据,采用深度学习模型和算法,提出了针对小尺度天体辐射信号的探测、分类以及模拟的闭环信号处理框架和处理算法。本工作的创新点及主要成果包括:1.以钱德拉X射线天文台(CXO)的观测图像为基础,开展了小尺度点源和空洞探测算法的研究,提出了基于椭圆高斯滤波器(EGF)模板匹配和基于粒度化二叉树支持向量机(GBT-SVM)的点源探测算法,以及基于粒度均衡化深度卷积神经网络(GCNN)的X射线空洞探测算法。其中点源探测作为空洞探测的预处理步骤,二者为递进关系。针对现有算法仅利用点源的图像空间特征、探测伪点多且适用的动态范围小等问题,本文首先采用提出的EGF算法定位并获取点源候选体;然后结合点源和非点源信号在图像和光谱空间的特征,采用提出的GBT-SVM分类器模型筛选并保留候选体中的点源。为了解决基于β模型拟合和非锐化掩模(UM)等X射线空洞探测算法的自动化程度不足和准确率低的问题,提出GCNN深度学习模型以分块扫描的方式自动化探测X射线空洞。针对因空洞区域覆盖面积较小导致的样本不均衡问题,采用粒度化的训练集和多子分类器投票策略,在样本集端和分类器端同时实现样本均衡化。实验表明,相对于现有算法,我们所采用的EGF+GBT-SVM和GCNN算法在X射线点源和空洞的探测中均取得了更具鲁棒性和准确率的探测效果。2.为了在将来准确扣除小尺度点源前景信号,需要分析其形态特征,本文基于FIRST巡天的海量射电观测图像,提出了一种包含致密源,FRI/II型射电AGN,弯尾星系(BTG),X形射电星系(XRG),以及环形射电星系(RRG)的射电星系形态分类算法。针对直接多分类对分类器复杂度要求高的问题,我们结合射电星系的形态特点,提出一种结构化二叉树分类体系,将多分类拆分为层次化的二分类问题。为了避免基于迁移学习的算法可能带来的“数据未见”风险,提出一种基于半监督学习的深度学习网络训练算法,即(a)预训练:建立一个包含14245个无标签射电星系样本训练基于卷积神经网络的自动编码器(AE);(b)精调:建立一个包含1442个有标签射电星系的样本集,对AE的编码器子模块参数进行有监督的微调;(c)分类:利用所得的射电星系形态分类器对射电星系图像进行分类。为了得到参数规模小且准确率高的分类模型,提出自定义的小规模深度学习网络MCRGNet,借助其对14245个射电星系的形态进行分类,获得了目前最大和最复杂的射电星系形态分类表。3.针对现有射电星系形态模拟算法仿真度低的问题,结合分类算法的研究中对射电星系形态特征的理解,提出了两种射电星系形态生成和模拟算法,即基于残差卷积自动编码器(ResAE)和混合高斯模型(GMM)的模拟算法以及基于残差卷积条件变分自动编码器(ResCVAE)的模拟算法,可根据射电星系的形态标签输出指定类别的模拟图像。为了避免因网络层数增加而导致的过饱和风险,两类算法均以残差卷积学习单元为基础模块搭建深度学习模型。通过设计实验,本文讨论了损失函数对于射电星系形态模拟网络参数调优的影响,提出了结合均方误差函数(MSE)和类别交叉熵(CCE)函数的交替训练模型调参算法。4.为配合中国SKA团队开展相关理论和观测研究,本文综合以上针对小尺度点源形态分类和模拟算法的研究,将提出的ResCVAE网络应用在了针对SKA的低频射电天空高精度仿真与观测模拟软件FG21Sim的河外点源模拟模块。结合SKA的理论设计参数,FG21Sim能够得到更加真实的低频射电天空仿真和观测模拟图像,为SKA的观测和EoR信号探测等工作提供了重要的技术支持。