基于深度学习的小尺度天体辐射信号处理算法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:nescafe_k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在并不遥远的将来,天文学家将能基于迄今为止世界上最大的射电望远镜阵列SKA探测来自宇宙再电离时期(EoR)的信号,研究宇宙的演化历史和第一代天体的形成。然而EoR信号非常微弱且受到宇宙前景辐射信号的干扰,探测的难度巨大。在各类干扰源中,以河外点源为代表的小尺度天体数量巨大,形态复杂且亮度动态范围大,已构成EoR信号探测道路上最大的障碍之一。除此之外,SKA的高灵敏度和高分辨率也将使我们能够探测到更多形态复杂且辐射强度非常微弱的点源,从而进一步影响EoR信号的探测精度。面对海量且复杂的观测数据,传统的信号处理方法存在过于依赖经验、准确率不足和鲁棒性低等弱点。深度学习作为一类重要的以数据驱动的机器学习算法,已借助其优异的特征提取和表征能力,在目标识别、图像分类和模拟等领域取得了卓越表现。本文借助CDA和FIRST等X射线和射电波段的海量观测图像和数据,采用深度学习模型和算法,提出了针对小尺度天体辐射信号的探测、分类以及模拟的闭环信号处理框架和处理算法。本工作的创新点及主要成果包括:1.以钱德拉X射线天文台(CXO)的观测图像为基础,开展了小尺度点源和空洞探测算法的研究,提出了基于椭圆高斯滤波器(EGF)模板匹配和基于粒度化二叉树支持向量机(GBT-SVM)的点源探测算法,以及基于粒度均衡化深度卷积神经网络(GCNN)的X射线空洞探测算法。其中点源探测作为空洞探测的预处理步骤,二者为递进关系。针对现有算法仅利用点源的图像空间特征、探测伪点多且适用的动态范围小等问题,本文首先采用提出的EGF算法定位并获取点源候选体;然后结合点源和非点源信号在图像和光谱空间的特征,采用提出的GBT-SVM分类器模型筛选并保留候选体中的点源。为了解决基于β模型拟合和非锐化掩模(UM)等X射线空洞探测算法的自动化程度不足和准确率低的问题,提出GCNN深度学习模型以分块扫描的方式自动化探测X射线空洞。针对因空洞区域覆盖面积较小导致的样本不均衡问题,采用粒度化的训练集和多子分类器投票策略,在样本集端和分类器端同时实现样本均衡化。实验表明,相对于现有算法,我们所采用的EGF+GBT-SVM和GCNN算法在X射线点源和空洞的探测中均取得了更具鲁棒性和准确率的探测效果。2.为了在将来准确扣除小尺度点源前景信号,需要分析其形态特征,本文基于FIRST巡天的海量射电观测图像,提出了一种包含致密源,FRI/II型射电AGN,弯尾星系(BTG),X形射电星系(XRG),以及环形射电星系(RRG)的射电星系形态分类算法。针对直接多分类对分类器复杂度要求高的问题,我们结合射电星系的形态特点,提出一种结构化二叉树分类体系,将多分类拆分为层次化的二分类问题。为了避免基于迁移学习的算法可能带来的“数据未见”风险,提出一种基于半监督学习的深度学习网络训练算法,即(a)预训练:建立一个包含14245个无标签射电星系样本训练基于卷积神经网络的自动编码器(AE);(b)精调:建立一个包含1442个有标签射电星系的样本集,对AE的编码器子模块参数进行有监督的微调;(c)分类:利用所得的射电星系形态分类器对射电星系图像进行分类。为了得到参数规模小且准确率高的分类模型,提出自定义的小规模深度学习网络MCRGNet,借助其对14245个射电星系的形态进行分类,获得了目前最大和最复杂的射电星系形态分类表。3.针对现有射电星系形态模拟算法仿真度低的问题,结合分类算法的研究中对射电星系形态特征的理解,提出了两种射电星系形态生成和模拟算法,即基于残差卷积自动编码器(ResAE)和混合高斯模型(GMM)的模拟算法以及基于残差卷积条件变分自动编码器(ResCVAE)的模拟算法,可根据射电星系的形态标签输出指定类别的模拟图像。为了避免因网络层数增加而导致的过饱和风险,两类算法均以残差卷积学习单元为基础模块搭建深度学习模型。通过设计实验,本文讨论了损失函数对于射电星系形态模拟网络参数调优的影响,提出了结合均方误差函数(MSE)和类别交叉熵(CCE)函数的交替训练模型调参算法。4.为配合中国SKA团队开展相关理论和观测研究,本文综合以上针对小尺度点源形态分类和模拟算法的研究,将提出的ResCVAE网络应用在了针对SKA的低频射电天空高精度仿真与观测模拟软件FG21Sim的河外点源模拟模块。结合SKA的理论设计参数,FG21Sim能够得到更加真实的低频射电天空仿真和观测模拟图像,为SKA的观测和EoR信号探测等工作提供了重要的技术支持。
其他文献
<正>前两期专题,我们从地平线报告与课程创新的角度讨论了创客教育,本期专题我们来讨论促进课程创新的技术——Scratch。Scratch并不是新鲜事物,自进入中国以来,从最初个别教
立题依据:研究背景:恶性淋巴瘤(ML)是一组起源于淋巴系统的恶性肿瘤,多发生于淋巴结和(或)结外部位淋巴组织,通过肿瘤细胞表面的白细胞分化抗原不同可将其分为T细胞来源淋巴
<正>《齐齐哈尔医学院学报》为公开发行的综合性学术理论刊物,国内外公开发行CN23-1278/R、ISSN 1002-1256,被中国版本图书馆、国家图书馆、中国知网、中国核心期刊(遴选)数
随着城市加气站的蓬勃发展和国家大力提倡的城际间加气站网络建设逐步展开,CNG汽车加气站及设备保有量与日俱增,加气站设备安全风险评价十分必要和迫切。提出了加气站设备选
中国富煤少气的能源特点决定了发展煤制天然气是获取天然气资源、缓解我国天然气供需矛盾的重要途径之一。开展煤制天然气项目能够合理利用我国劣质煤炭资源,调整煤炭消费结
<正>与长城内外秦岭南北星星点点生长的杏树不同,杏树在广袤的新疆以成片成带这样的常态存在。由于分布地域广,从海拔2000多米的北疆伊犁雪域山谷,到拥有世界内陆最低点艾丁
DOCK2(Dedicator of cytokinesis 2)是在原始粒细胞株KG-1中首先被发现并报道的一种高分子蛋白,其在多种血液病及肿瘤中均发挥着重要作用,有研究发现亚洲人群中结直肠癌的发
黏弹性表面活性剂(VES)清洁压裂液由于低伤害等特点已广泛应用于压裂与防砂等作业。原油和地层水对VES破胶机理与实验研究已相当充分,但天然气对VES的破胶作用至今无公开的实
在中国传统的法律中,情理一直扮演着重要角色,司法官裁判案件,不单是“引律”,还要“揆情准理”,以期“情理两平”。近年来,我国处于社会转型期,许多经过媒体与舆论发酵引起热议的刑事案件,多因适用情理与适用法律会产生不一致的结果,导致案件的审理结果与社会民众的期许背道而驰。于欢一案,更是一石激起千层浪,极大的唤起大众和学界对刑事审判中情理考量的关注,如何才能兼顾情理又不违背法理可谓是司法机关急于解决的难
目的探讨早期综合康复治疗急性脑血栓脑梗患者的临床效果。方法将106例入组急性脑血栓脑梗患者随机平均分为对照组(n=53)和观察组(n=53),对照组给予神经内科常规治疗,观察组