机器学习在光谱巡天中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lomon521mutou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着望远镜技术的发展,光谱巡天的光谱获取能力越来越强,最具有代表性的多目标光纤数字巡天项目有美国的Sloan Digital Sky Survey(SDSS)和中国的Large SkyArea Multi-Object Fiber Spectroscopic Telescope(LAMOST)。SDSS观测能力由Ⅰ期同时观测640个目标增加到Ⅲ期同时观测1000个目标,目前共发布了400多万条光谱;LAMOST光谱获取能力更强,每次观测能获得4000条光谱,每个观测夜能获取近2万条光谱,目前仅仅两年的时间已经发布了200多万条光谱。在海量的光谱中存在着许多稀有的有意义的特殊天体,利用机器学习算法快速有效的搜寻这些有意义的特殊天体对特殊天体的后继研究和分析具有非常重要的意义。针对这个问题,本文的主要工作如下:  1)在SDSS海量光谱中应用标记传播学习算法成功搜寻1573个碳星和188个DZ白矮星,其中260个碳星和29个DZ白矮星是新发现的,还搜寻到11个包含碳星成分和白矮星成分的复合系统。通过自行速度,96个碳星被确认为矮碳星,7个被确认为巨碳星;通过对11个复合系统分解确定了10个白矮星成分类型为DA型白矮星,1个为非常稀有的热的PG1159型白矮星,这些都是特殊的天体,其中一部分很可能是非常稀有的DA/dC双星系统,它们对于研究恒星演化和银河系动力学都有着非常重要的意义;通过PCA重构确定了这些新发现的DZ白矮星都是典型的DZ白矮星;通过和SDSS白矮星自行速度对比,新发现的DZ白矮星与目前被SDSS观测到的白矮星一样有较大的自行速度;通过拟合有效温度与g-r的颜色的关系确定了DZ白矮星的有效温度,在29个DZ白矮星中有12个温度较低,其中9个有效温度在6000K到6600K之间,3个低于6000K,这些DZ白矮星的发现进一步填充了DZ白矮星的低温序列。  2)应用快速的流形排序学习算法在LAMOST海量光谱中搜索碳星。分析了算法在不同参数取值和不同特征下的性能,将中值滤波的光谱和扣除连续谱的同时作为特征时,能够极大的提高算法的性能,并且对参数取值有很强的鲁棒性。此外,该算法速度快,内存占有少,能够应用于在光谱获取率极高的LAMOST光谱巡天数据中搜寻感兴趣天体。利用该算法在LAMOST先导巡天数据717,660条光谱中共搜寻到183个碳星和1个由碳星成分和PG1159型白矮星成分组成的复合系统,其中158个碳星是我们新发现的。根据光谱的特征,58个被分类为C-H型,11个为C-H型候选体,56个为C-R型,10个为C-R型候选体,30个为C-N型,3个为C-N型候选体,4个为C-J型,10个因为光谱质量差而没有对其光谱型分类。在C-N型碳星中有1个非常特殊,它的光谱中有很明显的CaⅡ H&K吸收线,这在C-N星中是非常罕见的;利用模板匹配和Cj-index的方法确认了C-J型碳星,依据自行速度,确认了21个矮碳星;分析了不同光谱型和光度型在JHKs空间中的分布,利用SVM算法给出了基于JHKs测光的C-H和C-N型碳星的最优分类面;与星表GALEX交叉匹配,发现3个可能的碳双星;通过和Northern SkyVariability Survey(NSVS)数据库、Catalina巡天数据库和LINEAR数据库交叉,发现了5个变星,其中4个具有明显的光变周期。通过拟合光变数据,我们确认了3个为半规则,1个为Mira变星。  3)提出一种基于核密度和K-近邻(K-nearest neighbors,KNN)相结合的算法,在SDSS DR8的656,801条恒星光谱中搜寻出很多有意义的特殊天体和未知天体。我们对比了核密度估计算法和核密度估计与KNN相结合的算法搜寻稀有天体的性能,结果表明核密度估计与KNN相结合的算法性能明显优于核密度估计。对21,193条离群光谱数据进行聚类后,发现这些数据主要包括由于数据缺失、红化、流量定标不准引起的问题光谱、行星状星云、没有物理联系的光谱双星、类星体、特殊白矮星(DZ、DQ、DC)、碳星、白矮主序双星和激变变星等。将这样目标和SIMBAD、NED、ADS数据库以及相关文献进行交叉验证,新发现了3个DZ白矮星、1个白矮主序双星、2个伴星为G型星的激变变星,4个激变变星的候选体、6个DC白矮星、1个DC白矮星候选体和1个BLLacertae(BL Lac)候选体。同时还发现了1个有CaⅡ三重发射线和MgI发射线的DA白矮星和1个未识别的特殊天体。
其他文献
纳米通道单分子检测技术由于其快速、低成本、无需标记等优势而受到广泛关注和发展。这一技术的原理是待测分析物在外加电场的驱动下穿越纳米通道时的占位效应改变了通道阻抗
该文首先介绍超声波时差流量测量的工作原理,对该方法中参数与测量误差的关系进行了分析,得出了一些有意义的结论.随后,该文就超声波时差流量测量的一种新方法-多脉冲测量方
文章首先给出了汽车装配车间生产计划与调度集成优化系统的体系结构、运行模式和集成方法.为解决快速调度仿真问题,提出用扩展随机高级判断Petri网对装配线进行建模,给出该网
智能仪表是自动化仪表的发展方向.随着工业生产自动化要求的不断提高,组建更大规模复杂自动控制系统的需求日益迫切.因此,研究组建智能仪表集散控制系统的相关技术,对自动化
对于一些复杂的非线性系统,很多控制相关的中间变量都无法直接测量,从而影响了非线性过程的监测。非线性滤波技术的适时出现,解决了化工生产工艺过程中间变量难以测量的问题,并得
该论文主要研究了经济管理系统复杂性的分数维度量,经济混沌时序的相空间重构技术、建模和预测技术及控制方法,最后该文研究了运用BDS统计量的非线性检验方法.
该文首先对太空杯用材料作简单介绍,说明正确选材的重要经济意义.太空杯用材料的优与劣,是一对既有差异又有共维(这里的维是指价值),且处于两极,是有中介过渡性的模糊概念.这
超视距空战是随着飞机武器系统的发展而出现的一种新的空战方式.采用这种空战方式有利于发挥装备的优势,达到打击敌人,保全自己的目的.因此,研究与之相应的火力控制系统对提
该文的研究工作是在国家计委"九五"科技攻关项目《基于人机交互全流程生产计划系统研究与开发》的资助下展开的.结合该项目要求,该针对抚顺特殊钢有限公司(以下简称抚钢)新流
随着计算机、多媒体及网络技术的迅猛发展,以及各种压缩技术和大容量存储技术的不断出现,形象生动、表现力强、信息量大的多媒体资源逐渐成为人们获取信息的重要来源。同时,移动