帮天文学家“大海捞针”,人工智能有了新办法

来源 :中国科学探险 | 被引量 : 0次 | 上传用户:codemachine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近年来,随着技术日益进步,天文学研究中产生了海量数据。天文学家要想从郭守敬望远镜、“中国天眼”FAST、LSST大型综合巡天望远镜等遍布世界的大型望远镜捕获的海量数据中找出有价值的信息以资研究,无异于大海捞针。
  如何高效地处理这些数据,已成为现代天文学面临的一项重要挑战。由于人工智能在海量数据分析和处理方面所具有的突出优势,它也很自然地走入了天文学家的视野。
  日前,中国科学院云南天文台丽江天文观测站龙潜研究员与云南大学中国西南天文研究所宇宙学研究组尔欣中教授团队合作,利用人工智能深度学习的方法,发现了38个新的强引力透镜候选体,为研究天体物理学问题提供了新的可靠的“宇宙探针”候选体。英国《皇家天文学会月刊》发表了这项研究成果。
  天文观测产生海量数据 用机器学习给天体分类已十分普遍
  随着下一代大规模测光巡天项目的开展,人们期待发现数以万计的强引力透镜系统。但如何在海量天体图像中快速地找到强引力透镜候选体?近年来,人工智能的快速发展,给人类提供了一种新的可能。
  以2009年发射升空的世界首个用于探测太阳系外类地行星的飞行器开普勒太空望远镜为例,仅在起初3年半的任务期内,就监控了超过15万个恒星系统,同时也产生了海量数据。这些数据通常要经由计算机处理,但当计算机识别出一定的信号时,又必须依靠人类分析,判断其是否是行星轨道所产生的,这项巨大的筛查工作单靠美国国家航空航天局(NASA)的科学家或科学小组,是无法有效完成的。
  “如此大的数据量,人工分析在很多时候已经达不到所需要的速度。借助人工智能的优势,我们可以极大地提升对数据的分析速率。”龙潜向记者介绍,人工智能展现出来的效率和准确性远高于传统方法。
  龙潜研究员长期从事人工智能深度学习方面的研究。近期,他与尔欣中教授团队合作,构建并训练了一个卷积神经网络,用来寻找强引力透镜系统。他们把这个网络应用到欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天数据,并找到了38个新的强引力透镜候选体。此次构建的神经网络,也可应用于其他大型望远镜的巡天数据。
  “在这项工作中,我们用计算机分别模拟了强引力透镜图像和非强引力透镜图像,从而来训练计算机。我们发现,在准备训练计算机的图像时,非强引力透镜图像比强引力透镜更加重要。”尔欣中说,开始的分析中,他们使用简单的规则星系图像作为非强引力透镜训练样本,发现结果正确率非常低。只有把各种可能的非引力透镜图像都考虑进来之后,才能得到比较好的结果。
  “这就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等都不是狗。而如果你只告诉它猫不是狗,电脑有非常大的概率把羊、牛认成狗。”龙潜说,目前利用机器学习来对天文学中各种天体分类已经非常普遍,最简单的是把恒星和星系分开,或者把不同行态的星系进行分类,以及利用星系的多重颜色来估计星系的距离等。
  每秒可识别上万张照片 新型神经网络便于实时修改、训练和测试
  人眼看强引力透镜系统的图像,最快就是每秒钟看一张图。而计算机每秒钟可以识别成千上万张图片。
  龙潜研究员和尔欣中教授团队此番训练的这个卷积神经网络,可以充分利用GPU进行并行加速,通过装备更多或更强的GPU,系统可以根据实际需要极大提升搜索速度和效率。
  “这个神经网络的训练,主要使用模拟数据,只使用了很少的人工标注数据,由于模拟数据可以任意生成,因此多样性远大于人工标注数据,进一步根据数据的特点调节训练参数和训练算法,使神经网络的泛化能力得到了极大的提高。”龙潜说,此外,研究人员使用新型科学计算语言Julia完全自定义网络结构,由于Julia语言兼具速度和灵活性,使得神经网络在CPU和GPU上都有良好的性能,并且可以任意切换,因此非常有利于研究人员实时修改、训练和测试。
  “我们还通过对引力透镜数据的研究,定制了有针对性的小型网络,有效地抑制了过拟合现象,同时实验证明该网络具有与大型网络相似的准确率。相比大型网络,小型网络在普通计算机终端就可以训练和测试,不需要依赖大型GPU集群,这为天文工作者使用和改进网络提供了便利。”龙潜说。
  目前,随着技术与装备水平快速发展,人工智能在天文学上的应用还会越来越多。“我们计划对一些变源的多波段光变曲线来进行机器的快速分类,这样在实施大样本巡天的时候,电脑可以自动对所发现的变源进行筛选,并对我们感兴趣的天体做出提示,以便进一步开展后续研究工作。”尔欣中说,正因为人工智能的帮助,天文研究者得以从耗时单调的数據筛查分析中解脱出来,当人力“大海捞针”难以招架之日,正是人工智能大显身手之时。
其他文献
基于大数据分析进食情况,智能设备可实现精准饲喂;电子耳标快速检测畜禽身体状况;环境检测系统实时监测温湿度、硫化氢等有害气体浓度、光照强度等环境因素……这些控制系统都可集成到一个手机中,让养殖场管理者及时获取异常信息,实现远程精准控制,并根据监测结果,控制相关设备。  在第十八届(2020)中国畜牧业博览会上,养殖“黑科技”让人眼前一亮。能根据母猪、仔猪、保育猪、肥育猪不同生长阶段、不同品种特性自动
期刊
据英国《通讯·材料》杂志发表的一项机器人最新研究,欧洲科学家团队报告研发一种磁驱动的新型高速软体机器人。这种机器人可以超快速地完成行走、游泳、漂浮和捕捉活體苍蝇,将在生物组织工程与生物力学领域得到广泛应用。  对于自然界的生物而言,高速行动对捕猎、逃跑和飞行至关重要。这一点对于软体机器人也一样有用,因为它使机器人可以捕捉快速移动的物体,并对周围动态环境迅速做出反应。  但是,要在机器人身上复制这种
期刊
来乌镇,看未来。  作为京杭大运河流经节点,浙江乌镇受“水网”润泽逾千年;运河流淌2500年后,以互联网之名的“乌镇之约”再次汇聚世界目光。数度繁华的乌镇“香市”时光轮转,桑蚕、戏班变幻为“互联网之光”上炫酷的科技博览;相比民俗中活跃的摊贩,数字连接起的参与者更难以估算。  桨声灯影背后的乌镇,是镶嵌于数字世界的“样板间”,感知互联网脉动的“活标本”。2020年11月23日至24日,在乌镇举行的“
期刊
据了解,这项研究的重点是扩大昆虫大小机器人的使用,这种毫米大小的机器人适合在人体上应用。不过这项新研究的研究人员并不是从头开始制造磁性微机器人,而是着手开发一种可以用普通物体来制造磁性微机器人的工具。这种工具以一种叫做M-spray的磁性涂层的形式出现,它由聚乙烯醇、谷蛋白和铁颗粒制成,可以附着在各种材料的光滑和有纹理的表面上。  研究小组的领导者Shen Yajing博士表示:“我们的想法是,通
期刊
不少人对于人脸识别技术的应用表示担忧,主要认为其有照片泄露的风险。照片泄露就是人脸识别技术的"锅"吗?面对泄露风险,我们要如何应对?伴随着人脸识别技术的发展,其争议始终存在。先是有因不接受动物园将入园方式改成"刷脸",浙江理工大学副教授郭兵将杭州野生动物世界告上了法庭。而后又发生了清华大学法学院教授劳东燕遇到"不刷脸不让进小区"的情况,对此,劳东燕认为在小区安装人脸识别装置并无必要,并且不经同意收
期刊
决定你的血型;与病毒对抗的新“武器”;携带的信息量超过蛋白质、核酸和脂肪携带信息量的总和,它是参与人类生老病死每个过程的生物大分子——糖。  糖和蛋白质、核酸、脂类是构成生命体的4种生物大分子。糖参与了人的发育及生老病死的每一个生命过程,就连人的血型也由糖决定。  不过百年来,糖的研究一度被人冷落,2020年新冠病毒引发全球疫情,再度令糖的重要性浮出水面。“在人类与病毒旷日持久的战争中,一种新的‘
期刊
从“汗水物流”到“智慧物流”,“无人”技术正在激活新动能。  传输带上,包裹川流不息,经过机器快速扫码,按地址分送到不同“路口”,滑入收集袋里,再走向千家万户。  这是记者日前在一家快递分拣中心看到的一幕。从“汗水物流”到“智慧物流”,从手工作业到智能订制,“无人”技术正在加快推动传统产业智能化,为经济增长注入新动能。  条形码识别准确率提升1%,意味着什么?  每天,有上千万的包裹不再需要手动分
期刊
动物、植物、真菌和原生动物的细胞各不相同,不过它们都有一个显著的共同特征:细胞核。虽然它们还有其他细胞器,比如产生能量的线粒体,但是细胞核作为一种清晰可辨、包含遗传物质的有孔囊袋状结构,于1925年启发生物学家埃德·查顿(édouard Chatton)创造了“真核生物”这一术语,用来指代具有“真正内核”的生物。他把其余生物称为“原核生物”,表示“有核之前的”生物。这种划分有核和无核生物的二分类方
期刊
多亏海洋蠕虫沙蚕蠕虫——这种动物的基因进化非常缓慢,法国科学研究中心科学家、巴黎大学和巴黎索邦大学等机构的研究人员发现,虽然血红蛋白在几个物种中独立出现,但它实际上是一个基因的后代,由它们的最后一个共同祖先传播给所有物种。  红色血液并不是人类或哺乳动物独有的。这种颜色来自血红蛋白,这是一种复杂的蛋白质,专门用于运输氧气,这种蛋白质不仅存在于脊椎动物中,也存在于环节动物、软体动物和甲壳动物。人们认
期刊
据国外媒体报道,2020年,就连时间也没逃过劫难。  自1960年有记录以来,最“快”的28天,全都发生在2020年,也就是地球绕轴自转一周所用的时间,比平均用时快了几毫秒。虽然这并没有什么值得大惊小怪之处——在大气压、风、洋流以及地核运动等变化的影响下,地球的自转时间一直都略有波动。只不过,这种波动对国际计时员来说,是个大麻烦。国际计时员使用超级精确的原子钟来校调协调世界时(UTC),而其他人则
期刊