若何用AI在海量天文数据挖到新创造?我国科学家用深度神经收集当助手_暗记_旗子
第一财经15日从中国科学院上海天文台(下称“上海天文台”)获悉,研究员葛健带领的国际团队,利用人工智能的深度学习方法,对国际斯隆巡天三期开释的类星体光谱数据进行了微弱旗子暗记征采和数据剖析,创造了稀少的107例宇宙早期星系内的凉气体云块身分的关键探针中性碳接管体。该研究为探索星系如何形成和蜕变供应了新的研究办法,展现了人工智能在天文海量数据中探寻微弱旗子暗记的运用前景。5月15日,干系研究成果揭橥在《皇家天文学会月报》(MNRAS)上。
艺术想象图,来源:上海天文台
“这次的重大创造是人工智能在天文大数据运用的一个里程碑,受训的深度神经网络已经远超受训多年的天文学家,可以在海量数据中快速找到极其稀少和微弱旗子暗记。”葛健对第一财经表示。
研究凉气体和尘埃对阐发星系形成和蜕变至关主要,为天文学家磋商星系从“最初组装”到恒星形成期间的剧烈变革,再到蜕变后期的全体星系生命周期供应了关键手段。
葛健阐明,本次研究得到的样本数是此前得到的最大样本数的近两倍之多,并探测到更多比以前更微弱的旗子暗记。天文界的数据特殊多,很多旗子暗记已经被都找到了,利用传统的征采方法耗费韶光,同时征采到的假旗子暗记较多,易遗漏一些微弱旗子暗记,以是要有新的打破,更须要“快准狠”。
这套2017年就开始自研的系统,如何帮助科学家在浩瀚数据中挖掘新旗子暗记?
“我们团队天生和真实旗子暗记特色完备一样的仿真数据去做深度神经网络演习,让机器学会去找有这类特色的探针。”他见告第一财经,他们采取人工智能的深度学习方法,设计神经网络,天生基于实际不雅观测的中性碳接管线特色的大量仿真样本去演习深度学习神经网络,并利用这些被“演习好”的深度学习神经网络在斯隆巡天三期开释的数据中征采中性碳接管体。有了这个别系,也大大节省了事情韶光,“比如以前没这套系统的话人工须要找几个月。有了这个自研系统,几十秒就跑完了。”
葛健认为,要想利用人工智能在海量的天文数据中“挖”到新创造,就须要发展创新的人工智能算法,使之能够快速地、准确地、完备地探寻到这些很难在传统办法下被找到的稀少而微弱的旗子暗记。
他打了个比方,小时候他有时在家附近的兵工厂开释的大量煤渣中找“二煤”,也便是特殊随意马虎燃烧但极其稀少的半焦煤,如何更快找到更多的“二煤”?就须要发明比别人更快、更准和更完备的“耙子”。
他说,这次重大打破利用的创新手段便是这种有效的“耙子”,在其他天文学家利用传统办法都找过的斯隆数据(煤渣)中,利用这把创新的“耙子”快速、准确和完备地找到了令人激动的“二煤”—宇宙凉气体探针。”
他见告,天文大数据谁都可以免费自由地利用,就犹如免费的“二煤”,但只有那些拥有好工具的“小孩”才可能在大量的煤渣中快速、准确和大量地找到宝贵的“二煤”——也便是那些稀少的主要宇宙新创造。
该研究创造验证了近期詹姆斯·韦伯太空望远镜在宇宙最早的恒星中探测到类似钻石的碳尘埃的新创造,预示着部分星系的蜕变比预期要快得多,寻衅了现有的星系形成和蜕变模型。差异于詹姆斯·韦伯太空望远镜通过星系发射光谱来开展研究事情,该事情通过不雅观测类星体的接管光谱来研究早期星系,这将为未来宇宙和星系早期蜕变研究供应全新的研究手段。
(本文来自第一财经)
本文系作者个人观点,不代表本站立场,转载请注明出处!