想象一下,星團、星云和其他星際現象都是由計算機在無人監督的情況下憑空生成的。這聽起來可能像是對未來全息技術的描述,但是愛丁堡大學感知研究所和天文學研究所的研究人員,就在人工智能的幫助下設計了這樣一個系統。
研究人員描述了一種人工智能模型,該模型能夠生成合成星系的高分辨率圖像,這些圖像遵循了真實的星系分布。
“21世紀的天文學發現自己擁有大量數據,大部分數據在捕獲時會被過濾掉,以節省內存存儲,”他們寫道。“對于深度學習等現代技術來說,進入這一領域的時機已經成熟。星系在這類應用中起了關鍵作用,我們探索了利用人工智能來生成星系圖像的可能性。”
該團隊機器學習架構的核心是生成對抗性網絡(GAN)——由生成樣本的生成器和試圖區分生成樣本和真實樣本的鑒別器組成的兩部分神經網絡。將GAN描述為AI算法中的“神童”并不夸張;它們被用來發現新藥,制作令人信服的漢堡和蝴蝶照片,甚至生成腦癌的人工掃描圖。
這一星系生成系統由兩個五層GANs組成:階段一GAN和階段二GAN。第一個生成低分辨率圖像(64x64像素),而第二個使用一種叫做超分辨率的技術將它們轉換成高分辨率圖像(128x128像素)。研究人員指出,在實際過程中,階段二GAN會自我填充缺失的像素,更加注重現實性而非準確性。
為了“鼓勵”階段二GAN中的生成器生成類似于放大實像對應物的合成星系圖像,該論文作者引入了一個“雙目標函數”,該函數計算了分辨率增強圖像和實像之間的誤差標準。其結果是生成了大量保留星系“更稀有”特征的樣本,如旋臂。
研究人員使用英偉達GTX 1060 GPU在PC上訓練人工智能系統,并為其提供來自Galaxy Zoo 2數據集的恒星和行星體的全色圖像,Galaxy Zoo 2是一個眾包天文學項目。他們在評估結果時考慮了四個屬性:橢圓度,或偏離圓形度的程度;與水平面的仰角;總流量;以及半長軸(橢圓最長直徑的一半)的尺寸測量。
在論文的最后,研究人員寫道,該模型生成了非常類似真實星系“物理真實”的圖像。他們認為,這一系統可以被用來擴充真實樣本的數據庫,實際上這也是深度學習模型的數據源。
“能夠創建物理真實的星系圖像生成模型有許多實際用途,”他們寫道。“我們的工作展示了GAN架構作為現代天文學寶貴工具的潛力。”
關鍵詞: