今天,在谷歌在山景城(Mountain View)召開的年度I/O開發(fā)者大會(huì)上,谷歌研究小組的高級研究員、谷歌人工智能部門的負(fù)責(zé)人Jeff Dean,概述了谷歌在努力解決具有挑戰(zhàn)性的人工智能和機(jī)器學(xué)習(xí)方面的學(xué)術(shù)問題。本周二,谷歌推出了2500萬美元的全球人工智能影響補(bǔ)助計(jì)劃,并公布了人工智能技術(shù)正在進(jìn)行的三個(gè)可行項(xiàng)目,并以此陳述結(jié)束了這次演講。
Dean圍繞美國陸軍核心工程師于2008年公布的21世紀(jì)重大挑戰(zhàn)的清單進(jìn)行了討論。其中包括對“空中餡餅”的追求,例如逆向大腦工程、氮循環(huán)管理和融合能量提供。還有更實(shí)際的目標(biāo),如高級健康信息學(xué)、讓太陽能更便宜、增強(qiáng)虛擬現(xiàn)實(shí)等目標(biāo)。
“如果我們在這些方面都取得進(jìn)展,世界將成為一個(gè)更健康的地方,我們會(huì)有更多的科學(xué)發(fā)現(xiàn)。” Dean說。
為此,他詳細(xì)介紹了谷歌母公司Alphabet自動(dòng)化駕駛部門Waymo的研究人員正在進(jìn)行的工作。自Alphabet’s X skunkworks問世以來的10年里,Waymo的汽車在亞利桑那州鳳凰城(Waymo的一次叫車服務(wù)的所在地)搭載了1000多個(gè)付費(fèi)客戶,累計(jì)行駛了1000多英里。在車隊(duì)里有安全司機(jī),但Waymo在其他沒有安全司機(jī)的地方也駕駛汽車。
“(我們)正處在我們?nèi)绾斡?xùn)練自動(dòng)駕駛汽車在劇烈(變化)的尖端行駛。(汽車)必須做出一系列復(fù)雜的決定,比如通過做什么來實(shí)現(xiàn)目標(biāo),” Dean說。“這真的要?dú)w功于我們的深入學(xué)習(xí),我們學(xué)習(xí)了基于節(jié)奏的算法,并且可以建立汽車對世界的理解,讓它們在現(xiàn)實(shí)世界的環(huán)境中運(yùn)行。” Dean說,機(jī)器學(xué)習(xí)在機(jī)器人學(xué)中有著無止境的應(yīng)用,尤其是在挑選場景時(shí),這些場景要求機(jī)器人操作各種大小和不尋常形狀的物體。一項(xiàng)特別的任務(wù)——抓住機(jī)器人從未遇到過的物體——已經(jīng)看到了數(shù)量級的進(jìn)步。谷歌人工智能系統(tǒng)在2015年和2016年分別取得了65%的成功率和78%的成功率,研究人員在2018年設(shè)法提高到96%。
Dean說:“這是三年來取得的相當(dāng)好的進(jìn)展。我們已經(jīng)浪費(fèi)了三分之一的時(shí)間,你沒能找到一些東西——實(shí)際上很難把它們串在一起——所以這很令人興奮。”
另外,谷歌的人工智能團(tuán)隊(duì)一直在利用自我監(jiān)督的模仿學(xué)習(xí)技術(shù),這是一種人工智能培訓(xùn)技術(shù)。在這種技術(shù)中,未標(biāo)記的數(shù)據(jù)與少量標(biāo)記的數(shù)據(jù)一起使用,幫助提高學(xué)習(xí)的準(zhǔn)確性,從而“教”機(jī)器人新的技能。Dean描述了一個(gè)模型——通過“觀看”人類的示范,學(xué)會(huì)從罐子里倒蘇打水。經(jīng)過15次試驗(yàn)和15分鐘的訓(xùn)練,它獲得了一個(gè)平均8歲孩子智商的倒水技能。
健康是谷歌關(guān)注的另一個(gè)重要領(lǐng)域,人工智能在為轉(zhuǎn)移性乳腺癌等疾病開發(fā)診斷工具方面發(fā)揮了重要作用。糖尿病視網(wǎng)膜病是另一個(gè)目標(biāo)疾病,這是有充分的理由——它是全球4.15億糖尿病患者中增長最快的致盲原因。令人擔(dān)憂的是,大約 45%的患者在診斷前會(huì)有視力下降。
糖尿病性神經(jīng)病通常由眼底圖像識別,眼科醫(yī)師將其分級為滑動(dòng)標(biāo)度。圖像中出血的數(shù)量越多,疾病的發(fā)展速度就越快。
谷歌采用了人工智能系統(tǒng)來讀取這些圖像,并在2016年出版的《美國醫(yī)學(xué)協(xié)會(huì)雜志》上發(fā)表的一篇論文中證明,該系統(tǒng)可以將圖像歸類為普通眼科醫(yī)生的級別。在一年后的一項(xiàng)后續(xù)研究中,它提出了一種機(jī)器學(xué)習(xí)模型,可以與經(jīng)董事會(huì)認(rèn)證的視網(wǎng)膜眼科專家的性能相匹配。
今年2月,谷歌與印度Madurai的Aravind Eye醫(yī)院合作,在生產(chǎn)中部署了一個(gè)模型。
Dean說:“這是護(hù)理的黃金標(biāo)準(zhǔn)。”有了良好、高質(zhì)量的培訓(xùn)數(shù)據(jù),你可以訓(xùn)練模型并獲得和視網(wǎng)膜眼科醫(yī)師一樣的效果。”
在最近的一項(xiàng)研究中,谷歌人工智能科學(xué)家訓(xùn)練了一個(gè)人工智能系統(tǒng),用來尋找視網(wǎng)膜掃描樣本中和其他樣本不太明顯的關(guān)系。令人難以置信的是,它預(yù)測了諸如性別、收縮、舒張、血紅蛋白和年齡等因素,準(zhǔn)確率很高——在受試者年齡的三年內(nèi),在性別方面準(zhǔn)確率為97%,。
“與更具侵入性血液測試同樣準(zhǔn)確,現(xiàn)在你可以用視網(wǎng)膜圖像來進(jìn)行檢測。我們希望,這可能是一種全新的東西。當(dāng)你去看醫(yī)生時(shí),他們會(huì)給你的眼睛拍照,我們會(huì)有你眼睛的縱向歷史,并能夠從中學(xué)習(xí)新的東西。”
Dean說,在另一個(gè)領(lǐng)域——化學(xué)——谷歌正在用高效的人工智能模型超越傳統(tǒng)計(jì)算。2017年的一個(gè)細(xì)節(jié)在量子化學(xué)計(jì)算大約快了30萬倍,傳統(tǒng)上達(dá)到這種速度需要一個(gè)更昂貴的模擬器。
“突然之間,這意味著你可以做各種各樣的科學(xué)。你可以說,哦,好吧,我要去吃午飯,我可能要篩選1億個(gè)分子,” Dean說,“這可能很有趣,(而且)我認(rèn)為它將在許多科學(xué)領(lǐng)域發(fā)揮作用。”
Dean解釋說,這些突破性進(jìn)展是由神經(jīng)網(wǎng)絡(luò)的現(xiàn)代轉(zhuǎn)世所促成的——一組可訓(xùn)練的數(shù)學(xué)單元,按層組織,共同解決復(fù)雜的任務(wù)。他們從原始的、異構(gòu)的和雜亂的數(shù)據(jù)中學(xué)習(xí)特性。以前需要大量的手工預(yù)處理來處理這些。
像Transformers這樣有能力生成類人文本的可擴(kuò)展架構(gòu),以及可以在設(shè)備上運(yùn)行的高度緊湊的人工智能系統(tǒng),如Google最近發(fā)布的GBoard轉(zhuǎn)錄模型,都在繼續(xù)工作。Dean說,公司現(xiàn)在每天在預(yù)印服務(wù)器arxiv.org上發(fā)表近90篇學(xué)術(shù)論文,他指出增長速度超過了摩爾定律。
“很明顯,機(jī)器學(xué)習(xí)將成為科學(xué)和工程的重要組成部分。我們的目標(biāo)是鼓勵(lì)機(jī)器學(xué)習(xí)模型思想的交流,并將其付諸實(shí)踐……我認(rèn)為推動(dòng)先進(jìn)技術(shù)并將其應(yīng)用于不同的事物是一項(xiàng)重大的責(zé)任。”
關(guān)鍵詞: