每天都在汆肉中醒来青梅,好男人www在线观看,少妇无码自慰毛片久久久久久,国产欧美另类久久久精品丝瓜

登錄注冊
新聞 資訊 金融 知識 財經 理財 科技 金融 經濟 產品 系統 連接 科技 聚焦
首頁 > 金融 > > 正文

小小的大腦,大大的智慧——仿昆蟲智能為通用AI帶來的新思路

2021-04-17 13:45:39來源:互聯網

機器之心分析師網絡

作者:Yuanyuan Li

編輯:Joni

本文從視覺、追蹤和導航三個方面入手,以近年來的新應用為例,帶領讀者一窺機器人與昆蟲之間奇妙的化學反應。

很多工程師的夢想都是創造出能夠在復雜的環境下穩定勝任一系列任務——比如行走和導航——的機器人。為了實現這一目標,早期的研究者們試圖將機器人身處的環境抽象化,然后根據其所可能應對的情況和任務制定一系列規則,并賦予機器人一定的推理能力。在這段期間, 全世界范圍內也許最成功的機器人是名叫赫伯特的機器人。

赫伯特的前身是由西屋電氣工程師 Roy J. Wensley 開發用來遠程調用變電系統的機器人 Televox,僅由一組控制單元組成。Televox 本質上是一個聲控系統,為了實現遠程遙控的目的,該控制單元的一部分放在變電站另一部分則放置于調度員處。調度員可以利用 Televox 將指令轉為不同的聲音頻率發送到另一端,經過解碼后再執行相應操作。這一發明成功后,Wensley 進一步開發,并將 Televox 包裝為了一個有“臉”、身體和身體的機器人,也就是赫伯特機器人。

圖:世界上最早的機器人之一:Herbert Televox 和其開發者 Roy J. Wensley

source: https://medium.com/robotics-today/first-humanoid-robot-ever-87df3ee079b0

用今天的眼光來看,赫伯特也許完全算不上智能,因為它主要是靠規則驅動的,它的行為與人也并不相似。以當時最為人津津樂道的赫伯特作為家庭助手為例,操作人必須按照相對固定的腳本緩慢的向赫伯特傳達命令,有時還必須按下特定的按鈕來進行選擇或確認。因為赫伯特并不能真正理解操作人的語音,它只能識別一系列已經寫入系統的指令——還是在固定的音節上。可以說,赫伯特只能在其系統內規定的規則范圍內工作,這與今天大行其道的聯結主義 (connectionism) 是不同的。

聯結主義, 又稱仿生主義,認為心理現象可以用簡單并一致的網絡——如神經網絡——來描述,不同的行為可以通過這些基礎結構之間復雜的互動實現,這與人腦工作的方式相似。因此,聯結主義追求用簡潔的方式構建有通用性的解法,而規則驅動的算法則是 case by case,有很大的可能會隨著環境的復雜度增加而變得過于龐大。

顯然,隨著擬人機器人的發展,不少學者也轉向了其他方向來試圖開發更類人、具有更高智能的機器人。一些研究者將目光投向自然界,試圖從動物——比如昆蟲等結構比較簡單的動物——身上利用聯接主義進行研究、學習和模仿。這不難理解,從昆蟲的神經科學研究上看,昆蟲的神經系統比大部分動物都簡單很多,使對昆蟲的大腦建模相對來說簡單。但另一方面,許多昆蟲的大腦在大小、重量上都不值一提,有些甚至還“視力其差”,但這并不影響昆蟲高效、穩定的完成覓食和協作等復雜的行為。此外,盡管昆蟲的身體類型、行為、棲息地和生活方式種類繁多,但各個物種的大腦組織之間仍存在許多令人驚訝的一致性,這表明它們可能是有效,高效和通用的解決方案。[3]

本文從視覺、追蹤和導航三個方面入手,以近年來的新應用為例,帶領讀者一窺機器人與昆蟲之間奇妙的化學反應。

一、視覺場景識別 - A Hybrid Compact Neural Architecture for Visual PlaceRecognition

在視覺場景識別領域,流行的算法大致可以分為兩類:以深度學習為代表的更多依賴于計算機科學的模型,和利用大腦的特性建模的更多依賴于神經科學的模型。本文作者則旨在結合兩類研究的優點,實現新的緊湊而高性能的模型。

視覺位置識別(VPR)是指僅基于圖像所提供的視覺線索,而不使用任何其他信息,來識別圖像中描繪的位置的任務[6]。對于在現實環境中長時間運行的任何機器人系統或自動駕駛車輛而言,可靠地執行視覺位置識別(VPR)都是一項挑戰。因為同一個地方因為時間,如白天 / 夜晚或天氣 / 季節周期,的變化可能看起來完全不相似,而多個地方在某些特定的情況下反而可能看起來十分相似。另外一個問題是目前流行的預訓練模型大多是在單個圖像上訓練的,雖然這些模型也取得了很好的成績,但是期通常會忽略連續圖像內所蘊含的時間信息。

而昆蟲等生物卻能夠非常有效地從低分辨率數據中提取有關其環境的信息,它們能夠在各種環境條件下(不同光照、對比度等)強大地執行視覺處理任務。一般認為,昆蟲對位置的識別主要是通過蕈形體(mushroom bodies)實現的。蕈形體是昆蟲或其他節肢動物和一些環節動物如沙蠶腦中的一對結構[7],其名字來自于其大致半球形的花萼,這個花突通過中樞神經束或花序梗與大腦的其余部分相連。下圖標亮了果蠅大腦中的蕈形體。蕈形體的結構可以簡化為多層感知器(MLP),它涉及蜜蜂和螞蟻的嗅覺和視覺信息的分類、學習和識別。這些昆蟲的感官接受到經過密集編碼和高度處理的輸入,并傳遞給蕈形體,后者則將該信息稀疏地連接到蕈形體內的大量內在神經元。

圖:果蠅大腦中的蕈形體

圖源:維基百科 https://en.wikipedia.org/wiki/Mushroom_bodies

根據果蠅嗅覺神經回路的工作機制,作者提出了僅包含兩層全連接層的 FlyNet 算法(FLA)。圖像在預處理后將以 10% 的采樣率被輸入到第一層網絡當中。當第二層全連接層的輸出其編碼的表示后,僅有 50% 的輸出值將被設置被 1,其他則被設置為 0,以獲得一個簡潔的二進制特征表示。該網絡的具體結構如下圖所示:

圖:FNA 算法圖示

圖源:Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

為了處理圖像序列中的時間維度,作者在 FlyNet 上疊加了一個一維連續吸引子神經網絡(continuous attractor neural network, CANN)。CANN 也是一個典型的仿生智能例子——一般認為大腦在執行一些計算任務時會采用特定結構的神經網絡,CANN 就是基于此而開發的。CANN 由吸引子組成,它們之間有局部連接。此外,網絡內有興奮性與抑制性的兩種活動,從而保證網絡即能夠形成有意義的空間活動,又不會在正反饋的疊加下爆炸。因此一個吸引子可以使用興奮性和抑制性連接來激發或抑制自身以及附近的吸引子。CANN 在數學表示和結構上具有良好的特性,如空間平移不變性 [8]。

圖:(A)朝向編碼的一維 CANN 的圖示(B)一維 CANN 的穩定狀態,每個吸引子對應一個高斯波包活動狀態。

圖源:Wu, S., Wong, K. Y., Fung, C. C., Mi, Y., & Zhang, W. (2016). Continuous Attractor Neural Networks: Candidate of a Canonical Model for Neural Information Representation. F1000Research, 5, F1000 Faculty Rev-156. https://doi.org/10.12688/f1000research.7387.1

在本文中,由 FlyNet 輸出的二進制圖像特征將被輸入到 CANN 中,如下圖所示,以達到對 FlyNet 的輸出進行時間濾波的目的。

圖:FlyNet+CANN 混合神經網絡架構

圖源:Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

作者在 Nordland 和 Oxford RobotCar 數據集上 FlyNet + CANN 以及目前的 SOTA 算法進行了對比,指標為 AUC (area under curve)。該數據集內的圖像大多為 1000*1000 以上的較高分辨率圖像,但在測試 FlyNet + CANN 時作者將其一概下采樣為 32*64 的灰度圖像。考慮到分辨率的大幅下降,這個信息損失還是很驚人的。個別 SOTA 算法使用了 VGG16 等對圖像分別率有要求的結構,因而作者沒有將圖像也圖樣下采樣到 32*64, 但有將最終輸出的特征進行下采樣到 FlyNet 輸出特征一樣的維度。

下圖顯示了 FlyNet + CANN 和 SOTA 算法的對比結構。在 Nordland 數據集上,MPF 表現更好,AUC 達到了驚人的 100%,能夠同時在秋冬轉換下準確的識別所有位置。FlyNet + CANN 和 SeqSLAM 的表現相似,并且在冬季和夏季的數據上的表現也比較平衡。基于語義的 LoST-X 的精度則在冬季數據上大幅下降,導致了最低的 AUC。

與 Nordland 不同,Oxford RobotCar 數據集帶來了日夜轉換的挑戰。下圖中可以看到所有模型在夜景數據上的 AUC 都有或多或少的下降,SeqSLAM 的 AUC 更是降到幾乎為零。在這一數據集上,FlyNet + CANN 取得了最高的 AUC 并且在夜景上的表現也沒有過多下降。

圖:(上):Precision Recall 曲線 (左)Nordland (右)Oxford RobotCar

(下):AUC (左)Nordland (右)Oxford RobotCar

圖源:Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

當然,作者使用基于仿生研究的模型結構的一大目的是獲得能耗較低但運行速度夠快的模型,根據作者對 1000 張圖片的平均位置識別時間的統計,FlyNet + CANN 可以達到每秒 16.66 幀的查詢速度,比排名第二快模型還要快 1.5 倍以上。這一點為仿生神經網絡對比 CNN 提供了強大的競爭力——即便目前的相關研究也很活躍,但 CNN 的能耗和推理速度仍然為在移動端部署模型帶來了不小的挑戰。而基于昆蟲大腦的 FlyNet + CANN 等神經網絡,可以將模型參數控制在百萬以內,并且沒有在模型表現上落后太多。此外,FlyNet + CANN 也繼承了昆蟲的另一特性——在低分辨率下進行計算,從計算角度直接保證了模型的實時推理的可行性。

二、追蹤 - An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments

計算機視覺和機器人應用往往需要在移動平臺上實現強大而有效的目標跟蹤算法,但就目前的人工視覺系統的表現而言,在雜亂的背景下檢測和跟蹤移動物體仍是最具挑戰性的任務之一,更遑論對實時系統的部署。而昆蟲的視覺系統,則為研究者們提供了一個理想的視覺追蹤系統的完美例子。許多飛行昆蟲,例如蜻蜓,都能夠檢測、選擇和追捕微小的獵物或同種動物。更令人咋舌的是,昆蟲僅有限的視覺分辨率( 0.5°)、尺寸相對較小的大腦(小于 2 mm 寬)和重量輕和低功率的神經元結構用于處理數據。

本文作者們在之前數年的研究中已經通過細胞內電生理技術來記錄昆蟲視神經葉內的神經元活動,并確定了一組與目標的檢測和追蹤相關的神經元,作者將其命名為“小目標運動檢測器”(small target motion detectors, STMD)。基于這些生理數據,作者開發了用于局部目標識別的非線性“基礎 STMD”(Elementary- STMD, ESTMD)模型(Wiederman 等人,2008),并在 VR 模擬環境中對該追蹤系統進行了測試。在本篇論文中,作者主要實現了整套追蹤模型在機器人平臺上的部署,并在室內和室外環境對該機器人進行了詳盡的測試。

下圖中,作者給出了整個系統的工作流程,所有功能在 Husky A200(Clearpath RoboticsTM)平臺上實現。機器人身上裝有一個 Blackfly 相機,用于獲取機器人所處環境的視覺輸入。相機輸出用作昆蟲啟發的目標跟蹤模型的輸入,該模型包括:

1)圖像預處理(early visual processing):該模塊主要用于模擬飛行昆蟲中光學,感光體和大型單極細胞(large monopolar cells , LMC)的響應特性。由于飛行昆蟲的光學器件受到小平面透鏡內的衍射和其他形式的光學干涉的限制,針對輸入的圖像,作者首先使用高斯低通濾波器對這種光學模糊進行建模,這與典型的日間活動昆蟲的光學采樣相似(Stavenga,2003 年)。為在算法的敏銳度和計算效率之間取得平衡,作者還以 1° 的間隔對捕獲的圖像進行二次采樣。另外,作者選擇僅處理 RGB 圖像的綠色通道來模擬飛行昆蟲運動路徑的綠色光譜敏感性。接下來,這一模塊中還有時間共同濾波和空間高通濾波,以進一步去除多余的信息。

2)目標匹配濾波(Target Matched Filtering,ESTMD 階段):這一模塊主要模擬的是昆蟲第二視神經網(2nd optic neuropil)內的 Rectifying transient cells(RTC)。RTC 對光增量(ON 通道)或減量(OFF 通道)具有獨立的適應性,在實際實現中,作者通過半波整流(half-wave rectification, HWR1)對 ON 和 OFF 通道的分離進行建模。接下來,生成的 ON 和 OFF 的通道數據需要通過快速適應模塊,其中適應狀態由切換其時間常數的非線性濾波器確定。當輸入增加時,時間常數為“快”(3 毫秒),減少時則為“慢”(70 毫秒)。此外,作者使用了強烈的空間中心包圍對抗(spatial centre-surround antagonism),使得每個通道周圍都抑制了其最近的鄰居。時間適應減少了對背景紋理的響應,而強烈的空間中心包圍對抗則傳達了對局部邊緣特征的選擇性。在此輸出上,作者添加了第二個半波整流,用于消除負值。到了這一步,在前進方向上,小目標將會首先表現為亮度的升高(或下降),經過短暫的延遲后才出現相應的下降(或升高)。為了充分利用這一特征,作者每個通道的輸出與相對通道的延遲版本(下圖標記為低通濾波器(LP_ESTMD))相乘,然后對輸出求和。這能夠賦予最終系統足夠的目標靈敏度,而與目標相對于背景的對比極性無關。

3)ESTMD 輸出融合(Integration and facilitation of ESTMD output):在這一模塊中,處理后的信息將被用于兩個方面。一方面,機器人需要根據輸入的信息推斷追蹤目標的位置。輸入這一模塊的數據首先需要通過雙曲正切 “激活” 函數 S(x),以保證所有數據值都在于 0 和 1 之間,其中的最大值將被認為是當前位置估計 r(t)。另一方面,由于目標追蹤是一個連續的過程,將此前的信息連續不斷的與最新的視覺信息整合起來是必須的。為了模擬昆蟲更新信息的融合機制(facilitation mechanism),研究者們可以將當前的位置根據目標速度矢量進行相應的偏移——以作為對目標未來位置的估算——然后加權更新系統地圖(Nordstr m 等人,2011; Dunbier 等人,2011; 2012)。在本文中,通過將當前位置估計(r(t))與由 Hassenstein-Reichardt 基本運動檢測器提供的目標速度矢量(v(t))的估計值相乘,并乘以采樣時間,可以計算出預測目標位置(r’(t+1))。接下來,作者使用 2D 高斯核 FG(r")來實現軌跡估計和實際觀察到的數據之間的融合。文中使用的 2D 高斯核 FG(r")相當于昆蟲神經元的感受野之間有 50%的重疊。該輸出上將被疊加一個低通濾波器(LP_Fac),處理后的信息將會被用于與下一次的輸入信息進行融合,以提供目標在此前的運動軌跡。融合的強度由時間常數 τf 控制,其可以決定 r(t) 周圍的位置將被增強多久。

4) 掃視追蹤算法(Saccadic Pursuit Algorithm):在飛行過程中,昆蟲會繞頭移動(saccadic head movements),這是一種 “急速” 轉彎——即短而快速的偏航轉彎以改變注視方向。為了模擬這一行為,在成功的從視覺線索中識別目標并確定其位置后,追蹤算法需要決定相應的前進速度,并保持目標始終在自己的視野中心內。當 ESTMD 輸出的位置估計從視場中心移出超過 5° 時,機器人會重新掃視自己的視野并計算需要調整的角度,來模擬昆蟲行為中看到的這種繞頭移動。使目標保持在視野內的特定角度位置。

圖:目標追蹤的閉環流程

圖源:Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

在實際測試中,作者使用不同大小——直徑 65mm 或 100mm——和不同顏色——黑色、深灰、淺灰、白色等——的泡沫球來代表目標。泡沫球被用類似于魚線的透明細線懸掛于離地面 50-150cm 的高度,并按照固定的軌跡以 0.06m/s 或 0.12 m/s 的速度前進,以代表慢速和快速的目標。在實驗過程中,如果機器人在泡沫球完成其運動軌跡之前能夠前進至泡沫球一米之內,就認為追蹤成功了。

由于相機硬件的限制,機器人只能以 20 Hz 的頻率對所處環境進行采樣并跟蹤目標。整個實驗可以在戶外進行,也可以通過將周圍環境投影到墻壁上在室內進行。由于室外環境的挑戰更強,筆者將著重關注該機器人在室外的表現。

圖:機器人的視頻輸出樣例,用以顯示室外實驗的環境條件。

圖源:Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

內部模型對目標檢測的影響

如前文提到的,在飛行過程中,昆蟲會繞頭移動以使目標保持在視野內的特定角度位置。然而,這些掃視運動會導致視網膜圖像的頻繁且大量的移位。因此,在掃視過程中昆蟲需要利用眼睛或身體的運動來調節視覺輸入,以將視覺注意力轉移到正確的位置。一些研究認為飛行昆蟲體內有一種內部模型 (internal model)來對這種掃視運動進行預測和計劃。為了衡量這種內部模型對于追蹤成功率的影響,作者比較了開環(open-loop)和閉環(closed-loop)控制下的追蹤成功率。在閉環控制中,機器人系統可以根據運動傳感器的信息,將融合了 ESTMD 的輸出后的位置信息重新定位到完成掃視運動后的相應位置,而在開環控制實驗中機器人則沒有這類運動傳感器數據。

結果——如下圖(a)顯示,閉環系統的目標檢測成功率的中位數為 59%,而在開環系統中,檢測成功的中位數則直接下降到 48%,因而顯示了內部模型在跟蹤目標檢測中的重要作用。

信息融合對目標檢測的影響

在機器人系統的第三部分內,作者實現了一個信息協助機制(facilitation mechanism),從而提高目標相對于其周圍壞境的對比度。為了量化該協助機制的作用,作者選取了機器人在實驗一開始難以盡快檢測到目標,但在追蹤過程中后來又將其鎖定的視頻圖像。在這些圖像中,作者人為的選取目標在第一幀中的位置,并將其作為融合機制中目標的未來位置,從而提供一個對目標位置的初識估計。整個過程可以持續 200 毫秒或 500 毫秒。

接下來,作者比較了在系統成功將目標鎖定之前的幀內,系統有(200 ms 或 500 ms)或無目標初始位置估計的目標檢測成功率。200 ms 和 500 ms 的目標初始位置的估計和信息融合將成功目標檢測的中位數提高到 29%和 34%,相比之下,無目標初始位置的估計情況下的成功率是 3%, 如下圖(b)所示。這些結果表明,信息融合機制的存在可以有效的將注意力引導到目標位置,從而提高檢測成功率。

圖:a)內部模型對目標檢測的影響, b)信息融合機制可增強目標相對于其周圍壞境的對比度

圖源:Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

目標對比度的重要性

作者在閉環追蹤中量化了目標相對于環境的對比度的影響。下圖 (a)中的框線圖總結了追蹤過程中的平均目標對比度,框內的紅線是平均對比度的中位數,兩端則是 25%和 75%分位數,剩余的紅色小點是 outlier。盡管在實驗過程中光照條件會發生變化,因此目標對比度也會發生變化,但不同實驗的平均對比度中位數實際上是相似的。如果將目標對比度平均分為 5 個水平,并計算其相應的追蹤成功率——其中不同的曲線對應機器人在融合位置信息時使用的不同的時間常數 τf ——如圖 (b)所示,我們可以得出一些有趣的結論。

首先——不出意料的——可以看出高目標對比度對實現高追蹤成功率是相當有效的。當目標對比度較低時,由于檢測到目標的成功率已經很低,使用不同的時間常數 τf 基本沒有任何影響,時間常數的最大影響是當目標對比度大于 0.3 時。作者認為,由于目標對比度在追蹤過程中會發生變化,在實際使用時如果能夠在目標對比度較高時使用合適的時間常數建立高效的融合機制,并在隨后追蹤中僅試圖 “鎖定” 在對比度降低的目標上,將會大大提高追蹤的成功率。

圖:目標對比度對于追蹤成功率的影響

圖源:Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

毫無疑問的,本文中受昆蟲的生物結構啟發而實現的各類模塊使得機器人在低目標對比度、存在噪聲的環境等的環境中表現的穩健型有了提高,并且系統的成功率與模擬(simulation)計算出的成功率相似。但是,該系統也有一些美中不足的地方 —— 在信息融合機制中,由于需要對目標的未來位置進行估計,對當前目標速度的估計是很重要的。而作者僅簡單的使用了目標的當前速度并將分為 “慢”,“中” 或“快”三等。這不可避免的導致了位置估計的誤差,從而影響了系統的表現。另外,當機器人運動時,其一定會受到震動產生的力和振動的影響。振動會削弱信息的獲取、運動信息的命令輸出或將輸入信息與輸出運動命令相關聯的過程。昆蟲通過減少振動傳遞到頭部 / 復眼的方式——即頭和身體獨立轉動——來減少其對視覺的影響。這種 “主動視覺” 在本文的機器人系統上并沒有被實現。

本文其他的局限性主要來自于硬件系統——在當前的研究中,攝像機的幀數較低(20 fps),因而限制了機器人和目標的速度。而像蜻蜓等昆蟲的飛行速度可以達到 6.8 m/s,也就是說,目前在地面上緩慢移動的機器人平臺無法像蜻蜓那樣處理同等水平的動態能量和運動控制難題。要實現高處理速度和低計算復雜度,就必須轉向高速攝像頭,并處理隨之的數據處理和能耗要求。不難想象,如果以上問題都能夠解決的話,該模型最理想的實現平臺應該是無人機等空中平臺。

三、導航:The Central Complex as a Potential Substrate for Vector Based Navigation

接下來,我們的目標轉向在地面上活動的昆蟲 —— 螞蟻等昆蟲具有強大的導航能力。一般認為,這類昆蟲利用其大腦內的中心復合體(central complex)來實現與導航,方向和空間學習緊密相關的功能,上面的神經回路會通過稱為路徑整合(path integration ,PI)的過程來跟蹤它們在巢外的移動情況。目前,建立在神經生理學和神經解剖學數據基礎上的最新模型已經可以解釋 PI 系統是如何控制昆蟲在巢外環境探索并準確返回巢穴的——通過結合體內的指南針和速度信息,該系統可以不斷更新原點矢量(home vector),用以記錄目前其相對于巢穴的位置和方向——其中振幅用于記錄距離,相位用于記錄方向——從而允許昆蟲在外行進任意路線之后直接返回巢穴。但是,昆蟲不會僅將 PI 系統用于歸巢。例如,他們還可以利用該系統存儲向量信息(PI vector-memories)以返回到已知的食物位置,并在多個食物位置之間尋找捷徑。對昆蟲這種行為的實現可以提供基于矢量的豐富導航功能。

本文實現的中心復合體神經模型一共有五層,如下圖所示。第一層分為兩部分,分別由用于獲取智能體(Agent)當前的速度 (speed)的 TN_2 神經元和和用于獲取前進方向(directional)的 TL 神經元組成。后者包含 16 個輸入神經元,每個輸入神經元都優先響應一個特定方向 α∈ 。通過判斷哪個神經元被激活了,就可以得出智能體的前進方向。在實驗中,智能體每走一步都會收到其目前的前進方向 α 和應該前進方向 θ ∈ [0, 2π) 之差的余弦值作為輸入。

第二層由 16 個神經元組成,主要作為方向單元(direction cells)用以模擬昆蟲體內的 CL1 神經元,這些神經元接收與前一層方向層的輸出成比例的抑制輸入。這些方向單元劃分了方位角空間(azimuthal space ),并互相抑制,從而形成一個環形吸引電路(ring attractor circuit),然后以正弦曲線形式產生穩定的分布圖案。

第三層主要實現指南針(compass)功能,由 8 個神經元組成,它們從前一層中具有相同方向偏好的每對 CL 神經元中獲取輸入。這些神經元與中心復合體的前腦橋中的 TB1 神經元相同,它們也以類似于環形吸引電路的特定模式相互抑制連接。

第四層負責速度累加(Speed Accumulation),由 16 個神經元組成,主要模擬中心復合體上的 CPU_4 細胞,每個從 8 個 TB1 神經元和上一層的 CL_1 神經元獲取輸入。這些神經元實際上是一組積分單元(integrator cells ),負責結合方向和速度信息。值得注意的是,其速度輸入是受到其相應方向單元的抑制的,因此神經元累積會與航向相反的行進距離,從而創建了原點矢量的分布式表示形式。

到這一步,作者額外添加了“向量記憶”(vector memory)神經元,該神經元可以存儲第 4 層的輸出狀態,進而在該輸出到達第 5 層之前對其進行調制(modulation)。具體來說,系統需要將利用記憶神經元的突觸權重(synaptic weights)——兩個節點之間聯系的強度或幅度——實現向量記憶。當智能體發現食物后——當然這在此后的研究中可以被替換為更廣泛的事件類型——智能體將會將當前的原點矢量存儲到記憶神經元中。這樣,智能體可以在之后回到它存儲原點矢量的位置。當智能體回到巢穴后,第四層的輸出在理想狀態下應該為 0 ——因為它距離原點,也就是巢穴的距離為 0——因此,第四層中任何非零的輸出都就代表了整個路徑中的錯誤。利用這一“錯誤向量”,智能體可以對其存儲的最后一個向量進行重新校準。

第五層模擬的是中央復合體的 CPU1 神經元,負責輸出智能體的轉向(steering)。它們接收來自第三層的指南針輸入,以及第四層中經過向量內存調制(modulated)的原點向量。根據智能體的行動目的——比如歸巢或覓食——神經元可以有選擇性的接受輸入信息。

圖:中央復合體模型中的大概結構和主要連接

圖源:Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

作者在 Python 2.7 中搭建了模擬環境,主要包括一個巢穴(nest),幾個食物點(feeders)和一些障礙物。巢穴和食物點都用圓形表示,并且其直徑相對于模擬環境是較小的,但其會散發出一些特定的嗅覺信息,使得智能體在到達巢穴和食物附近后能夠被吸引過來。而障礙物則可以是任意形狀的,它會在很小的半徑范圍內發出排斥信號來迫使智能體轉向。在測試中,智能體可以從外部參考系中獲取有關其前進方向和速度的信息,如果智能體能夠成功進入到巢穴或食物的半徑范圍內,就視為該測試成功。

作者首先測試了向量記憶是否可用于計算兩個已知位置之間的捷徑(shortcutting)。該測試目的,從幾何上來說,如果智能體存儲了兩個從不同位置指向巢穴的原點矢量 F_1 和 F_2(下圖中的綠色箭頭和紫色箭頭),那么當智能體處于 F_1 時,對 F_1 和 F_2 之間做減法,可以形成一個平行四邊形,也就是可以得到從 F_1 直接前往 F_2 的捷徑(下圖中的深橘色箭頭)。

圖:昆蟲如果利用其存儲的向量可以計算多個目的地之間的捷徑

圖源:Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

在實驗過程中,智能體需要通過隨機游走(random walk)——從而模擬昆蟲探索周圍環境的行為——獨立的發現兩處食物點并將其對應的原點矢量存儲在向量記憶中。然后,智能體首先需要根據其記憶返回其中一個食物點,其記憶中的另一個原點向量將在到達后被激活,用以計算從當前食物點直接前往下一食物點的捷徑。作者衡量了到達第二個食物點的成功率,前往第二個食物點的路徑的平直性,以及離開第一個食物點的角度誤差。在 212 次實驗中,有 193 次智能體成功到達了第一個食物點,這其中到達第二個食物點的成功率高達 89.6%。

圖:利用向量記憶尋找捷徑。(A)智能體現在有兩個不同的向量記憶神經元可用,但一次只能調用一個。(B)當智能體調用第一個向量到達 F1 后,有關 F2 的向量記憶會被激活,并通過向量之間的加減法計算從當前位置前往 F2 的捷徑。半透明的線分別代表 100 次重復實驗,其中一次實驗用實線更清晰的標記出來用作示例。

圖源:Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

接下來,作者測試了智能體在需要依次訪問多個食物點的時候能不能找到全局最短路徑(multi-location routes)。這個測試一共有三種情況,第一種情況是正陣列(positive array),智能體一共需要訪問五個食物點,每次僅簡單的訪問最近的下一個食物點就可以形成全局最短路徑;第二種情況時負陣列(negative array),智能體需要訪問六個食物點,但簡單的訪問最近鄰與全局最短路徑是不等價的;第三種情況也是負陣列,智能體需要訪問十個食物點。已知在自然界中蜜蜂可以很好的處理前兩種情況,但無法在第三種情況中找到最優解。每一種情況的食物點分布和最優路徑如下圖所示。

圖:全局最短路徑測試 (A)智能體現在有多個不同的向量記憶神經元可用,但一次仍然只能調用一個;(B)正陣列(5 個食物點)測;(C)負陣列(6 個食物點)測試;(D)負陣列(10 個食物點)測試。左:中黑色的箭頭的寬度與該線路出現的頻率成正比;右上角:智能體最常選擇的路線;右下角:單個路徑示例

圖源:Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690.

在實驗開始之前,作者首先保證每個食物點都在 100 次以上隨機游走過程被智能體發現,然后對其存儲的向量記憶求均值,從而獲得關于每個食物點的精確的向量記憶,以排除位置誤差在本次實驗中的影響。然后在測試中,一次向外旅行(outward trip)對應于一個智能體離開巢穴,根據其向量記憶計算新路線或簡單的追蹤其記憶,并在找到所有食物點或達到時間限制后返回巢穴。在旅行過程中,智能體可以隨時根據當前的 CPU4 激活值減去其向量記憶,產生的最小值所對應的向量記憶將被選擇為當前調用的向量記憶,從而驅動智能體的活動路徑。由于這類計算沒有時間限制,如果最小值正好變化了,它可能在任何時刻調用不同的向量記憶并改變路徑。當沒有任何向量記憶可以調動后,智能體會直接返回巢穴。

每一種情況都被重復測試了 500 次以上,作者選取了測試中智能體成功在時間限制之內到達每個食物點然后返回巢穴的路徑,計算了智能體造訪食物點的順序,完整路線的形狀和頻率以及食物點間的個別移動。

在第一種情況中(正陣列),智能體一種有 5 != 120 條可能的路線來訪問此陣列中的 5 個食物點。在 500 次重復實驗中,94.20%的智能體都成功完成了測試,其中有 77.71%(r = 366)和 15.07%(r = 71)的智能體使用了兩種最佳路線(逆時針和順時針;5、4、3、2、1 和 1、2, 3、4、5),有 1.49% 和 0.64% 的智能體選擇了次佳路線,僅有不到 3% 的智能體使用另外的 8 中路線,剩余的 108 條可能路線則從來沒有被選擇過,這與學者們在蜜蜂中觀察到的情況非常相似。

在第一個負陣列中,智能體一共有 6 != 750 條可能的路線來訪問 6 個食物點,有 94% 的智能體都成功的通過了測試。雖然在其中,至于 2.77% 的智能體選擇了最佳路線(1、2、3、4、5、6),但作者發現有 47.23% 的智能體選擇了次優路線。剩下的智能體則選擇了其他路徑,同樣的,有大量的路徑 (711 條)從來沒有被選擇過。

可能的路徑總數隨著食物點的增加是呈指數級增長的,在第二個負陣列中,智能體一共有 10!= 3628800 條可能的路線來訪問 10 個食物點。所有實驗中仍然有 95.40% 的智能體成功的完成了測試,但相比于前兩種情況,智能體的路徑選擇更多樣化,500 次實驗中一共有 371 條不同的路徑被選擇了。因而,作者也無法像此前的實驗一樣從中計算出一條具有代表性的典型路徑來。相對來說,最經常被選擇的四條路徑在長度上不是最優的,同時也不是僅僅選擇最近鄰而形成的路線。接下來的三條最常被選擇的路徑是最優路徑之一,但僅有 1.05% 的智能體選擇了它們。這次實驗的結果顯示了強烈的隨機性,作者認為主要是由兩個原因導致的:1)食物點間較短的相對距離會導致較大的方向誤差,2)不同食物點之間的距離相似,導致當前向量記憶的選擇更加隨機。

整體來說,這篇文章證明了對矢量的操縱是對觀察到的昆蟲導航系統的高度簡約的解釋。它既符合解剖學模型, 同時在實現上足夠簡單,產生的結果也與對實際昆蟲的觀測結果相符。本文中使用的向量記憶是新穎的,它可以校正 PI 機制中積累產生的誤差,并且可以有效的在不同目的地之間計算捷徑。但本文沒有考慮到 PI 機制如何可以與其他導航線索結合起來——眾所周知螞蟻等昆蟲會從腹部末端的肛門和腿上的腺體里分泌帶有特殊氣味的化學物質,以提供氣味路標。這在原點矢量的位置不準確的時候將會提供極大的幫助。

結語

很顯然,目前以模擬昆蟲的功能實現智能系統的研究還處在一個比較早期的階段,我們要在終端產品上見到這些系統還需要一段時間。但仿昆蟲大腦的智能,乃至仿生智能,仍然為更一般的神經啟發式 AI 提供了曙光。目前流行的深度學習,能夠從大型數據集提取模式并獲得超出人類水平的表現。但在半監督和無監督學習領域,開發出能夠自我標記新類示例的算法仍然是一個挑戰。盡管這些任務對于人類來說似乎微不足道,缺乏推理能力的深度學習算法仍難以與人類的性能相匹配。神經啟發的 AI——或仿生智能——則提供了新的機會,因為它可能可以直接跳過我們目前常用的解題思路來解決這些難題。一旦研究者們能取得突破,人類對自然界智能的認知又將再上一個臺階。

參考文獻

[1] Chancan, M., Hernandez-Nunez, L., Narendra, A., Barron, A. B., & Milford, M. (2020). A hybrid compact neural architecture for visual place recognition. IEEE Robotics and Automation Letters, 5(2), 993-1000. https://doi.org/10.1109/LRA.2020.2967324

[2] Chance, F. S., Aimone, J. B., Musuvathy, S. S., Smith, M. R., Vineyard, C. M., & Wang, F. (2020). Crossing the Cleft: Communication Challenges Between Neuroscience and Artificial Intelligence. Frontiers in computational neuroscience, 14, 39. https://doi.org/10.3389/fncom.2020.00039

[3] Webb, Barbara. (2020). Robots with insect brains. Science. 368. 244-245. 10.1126/science.aaz6869.

[4] Bagheri, Zahra & Cazzolato, Ben & Grainger, Steven & O"Carroll, David & Wiederman, Steven. (2017). An autonomous robot inspired by insect neurophysiology pursues moving features in natural environments. Journal of Neural Engineering. 14. 046030. 10.1088/1741-2552/aa776c.

[5] Le Mo l, F., Stone, T., Lihoreau, M., Wystrach, A., & Webb, B. (2019). The Central Complex as a Potential Substrate for Vector Based Navigation. Frontiers in psychology, 10, 690. https://doi.org/10.3389/fpsyg.2019.00690

[6] Le, D. C., Youn C. H. (2020). City-Scale Visual Place Recognition with Deep Local Features Based on Multi-Scale Ordered VLAD Pooling. arXiv:2009.09255 **

[7] https://en.wikipedia.org/wiki/Mushroom_bodies

[8] Wu, S., Wong, K. Y., Fung, C. C., Mi, Y., & Zhang, W. (2016). Continuous Attractor Neural Networks: Candidate of a Canonical Model for Neural Information Representation. F1000Research, 5, F1000 Faculty Rev-156. https://doi.org/10.12688/f1000research.7387.1

分析師介紹:

本文作者為Yuanyuan Li。幾次轉行,本科國際貿易,研究生轉向統計,畢業后留在比利時,從事農用機械研發工作,主要負責圖像處理,實現計算機視覺算法的落地。欣賞一切簡單、優雅但有效的算法,試圖在深度學習的簇擁者和懷疑者之間找到一個平衡。

關于機器之心全球分析師網絡 Synced Global Analyst Network

機器之心全球分析師網絡是由機器之心發起的全球性人工智能專業知識共享網絡。在過去的四年里,已有數百名來自全球各地的 AI 領域專業學生學者、工程專家、業務專家,利用自己的學業工作之余的閑暇時間,通過線上分享、專欄解讀、知識庫構建、報告發布、評測及項目咨詢等形式與全球 AI 社區共享自己的研究思路、工程經驗及行業洞察等專業知識,并從中獲得了自身的能力成長、經驗積累及職業發展。

關鍵詞: 小小 大腦 大大 智慧

熱點
主站蜘蛛池模板: 汝州市| 阜平县| 青神县| 昌宁县| 海南省| 华安县| 广水市| 镇远县| 儋州市| 竹溪县| 溆浦县| 西和县| 额尔古纳市| 赣榆县| 阜南县| 沁阳市| 綦江县| 长汀县| 绩溪县| 庆阳市| 石泉县| 元江| 伊通| 酒泉市| 绥宁县| 炎陵县| 余江县| 阿鲁科尔沁旗| 浮梁县| 阜新市| 宁远县| 乳山市| 灌南县| 永靖县| 闽侯县| 彭阳县| 永川市| 进贤县| 苗栗县| 新化县| 大同市|