ChatGPT 等人工智能的應用正在快速地改變我們的生活方式和信息處理的方法。由于神經網絡深度學習依賴于大規模矩陣運算,對計算能量效率和速度有極高的要求。
(相關資料圖)
圖|硅光 48 通道智能發射器示意圖(來源:是Alex Sludds)
目前大部分神經網絡的計算都是在服務器進行。例如,當我們向 ChatGPT(或者智能家電)提出問題時,設備需要幾秒鐘的時間才能做出響應。出現這種延遲的原因之一是聯網設備沒有足夠的內存或電量來存儲和運行設備理解用戶要求所需的龐大機器學習模型。該模型存儲在可能位于數千公里外的數據中心,在那里計算答案并將其發送到設備。該延時雖不大,但限制了很多需要實時反饋的場景,如自動駕駛。
(來源:Science)
因此,麻省理工學院的研究團隊基于集成硅光芯片,創造了一種直接在這些設備上進行計算的新方法(光學邊緣計算),從而大大減少了這種延遲。他們的技術將運行機器學習模型的內存密集型步驟轉移到中央服務器,在中央服務器上模型的組件被編碼到光波上。使用光纖將波傳輸到連接的設備,這使得大量數據能夠通過網絡以光帶寬(2.4TB/s)發送。然后接收器使用一個簡單的光學設備,該設備使用這些光波攜帶的模型部分快速執行計算。
與其他方法相比,該技術可將能源效率提高一百倍以上。它還可以提高安全性,因為用戶的數據不需要傳輸到中央位置進行計算。這種方法可以使自動駕駛汽車實時做出決策,同時僅使用耗電計算機當前所需能量的 1%。它還可以讓用戶與他們的智能家居設備進行無延遲對話,用于通過蜂窩網絡進行實時視頻處理,甚至可以在距離地球數百萬英里的航天器上實現高速圖像分類。
(來源:Science)
“每次你想運行一個神經網絡,你都必須調用模型,你能以多快的速度運行這個程序取決于你能以多快的速度從內存中輸入模型。我們的管道很大——相當于每毫秒左右通過互聯網發送一部完整的電影。這就是數據進入我們系統的速度。而且它的計算速度也可以這么快,” MIT 團隊負責人教授德克·英格倫 (Dirk Englund) 說。
邊緣計算(edge computing)是近年來人工智能芯片領域的熱門方向之一。這種運算模式把神經網絡運行在智能終端處理器比如智能手機、自動駕駛汽車上,通過實現去中心化計算,可以大大增加用戶信息的安全性,同時減少數據中心的計算量,縮小數據處理的延時等。
谷歌推出的特種處理器芯片 Edge TPU、以及 NVIDIA 的 EDX 芯片等都是面向上述應用。然而,當電學芯片運算大規模權重矩陣時,其能量損耗和計算速度已經達到瓶頸,這影響了智能邊緣設備的續航時間并會導致計算延時,進而增加智能終端的體積,重量和功率。本文中,麻省理工團隊的光學服務器-客戶端架構主要實現了:
(1)一個硅光集成芯片為基礎的“智能發射器”(smart transceiver)用于電-光轉換,通過波分復用把權重數據傳輸,用光纖傳到毫瓦級別的終端處理器,其中的數據傳送光學帶寬達到 2.4THz(48 通道,50GHz 每通道)。(2)他們把 AI 模型從 MIT 校園傳送到林肯實驗室(86 公里)的終端做計算。(3)該架構實現了 99% 的圖像識別準確度。通過采用自制的光電積分器,乘法器的每次乘法運算低于一個光子數。
圖|MIT 光學 AI 團隊成員(來源:作者)
近日,相關論文以《在互聯網邊緣的單域光子深度學習》(Delocalized photonic deep learning on the internet"s edge)為題發在 Science 上 [1]。
亞歷克斯·斯拉德斯是第一作者兼共同通訊,瑞安·哈默利和 MIT 德克·英格倫(Dirk Englund)教授擔任共同通訊作者,陳在俊為共同作者。
圖 | 相關論文(來源:Science)
本次課題始于 2019 年。陳在俊說:“Netcast 是針對邊緣運算提出的光學解決方法,它能提供實時運算并減少能量負荷,可被用于邊緣運算的各個場景,包括智能傳感、蜂窩網絡通信、航空航天、智能家居等。實驗過程中有幾個標志性的 milestones。”
第一步,通過采用硅光芯片實現了高精確率的 16 波長的光學數據傳輸、以及浮點數值乘法器,該計算精度在模擬計算里相對較高,可以滿足幾乎所有 AI 算法的需求。
第二步,他們把智能網絡通過光纖進行長距離(86 千米)傳輸到林肯實驗室,并保持同樣的計算精度。第三步,該團隊采用單光子計數器,在實驗里實現了平均低于一個光子數的乘法器。
另據悉,該項目得到進一步資助,目前 MIT Englund 組和南加州大學陳在俊課題組正合作研發下一代高度集成的邊緣計算芯片。
參考資料:
1.Sludds, A., Bandyopadhyay, S., Chen, Z., Zhong, Z., Cochrane, J., Bernstein, L., ... & Englund, D. (2022). Delocalized photonic deep learning on the internet』s edge.Science, 378(6617), 270-276.
責任編輯:Rex_15