科技日報記者 張夢然
據最新一期《自然·光子學》雜志報道,美國賓夕法尼亞大學團隊開發出首款能夠利用光進行非線性神經網絡訓練的可編程芯片。這項突破有望大幅加快人工智能(AI)的訓練速度,同時降低能源消耗,并為研制全光驅動計算機奠定基礎。
在此之前,雖然已有研究團隊開發出處理線性數學運算的光學驅動芯片,但僅依靠光學方法表示非線性函數的技術難題一直未被攻克。而非線性函數對于深度神經網絡訓練至關重要,沒有它,光子芯片就無法完成深度學習或執行復雜的智能任務。
新進展依賴于一種對光敏感的特殊半導體材料。當攜帶輸入數據的“信號”光穿過這種材料時,另一束“泵浦”光從上方照射下來,調節材料的響應特性。通過調整泵浦光的形狀和強度,團隊可以根據信號光的強度及材料的反應來控制信號光的吸收、傳輸或放大方式,從而對芯片進行編程以執行不同的非線性功能。
值得注意的是,這項研究并未改變芯片的基礎結構,而是利用光在材料內部形成的圖案來重塑光線穿越的方式。這造就了一個可以根據泵浦模式表達多種數學函數的可重構系統,使其具有實時學習能力,能根據輸出反饋調整自身行為。
為了驗證該芯片的能力,團隊用其解決了多項基準AI問題。在簡單的非線性決策邊界任務中,實現了超過97%的準確率;在著名的鳶尾花數據集問題上,達到了96%以上的準確率。這表明,與傳統數字神經網絡相比,光子芯片不僅性能相當,甚至更優,而且能耗更低,因為它們減少了對耗電元件的依賴。
此外,實驗還顯示,只需4個非線性的光學連接就能達到傳統模型中20個固定非線性激活函數線性電子連接的效果,展示了該技術的巨大潛力。隨著架構的進一步擴展,效率將更加顯著。
不同于以往制造后固定的光子系統,這款新芯片提供了一個空白的平臺,可通過泵浦光的作用如同畫筆般繪制出可編程指令,是現場可編程光子計算機概念的一次實際證明,標志著向光速訓練AI邁進的重要一步。
總編輯圈點:
在這一研究的基礎上,未來工程師們還可以進一步探索如何實現更為復雜的運算,如指數或逆函數,從而為解決更大規模的任務鋪路。值得一提的是,由于采用低能耗光學組件替代了發熱的電子設備,該平臺還能顯著減少AI數據中心的能量消耗,徹底改變機器學習領域的經濟效益。