你聽說過ENIAC計算機嗎?作為一臺重達27噸、占地1800平方英尺的龐大硬件,ENIAC在1946年開啟了計算機時代。這臺設備在規模上真正令人震驚——擁有6000個手動開關和17468個真空管,使用200千瓦的電力——作為世界上第一臺可編程的通用電子數字計算機,它改變了游戲規則。
當時ENIAC制造的轟動性新聞頭條,對于任何關注當前AI領域發展的人來說,都會感到詭異地熟悉。
1946年4月,《流行科學月刊》大聲疾呼:“借助閃電般快速的計算機處理多年來困擾人類的難題,今天的方程式可能成為明天的火箭。”
費城晚報報道稱:“賓夕法尼亞大學30噸重的電子大腦思考速度比愛因斯坦還快。”
快進到75年后的今天,控制你智能冰箱的Cortex-M4芯片的速度比ENIAC快了10000倍——僅使用90微安每兆赫茲的電流和幾英寸的空間。這是因為隨著計算技術的成熟,設備經過專門優化,變得在特定的、有限的、經濟高效的應用中更為有效和高效。
這也是AI發展的方向。
技術的專業化
就像ENIAC一樣,AI目前正在引發巨大的興奮和樂觀情緒(以及一點點焦慮)——特別是隨著GenAI在過去一年中的飛速發展。然而,如果我們想了解其長期軌跡,我們可以從計算硬件的歷史中學到很多。事實上,這是大多數技術遵循的相同路徑。事物從大、強大和集中開始,一旦發揮了作用,就開始專業化、本地化并變得更適用于高效的邊緣案例。
從大型電話交換板到智能手機,從大型發電廠到家用太陽能電池板,從廣播電視到流媒體服務,我們引入大型和昂貴的東西,然后開始一個漫長的精煉過程。AI也不例外。事實上,使AI成為可能的大型語言模型(LLM)已經如此龐大,以至于它們有變得難以管理的危險。解決方案將是AI技術的專業化、去中心化和民主化到特定的用例中——這就是我們所說的“邊緣AI”。
LLM:巨大的承諾(和迫在眉睫的挑戰)
像GPT(生成式預訓練轉換器)這樣的LLM使AI時代成為可能。這些巨型模型接受大量數據的訓練,具有前所未有的理解、生成和與人類語言互動的能力,這些模型模糊了機器與人類思維之間的界限。
LLM模型仍在不斷進化,推動著可能性的極限——這是令人難以置信的。但這并不是一張空白支票。所需的大量數據量和處理這些數據所需的計算能力使得這些系統的運行成本極高,并將難以無限擴展。LLM對數據和計算能力的需求已經變得極其強烈——它們所需的成本和能源消耗很高,很快就會超過我們維持它們的資源。
按照我們當前的速度,LLM很快就會遇到一系列內在的限制:
可用于訓練的高質量數據的可用性。
為如此龐大的模型供電的環境影響。
不斷擴展的財務可行性。
維護如此大的實體的安全性。
鑒于AI采納和擴展的驚人速度,這一轉折點并不遙遠。主機用了75年時間可能成為AI幾個月的事情,因為局限性觸發了向更高效、去中心化、易于獲取的AI子集轉變的需求:小眾邊緣AI模型。
邊緣AI的興起
邊緣AI的興起已經在進行中,我們看到AI在更小、更專業的模型中部署,特別是在物聯網中,這種AI方法將處理任務從集中式數據中心轉移到網絡的“邊緣”,更接近于數據實際生成和使用的地方。它包括一些你可能聽說過的術語:
小型語言模型:這些是理解和生成類似人類文本的AI版本,但大小較小。可以將它們視為“迷你大腦”。它們較小使得使用起來更快且成本更低,特別是在不是很強大的設備上,如你的智能手機或田間設備的芯片。它們對自己的責任領域非常了解,但可能不像它們更大的LLM兄弟姐妹那樣知識淵博或有創造力。這些模型得益于高度并行GPU的最新進展——支持具有通用機器學習(ML)的更成熟的神經網絡。
邊緣AI:這是一種說法,意思是AI在行動發生的地方運行,如你的手機、街上的攝像頭或車內,而不是遠在數據中心的大型計算機上。 “邊緣”指的是網絡的外邊緣,靠近數據創建和使用的地方。這使得處理速度更快,因為數據不必走遠路,同時也可以保護你的數據更加私密,因為不總是需要通過互聯網發送。
專家混合:在人工智能中,“專家混合”就像一個專家團隊,每個成員都擅長特定的任務。這是一個由許多較小的AI單元(專家)組成的系統,每個單元都專注于不同類型的工作或知識領域。面對一個任務時,系統會決定哪一個專家或哪些專家的組合最適合處理這個任務。通過這種方式,AI可以非常高效地處理各種任務,因為它總是使用最適合該任務的工具。
這些技術共同使得AI更加多才多藝和高效,易于訓練、運行和部署——能夠在許多不同的地方和方式中工作,從我們家中和口袋里的微型計算機到需要專家知識的專業任務。我們之前提到的智能冰箱就是一個例子,交通燈陣列是另一個例子——自動駕駛汽車、糖尿病管理、智能電網、面部識別,這個列表和人類的創造力一樣無窮無盡。
邊緣AI的風險和回報
與任何技術一樣,邊緣AI帶來了固有的風險和回報。讓我們快速瀏覽一下這個列表。
邊緣AI的好處
增加創新:通過消除開發瓶頸,邊緣AI為創造性的、利基的應用和微應用的激增打開了大門——任何有意愿和能力創建應用的人都可以利用這一點。
減少資源和增加容量:邊緣AI減少了延遲并且具有較低的處理需求,這大大降低了成本和消耗。
增強的隱私和安全性:本地數據處理意味著敏感信息不需要通過互聯網傳送,從而減少了數據泄露的風險。
可定制和獨立:邊緣AI允許使用本地、特定數據訓練的模型,提供更準確、更相關的解決方案,這些模型可以獨立且可靠地運行。
邊緣AI的挑戰
質量控制:模型的增多增加了對嚴格的質量和驗證過程的需求,并可能在質量控制環節產生新的瓶頸。
安全與治理:更多運行AI應用的設備確實擴大了安全漏洞的可能性,更多的創造者也可能使這些過程過載,并開啟一個“狂野西部”環境。
范圍有限和可擴展性:邊緣AI模型設計用于特定任務,這可能限制了它們在不同場景中的擴展或泛化能力。
需要監督:需要領導者對所有開發活動進行監督,幫助創造者保持在創意的安全范圍內。這包括控制冗余的潛力,因為解決方案可能會在真空中增殖和復制。這里的解決方案將是可以幫助跟蹤、開發并從概念到開發階段指導創意的軟件。
從這份列表中可以看出,我們有一個重新設想AI應用開發和管理方式的絕佳機會。然而,盡管節省了成本并帶來了創新紅利,許多首席信息官和合規負責人可能還是會急于確保新的邊緣AI技術是兼容的、受控的和經過驗證的。將邊緣AI作為一個強大的工具交到普通人手中,可訪問性可能是一把雙刃劍。
展望未來
我們正處在AI發展的新時代邊緣,向邊緣AI的轉移可能會是一次范式變革,這種變革與從那些笨重的舊式主機到今天的個人計算機的巨大飛躍相呼應。這種轉變承諾使AI更加可訪問、高效并針對特定需求量身定制,從而以我們還未完全想象到的方式推動創新。
在這個未來,AI的潛力是無限的,僅受我們的想象力和我們對負責任地指導其發展的承諾的限制。