隨著生成式人工智能(GenAI)日益普及,很多組織的CIO開始優化他們的IT系統,以充分挖掘AI技術的潛力。例如,美國電信巨頭AT&T部署了3000多個AI機器人實施重復性任務,達美航空公司(Delta Airlines)使用AI IT運營管理平臺來減少服務中斷對客戶的影響。
然而,隨著IT環境的更新,也需要對IT基礎設施進行更新和改造。數據中心的發展速度難以跟上AI為組織帶來的好處。其中許多組織針對AI進行了優化,以實現運營自動化、改善資源管理、增強網絡安全并提供更好的服務。
盡管如此,數據中心仍無法提供大規模開發和實施AI應用所需的資源,一個新的生態系統應運而生,那就是AI工廠。
AI工廠是做什么的?
AI工廠或AI數據中心是為滿足AI的特定需求而設計的設施,為部署復雜的AI應用程序和模型提供基礎設施和資源。
AI工廠的目的類似于數據中心和生產工廠。就像工廠生產產品一樣,AI工廠生產“智能”,然后采用智能運行AI模型和其他資產以及IT系統。
Artefact咨詢總監Nina Abide表示,“AI工廠通過標準化流程簡化了AI模型的生產,實現了跨行業的高效擴展。它們涵蓋了從數據準備到模型部署的各個階段,并利用自動化來提高速度和效率。”
AI工廠的一個固有特征是生成智能。AI工廠處理大量數據,以產生智能并更新其運營的系統,或者創建包括文本、圖像、視頻或音頻內容在內的輸出。AI工廠產生的智能也可以作為命令來控制機器人或超級計算機等系統。
2024年3月,英偉達CEO黃仁勛在GTC大會上發表演講時介紹了AI工廠的藍圖,他將其定義為“將原材料轉化為有價值的新產品的地方”。他將AI工廠稱之為“新工業革命的家園”。
他說,“AI工廠輸入的原材料是數據和電力,生產的產品是數據令牌(tokens)。令牌是不可見的,可以發送到世界各地,它是非常有價值的。”
企業構建AI工廠的方法
作為專門建造的設施,AI工廠允許在IT環境中全面實施AI。這些量身定制的數據中心擁有將GenAI部署到IT運營中所必需的硬件和軟件,從而提高效率、可擴展性和創新性。
Arcadis全球制造總監Martijn Karrenbeld說,“AI工廠可以通過流程自動化和工作流程優化來提高效率。其中一個真正的好處是能夠通過簡化制造過程來降低運營成本。這為未來的擴大業務規模提供了更多的組織靈活性和可擴展性,從而加快了上市速度。”
AI工廠是如何運作的?
AI工廠背后的理念是訓練AI模型來產生智能。為此,相關數據被輸入到計算系統的模型中,這樣它就可以分析數據并做出預測。
如果這些預測是準確的,AI模型就會得到訓練,并可以通過AI推理過程開始執行所需的任務。
與傳統數據中心相比,AI工廠需要更多的電力、能源和冷卻解決方案。事實上,由于這些設施通常是為處理大量數據和開發或培訓新系統而設計的,因此需要采用高性能服務器機架、專用硬件加速器、大型存儲系統和網絡基礎設施。
為了能夠處理相關的工作負載,AI工廠采用專門的IT硬件建造,其中包括定制設計的AI芯片和圖形處理單元(GPU)。