從數據可用性和安全性到大型語言模型和選擇和監控,企業采用生成式人工智能意味著需要重新審視自己的云架構。
所以,很多企業正在重新構建云架構,同時也在開發生成式人工智能系統。那么,這些企業需要做些什么改變?新興的最佳實踐是什么?行業專家表示,在過去的20年里,特別是在過去的兩年,他幫助企業建立了一些這樣的平臺,以下是他為企業提出的一些建議:
理解自己的用例
企業坱要明確定義云架構中生成式人工智能的目的和目標。如果看到一些錯誤反復出現,那就是他們沒有理解業務系統中生成人工智能的含義。企業需要了解其目標是什么,無論是內容生成、推薦系統還是其他應用程序。
這意味著企業高管需要就制定的目標達成共識,并且明確如何實現目標,最重要的是,如何定義成功。這并非只有生成式人工智能才會出現。而這是在每一次遷移和在云中構建的新系統獲得成功的一步。
很多企業在云平臺中開發的生成式人工智能項目都失敗了,因為他們沒有很好地理解業務用例。雖然企業開發的產品很酷,但不會給其業務帶來任何價值。那么這種方法就會行不通。
數據來源和質量是關鍵
識別生成式人工智能模型訓練和推理需要有效的數據來源,必須是可訪問的、高質量的和精心管理的數據。企業還必須確保云計算存儲解決方案的可用性和兼容性。
生成式人工智能系統是高度以數據為中心的,可以稱之為數據導向系統。數據是驅動生成式人工智能系統產生結果的燃料。然而,數據質量仍然是“垃圾進,垃圾出”。
因此,將數據可訪問性作為云架構的主要驅動因素是有幫助的。企業需要將大多數相關數據作為訓練數據訪問,通常將其保留在其存在的位置,而不是將其遷移到單一的物理實體。否則,最終會得到多余的數據,沒有單一的真相來源。考慮在將數據輸入人工智能模型之前,對數據進行預處理和清理的高效數據管道。這確保了數據質量和模型性能。
使用生成式人工智能的云架構80%獲得了成功。然而,這是最容易被忽視的因素,因為云架構師更關注生成式人工智能系統的處理,而不是為這些系統提供高質量的數據,實際上,數據就是一切。
資料保護及隱私
正如數據至關重要一樣,數據的安全性和隱私性也很重要。生成式人工智能處理可以將看似無意義的數據轉化為可以暴露敏感信息的數據。
企業需要實施穩健的數據安全措施、加密和訪問控制,以保護生成人工智能使用的敏感數據和生成人工智能可能產生的新數據。企業需要遵守相關的數據隱私法規。這并不意味著在企業的架構上安裝一些安全系統作為最后保障,而是在每個步驟中都必須將安全性應用到系統中。
可擴展性和推理資源
企業需要規劃可擴展的云資源,以適應不同的工作負載和數據處理需求。大多數企業都考慮自動擴展和負載平衡解決方案。而看到的一個更嚴重的錯誤是,構建可擴展性良好但成本非常高的系統。最好是平衡可擴展性和成本,這是可以做到的,但需要良好的架構和云成本的優化實踐。
另外,企業需要檢查推理資源。人們已經注意到,云計算行業會議上的許多新聞都是圍繞這個主題,而且有充分的理由。選擇合適的帶有GPU或TPU的云實例進行模型訓練和推理。而優化資源配置以實現成本效益。
考慮模型選擇
根據企業的具體用例和需求選擇示例生成式人工智能架構(通用對抗網絡和Transformers等)。考慮使用云服務進行模型訓練(例如AWSSageMaker等)并找到優化的解決方案。這也意味著理解企業可能有許多連接的模型,這將是常態。
企業需要實現一個健壯的模型部署策略,包括版本控制和容器化,以使企業的云架構中的應用程序和服務可以訪問人工智能模型。
監控和日志記錄
設置監控和記錄系統來跟蹤人工智能模型的性能、資源利用率和潛在問題是不可選擇的。建立異常警報機制以及可觀察性系統,以處理云中生成的人工智能。
此外,持續監控和優化云資源成本,因為生成式人工智能可能是資源密集型的。使用云成本管理工具和實踐,意味著讓云成本優化監控部署的所有方面——可以最小化運營成本,并提高架構效率佳。大多數架構都需要調優和持續改進。
其他的考慮因素
需要故障轉移和冗余來確保高可用性,災難恢復計劃可以在系統故障時最大限度地減少停機時間和數據丟失。必要時實現冗余。此外,定期審計和評估云基礎設施中生成式人工智能系統的安全性。處理漏洞并維護合規性。
為人工智能的道德使用建立指導方針是個好主意,尤其是在生成式人工智能系統生成內容或做出影響用戶的決策時。此外,還要解決偏見和公平問題。目前有關于人工智能和公平的訴訟,企業需要確保在做正確的事情。企業需要持續評估用戶體驗,以確保人工智能生成的內容符合用戶期望并提高參與度。
無論企業是否使用生成式人工智能系統,云架構的其他方面幾乎是相同的。關鍵是要意識到有些事情要重要得多,而且一直改進云架構。