最近,人工智能公司Scale AI發布 《2024年人工智能準備度報告》。
該系列報告已經是連續第三年進行發布,本次報告調查采訪了1800 多名在企業中構建或應用人工智能解決方案的人工智能從業人員,以獲得相關的見解及結論。
旨在通過企業的AI應用現狀,為大模型/人工智能的開發與構建、利用現有的基礎模型的應用及測試和評估提供參考與建議。
劃重點,該報告發現:
60%的受訪者正在嘗試使用生成性AI模型或計劃在未來一年內這樣做,但只有21%的公司已經將這些模型投入生產。
72%的公司計劃在今年增加他們的人工智能投資。
89%采用人工智能的公司從開發新產品或服務的能力中受益。
一些受訪者提到,缺乏合適的工具和框架是阻礙人工智能項目進展的一個挑戰。
報告強調了組織需要在多個維度上優化和評估他們的人工智能準備度,包括開發模型、利用基礎模型和測試模型。
1.企業的選擇:OpenAI占“半壁江山”,LLama領跑開源
調查結果顯示,OpenAI是絕大多數企業的選擇,在前五中除了來自谷歌的Gemini排在第三位以外,其余產品均來自這家AI明星公司。
LLama2以18%的采用率位列第7,開源模型中第1。而谷歌開源的BERT、T5模型,作為NLP領域的老將,也有比較高的采用率。
綜合之前的調查數據來看,在模型的開源和閉源之間,企業的AI戰略決策、模型選擇的偏好是持續演變的。模型的開源生態會很大程度上影響企業的選擇。
今年,閉源模型的使用增長最多,有86%的組織使用這些模型,而前一年的比例是37%。這很可能是由于多種因素的結合。許多組織已經與云服務提供商簽訂了現有合同,而這些提供商又與閉源模型開發者有合作關系,這使得使用閉源模型變得更加容易。此外,許多閉源模型在開箱即用的情況下也比開源模型表現更好。
盡管如此,開源模型的使用也有所增長,從41%增加到66%。這可能是由于開源模型為微調(fine-tuning)和托管(hosting)提供的靈活性。在2024年,自己訓練模型的組織偏好變化最小,從22%升到24%。
值得注意的是,在調查進行時Claude 3, Grok, DallE 3,LLama3都沒有發布,因此沒有相關數據。尤其是性能強大到比肩 GPT-4 的 LLama3,能否給OpenAI絕對領先的地位一點震撼,我們無從得知。
2.模型的采用:定制or開箱即用?
根據調查,受訪者中65% 的選擇了開箱即用,43%選擇了微調模型,38%選擇了RAG。受訪者的多選情況,可能來自于企業多模型部署的策略。
應用人工智能的組織正在尋求通過提示工程、微調模型和檢索增強生成(RAG)使得AI更具價值。
盡管有優化基礎模型的愿望,但65%的組織使用開箱即用的模型。同時,微調可以為特定任務或數據集定制模型,顯著提高其在目標應用中的性能和準確性。RAG通過在生成過程中動態整合外部信息進一步增強了這一點,使模型能夠產生更相關且上下文豐富的輸出。
3.企業將在哪些工作中應用AI?
65%的受訪者提到了使用AI進行編程相關的需求,但考慮到 Cognition、Augment 等公司正在籌集的大額融資也就不足為奇。
緊隨其后的AI應用領域依次是,內容生成、數據分析工具、客服聊天機器人、流程自動化工具、知識庫管理、總結和報告生成、智能推薦系統。
此外,只有 4% 的企業沒有實施人工智能的計劃 。
4.企業如何評估模型性能?
對于企業來說,模型的可靠性和性能的重要程度不相上下,這些直接與企業的使用甚至是業務的收入掛鉤。比較來說,人們對于大模型的數據安全及安全性的評估優先級較低。
人工智能的焦點正從“卷”模型性能轉向實際的應用落地,可以預見的是,AI技術將在企業中變得更加易用和普及。
72%的公司計劃在本年度增加對AI的投資,驗證著市場對AI潛力的認同。盡管有人擔憂AI繁榮的猶如泡沫可能會一朝破滅,但實際情況可能恰恰相反——經過時間的洗禮,人工智能的神秘面紗將逐漸褪去,它將從前沿技術轉變為像手機和電腦一樣,成為我們日常生活中不可或缺的實用工具。