在EmTech MIT,專家們探討了在企業中采用生成式AI的挑戰和好處,包括開源生成式AI模型的優缺點。
本周早些時候,在麻省理工學院技術評論(MIT Technology Review)主辦的EmTech MIT會議上,人工智能在演講中占有重要地位。隨著實驗生成式人工智能的壓力越來越大,組織正面臨著一系列挑戰,從特定領域的準確性等實際問題到安全和隱私風險。
生成式人工智能已經在企業環境中找到了多樣化的應用。IBM Infrastructure首席技術官兼創新總經理Hillery Hunter在她的演講“生成式AI世界中的數據影響”中指出,早期用例包括供應鏈、客戶支持、合同和法律。“企業開始明白,人工智能將以多種不同的方式打擊他們,”亨特說。
隨著組織探索生成式AI的廣泛用例,人們對開源選項的興趣也在增加。雖然從長遠來看,對流行的大型語言模型(如GPT-4)的專有許可訪問可能會受到限制且成本高昂,但開源替代方案通常更便宜且更可定制。
因此,利用開源選項可以使公司減少對供應商的依賴,并構建針對特定任務和工作流程量身定制的專用內部工具。但是,負責任地將開源生成式人工智能集成到企業中,需要嚴格評估安全、道德和技術能力方面的風險。
評估開源與專有生成式 AI
博思艾倫漢密爾頓生成式人工智能總監艾莉森·史密斯(Alison Smith)在她的演講“開源生成式人工智能”中概述了開源生成式人工智能的機遇和風險。
Smith 強調了開源社區與 AI 突破之間的歷史聯系,機器學習的重大進步與 TensorFlow 和 PyTorch 等開源計劃有關。然而,在生成式人工智能時代,迄今為止性能最高的 LLM 已被關閉。
但生成式人工智能是一個快速發展的領域,未來平衡可能會發生變化,特別是對于利基應用。開源的低成本、靈活性和透明度使其對希望微調利基應用程序模型和審查源代碼是否存在安全漏洞的組織具有吸引力。
“關于開源與封閉和專有的爭論一直存在,”史密斯在接受TechTarget編輯部采訪時說。“我認為,由于這些生成式人工智能模型的強大功能,這一點只會被放大。
盡管像ChatGPT這樣面向消費者的生成模型仍然大多是專有的,但史密斯認為,開源在更狹窄的應用中越來越受歡迎,它可以提供專業化、透明度和成本優勢。“真的很難圍繞開源做出這些籠統的聲明,或者根本不做,”她說。
相反,決定是使用專有還是開源生成式人工智能,可能涉及檢查特定用例的細節。史密斯提到,生態系統可能會出現一個針對特定任務量身定制的小型開源模型,而 ChatGPT 等消費者應用程序在很大程度上仍然是專有的。
史密斯說:“我不認為我們期望在這種非常廣泛的生成式人工智能層面上看到一個與另一個。“ChatGPT 太棒了,因為你可以隨心所欲地問它,做各種瘋狂的任務。但是,對于特定的企業級用例,您真的需要它嗎?可能不是。
開發開源生成式人工智能的難點
盡管有其好處,但構建開源生成式人工智能可能會被證明是具有挑戰性的。與其他類型的軟件甚至機器學習的其他領域相比,生成式人工智能需要更廣泛的基礎設施和數據資源,以及構建和操作模型的專業人才。
這些因素都為構建有效的開源生成式人工智能帶來了潛在的障礙。即使對于資金雄厚的企業來說,訓練有用的高性能模型所需的財務和計算資源也具有挑戰性,更不用說在開源環境中工作的模型開發人員了。這些資金挑戰雖然在人工智能開發中加劇,但反映了開源領域長期存在的普遍問題。
“即使使用開源軟件,無論框架或庫多么流行 - 即使是Python作為編程語言 - 對于所有維護它的人來說,這確實是一項吃力不討好的工作,”史密斯說。“而且很難商業化。”
史密斯提到,免費增值模式提供對基本功能的免費訪問,同時對某些功能或服務(如安全或咨詢)收費,這是一種潛在的融資方式。其他常見的模式包括眾籌、非營利組織的支持和大型科技公司的資助。然而,后者可能會引發圍繞影響開源模型和軟件開發而引發的棘手問題。
“開源社區的偉大之處在于,貢獻來自一個龐大的、多樣化的人群,”史密斯說。“每當你集中資金時,你可能會夸大集中資金來源的激勵措施。
預測和管理企業生成式 AI 風險
在企業中有效地部署生成式人工智能,特別是在通過微調領域和組織特定數據來充分利用該技術的情況下,需要仔細平衡風險管理與創新。
盡管許多組織都感受到了快速實施生成式 AI 計劃的壓力,但部署強大的概率模型需要深思熟慮,尤其是對于敏感應用程序。例如,處理與醫療保健或國家安全有關的信息的模型比客戶服務聊天機器人涉及更大的風險。
對于生成式人工智能的企業應用,如內部問答系統,史密斯強調需要對用戶訪問和權限進行控制。正如員工只能訪問其組織文檔管理系統中的某些文件夾一樣,內部 LLM 應僅向有權接收信息的用戶提供信息。實施適當的訪問控制可以確保用戶只獲得適合其角色的響應。
“首先列舉可能的風險總是很重要的,”史密斯說。“[首先]你從它的嚴重性開始,無論你試圖完成什么行動,其次,它有多廣泛 - 有多少人會受到影響。
鑒于預測所有風險不太可能實現,因此仔細規劃和制定事件響應策略至關重要。“對我來說,最好的做法是首先從安全態勢開始,”史密斯說,然后繼續討論有效性和用戶體驗問題。
Hunter 指出,IBM 的研究發現,提前規劃可以顯著降低與網絡安全事件相關的成本。在 IBM 2023年版的年度“數據泄露成本報告”中,與低級別同行相比,具有高水平事件響應規劃和測試的組織節省了近 150 萬美元。
“我認為我們傾向于 - 特別是當我們對新技術感到興奮時 - 被這些好處所震撼,”史密斯說。“我幾乎希望我們能先就風險進行對話,你正在詳細說明......所有可能出錯的事情,知道還有更多的事情。然后,基于這些好處,這有意義嗎?