在面談會中討論生成式AI,與會者們從擔憂到驚奇可謂反應不一。而風險投資者——特別是像我這樣在公司始創之初就與創始人合作的風險投資者——總會強調我們正處于技術生命周期的“起始階段”。但隨著過去一年來AI技術的飛速發展,從去年11月ChatGPT的推出到多模態模型的亮相,這個起始階段似乎即將過去。其中蘊藏的可能性既令人興奮、又讓人隱隱感到不安,特別是面對種種不確定性和尚未實現的目標。
如今,最流行的生成式AI應用大多依賴于開放式對話框,但這樣的聊天式交互幾乎無法提示底層系統到底有哪些局限、又具備怎樣的潛能空間。用戶需要自行表達意圖、記住所有相關上下文,并評估AI給出的答案。但套用德國著名工業設計師Dieter Rams的話說,好的設計應該揭示出產品的正確用途,如同手指可以輕易滑進手套一樣。通過采取以人為本的方法,設計師們可以勾勒出直觀的操作界面、增強可用性、培養信任,并允許用戶有意識地瀏覽模型那龐大的內部概念,而不再像現在這樣漫無目的地徘徊摸索。
借助生成式AI,計算機獲得了一組前所未有的能力:理解和生成語言、代碼、圖像及聲音;學習和表達知識;甚至是進行邏輯推理。這些能力共同成為一組創新基石,并有望隨時間推移而讓一切變得更加高效。但是,當談到將AI融入我們的生活和職業追求時,這些都只能算是一個個“構建塊”,還遠稱不上實際成型的構造成品。要想充分利用AI的力量,并確保其與我們的價值觀和追求目標保持一致,關鍵就是將精心策劃的設計和產品思維引入其中。
喬布斯曾經將計算機比喻成“思維自行車”:一種能夠增強和擴展人類智力的工具。生成式AI則把這輛自行車變成了超音速噴氣式飛機。通過加速模仿那些曾經被視為只有人類才能掌握的復雜創造力,最新一波AI模型正迫使我們重新思考自己與計算機之間的本質關系。換句話說,現在的重要問題已經不再是“AI能不能幫我補全這句對話?”,而是“我要怎樣才能與這種新興智能開展合作,讓它書寫、閱讀、聆聽、表達,并且越來越理解我的想法?”
為了解答這個問題,Designer Fund在舊金山組織了兩場爐邊談話,匯聚到來自AI和設計領域的50多位創始人和發明者。第一場的主題是Figma產品設計副總裁Noah Levin對話Designer Fund聯合創始人Enrique Allen;第二場則是我自己與Databricks產品管理副總裁Nadim Hossain之間的討論。本次活動共聚焦于四大核心議題,下面我們就來一一揭曉。
1.降低門檻的同時,提升天花板
以Midjourney、DALL-E 3和GPT-4為代表的各類生成式AI工具已經引發了不少設計師的思考:“這項技術對我的職業生涯意味著什么?”為了結合背景展開討論,Noah帶來一個有趣的比喻。一方面,AI降低了準入門檻,讓非專家們也能輕松參與到設計中來。通過簡單的提示詞,任何人都可以把自己的靈感轉化為可供團隊重復使用的視覺原型。雖然還遠稱不上完美,但這些AI模型解決了最困難的起步工作,成功破解了普通人在創作過程中的頭號障礙。
與此同時,AI也拉高了天花板、也就是創作上限,拓展了專家們的實現范圍。通過自動執行單調、重復的任務(例如移動框體、調整角半徑、去除背景等),它能讓專業人員騰出時間來應對更高階的挑戰,例如設定愿景和戰略、構思系統與框架,以及打造更完善的端到端體驗。通過將設計師的注意力從狹隘的執行轉移至更宏觀的概念建立,AI能夠幫助從業者們將工作提升到以人為本設計方案的水平。而這正是設計創作的真正核心所在,也是許多人被吸引到行業中來的首要原因。
2.從元素到模式
設計師們經常關系孤立的元素,例如按鈕、文本字段和下拉菜單,因為這些才是他們在工作當中所能操作的實際元素。但相比之下,模式才是用戶在產品和服務當中所經歷的完整旅程,而且需要考慮到各個步驟之間的聯系和轉換。導航系統、搜索交互和新手教程都是很好的例子:每個系統都需要把這些離散的元素組成成直觀的模式,并努力與用戶的意圖、需求和目標保持一致。
AI有助于順利過渡至以用戶為核心的全面設計方法。設想一下,當我們擁有一套由現有設計系統訓練而成的AI模型時,設計師就能在概念、模式等層面描述自己的想法,之后由模型處理元素組合等繁瑣的具體工作。這是AI真正實現設計大眾化與水平提升的典型例子,有望改變設計師的職能定位和設計工作的實現過程。
3.超越文本框
聊天界面為我們與AI之間的交互提供了一個實用的入口。它能夠實現類似于日常對話般的輕松和即時特性,同時可以快速解決模型中經常出現的錯誤。在大語言模型(LLM)上構建會話用戶界面也很簡單:只需擴展模型的內置文本補全界面即可。
然而,雖然聊天允許快速、自由的交互形式,但直接提供一個空白的文本框還是會令不少用戶感到手足無措。首先,它沒有提供有效的人機交互功能選項,因此用戶往往很難理解自己要如何表達意圖、并確定怎樣更好地引導模型生成所需的輸出。更重要的是,提示詞只能以間接、不透明的方式影響模型。這就類似于操作一臺帶有大量二進制“開關”的復雜科幻機器,整個使用感受與試錯無異。相反,真正影響模型響應的關鍵元素(例如權重、激活和溫度)對用戶是完全隱藏的。
早期的軟件界面更傾向于用最直接的方式呈現新的計算功能。但隨著時間推移,界面設計開始將功能包裹起來,只強調更好地與人類思維和導航空間產生共鳴。例如,第一臺個人計算機就通過命令行界面把微服務器和內存的底層設計直接擺在用戶面前;但在后續的發展當中,Windows和MacOS帶來了更多用戶友好的抽象元素,用桌面、文件夾和垃圾桶等力量真正讓機器為人類習慣服務。
雖然文本框相較于當初的打孔卡已經是個巨大的進步,但在現代圖形用戶的眼中其仍然是類似于命令行的原始存在。命令行倒是非常適合技術愛好者和早期采用者,但對普通公眾來說則不然。隨著AI技術的發展,特別是向著多模態的發展,我們無疑需要更直觀、更多維的界面設計。與之相應,目前這種跟大模型直接對話的方式看似簡單,但實際上將更多成為一種負擔。
未來的AI界面將以我們目前還無法想象的方式與人類協作。聊天框雖然也是獲取信息的門戶,但卻并不能幫助我們思考。我們可以設想這樣一種界面,它能引導用戶穿過模型的潛在空間,突出不同概念之間的某些隱含關聯,并積極參與構思而不只是簡單執行命令。此外,界面中還將提供調節滑塊、儀表板和過濾器等工具,借此增加額外的細微差別,允許用戶訪問并操控可影響模型輸出的參數。
隨著AI功能變得愈發流暢,相信未來會給普通用戶帶來更多實用性和娛樂性的體驗。在最理想的產品體驗中,AI將能夠全面實現無縫集成,甚至徹底消除“我們正在使用AI”的感覺。
4.解決AI的“最后一英里”問題
盡管生成式AI模型的能力令人印象深刻,但對于大多數現實應用來說,其可靠性還遠遠無法滿足需求。這種差距,往往集中體現在廠商公布演示版本時的驚艷、與實際部署時的“最后一英里”問題之間。正如自動駕駛汽車經常會在繁忙的街道上出錯一樣,AI模型也面臨著不一致、偏見和輸出幻覺等傾向。在創作環境中,這些功能也許無傷大雅,甚至頗受歡迎。但在商業、金融、醫學和其他高風險用例當中,任何低于99.9%的實際準確率都將使模型失去實用意義。
人類-AI系統的創新設計也許有助于管理這最后一英里的風險。而隨著技術的不斷成熟,提示詞確認(即要求用戶驗證所生成的內容是否準確)及不確定性評估(由模型給出在特定輸出中的置信度)將共同迎來人工監督的加持。另外,可解釋性功能也將進一步提高AI“黑箱”的內部可見性:例如,使用熱圖可視化來判斷哪些輸入對于模型的輸出影響最大,包括對外部來源的引用,并顯示模型還想到了哪些替代答案。這樣,用戶就能在界面中調整提示詞和參數,并實時觀察效果以進一步提高模型工作流程的透明度。
諸如此類的設計元素將共同作用,優化“信任周期”——即用戶在充分信任、愿意依靠AI系統來完成關鍵性復雜任務的累積時長。
邊行動,邊完善
從平面印刷到3D打印,設計始終與技術保持著同步發展。與之前的突破一樣,AI不會取代設計師;相反,它不僅將深刻擴展并重塑我們的設計內容,更會影響到由誰設計、如何設計等底層邏輯。為了實現這個美好的未來,我們必須針對人類-AI系統做出更多前所未有的創新探索。
關于大型企業和初創公司能否從當前的AI浪潮中獲得助益,業界已經進行過大量討論。大型企業的核心優勢在于多年積累的數據、業務分布以及雄厚的資金儲備,而初創公司則可以憑借速度、專注度和更輕的遺留技術債打造出顛覆性的AI原生產品。
拋開種種負面因素不談,我給各位胸懷抱負的AI初創者們的建議非常簡單:放手去干。任何預先思考和規劃,都無法像真正的原型設計那樣能夠揭露問題、帶來啟發。誰能以更快的速度交付和迭代實際方案,誰就能在新時代的競爭中勝出。正如我經常提到的,正確的路徑應該是“邊行動,邊完善”。首先提出正確的問題,然后優先回答那些最困難的部分。未來永遠由行動者締造,而非源自所謂精打細算下的“萬無一失”。