隨著元宇宙概念的火爆也一同帶動了數字人市場的快速升溫,據計算全球平均每天都會誕生一個數字人。數字人正成為一股潮流,涌入人們的日常生活——會“捉妖”的虛擬美妝達人柳夜熙,抖音出道三天點贊即超百萬,一夜之間成為國內虛擬偶像界的“頂流”;在江蘇衛視跨年演唱會上,昔日歌后鄧麗君“重返”舞臺,與歌手周深同臺對唱,交織幾代人的青春記憶;而在杭州亞運會上,數字人點燃火炬,成為開幕式的亮點。除此之外,數字人擔當起手語主播、氣象主播、公益宣傳、帶貨達人等各式角色,代替真人提供服務支持……
一、什么是AI數字人?
數字人的核心是“人”,本質上是通過數字技術提高數字人的綜合體驗,使之帶來真人般的感受和互動。
一方面,隨著人工智能、虛擬現實、高精度渲染等技術的發展和融合,數字人的擬人化程度愈來愈高,從形象、表情、姿態、動作,再到語音、語意、語態等方方面面正在逐步逼近真人水平。例如,超寫實數字人(Metahuman)已成為當前主流,柳夜熙、“鄧麗君”等都是超寫實數字人的代表,擁有高度逼真的數字化外觀形象。
另一方面,人工智能技術在數字人形象生成、動作驅動和語言交互等環節的深入應用,也將進一步提升數字人制作的自動化水平,推動數字人市場從利基走向大眾。
數字人的擬人化,以及生產制作的自動化程度反映數字人系統整體進化和發展水平,代表著數字技術綜合運用能力和成熟度體現。
根據“擬人化”和“自動化”兩個維度,我們可以將數字人分成 L1-L5 五個等級,如下圖所示。
其中,我們將 L4 和 L5 等級的數字人統稱為“AI 數字人”。Ta 們不僅具備高度的擬人化呈現,在形象、動作和智力層面都更接近于真人水平,能夠聽懂、看懂、有記憶、自學習,與人進行自然交互;同時,在制作流程中也融合了大量的人工智能算法技術來提升數字人的生產效率,降低數字人的制作成本。普遍認為,只有達到 L4 級別及以上的數字人才能真正的走入千行百業,在消費和產業領域大放異彩。
二、AI數字人的三大特征
多模態交互、深度學習和 AIGC是 AI 數字人的三大特征。
首先,在應用層面,多模態交互是 AI 數字人的“核心力”。
我們認為,具備足夠自然和擬真的多模態交互能力,是數字人在更廣泛的應用場景中逐步替代真人角色的關鍵。所謂“多模態交互”,即是將深度學習神經網絡和計算機圖形學相結合,充分模擬人與人之間自然真實的交互方式,實現“聽得懂,看得見,說得出”的人機交互效果。
擁有多模態交互能力的 AI 數字人,不僅能夠呈現傳統語音對話無法展現的多媒體信息,通過結合計算機視覺技術,還能完成身份識別、手勢識別、情感識別等多項交互任務,讓交互過程更加豐富且高效。與此同時,可
視化的寫實形象也賦予了 AI 數字人獨特的情感溫度,有助于建立人性化的情感紐帶。
其次,在價值層面,深度學習是 AI 數字人的“創造力”。
每一個 AI 數字人背后都有一個“智慧的大腦”,可以基于語音語義理解等技術,結合不同領域的知識庫和海量數據訓練,進行深度學習和迭代升級,讓自己變得越來越“聰明”,越來越專業,從而能夠快速適應瞬息萬變的市場變化和細分化的場景需求,不斷打破即有的應用邊界,為用戶持續創造新價值和新體驗。
第三,在制作層面,AIGC 是 AI 數字人的“生產力”。
高制作成本和長制作周期掣肘數字人產業規模化發展。傳統數字人生產過程中,從人物建模到動畫設計和制作等各個環節幾乎都依賴人工“雕琢”而成。譬如,以人物建模為例,傳統建模環節大概要花費數月時間。此外,要讓模型動起來,前面的準備工作(蒙皮、BlendShape 等)以及后續的動畫制作及優化環節也需要花費數月時間,無論是時間成本還是人工成本都是一個相對較大的投入。
AIGC 重塑生產流程,在人物模型的重建、動畫準備和制作等各個環節輔助數字人自動化生成,大幅加速數字人生產,降低制作門檻和成本投入,是 AI 數字人生產力之本。以人物建模環節為例,例如,商湯科技為軟銀大會打造的軟銀 COO 今井康之的 AI 數字人形象,即是基于少量照片的面部掃描,結合 AI 算法快速生成數字人高精度 3D 模型,將傳統以月計算的制作周期縮短至數天內完成。
三、AI數字人的三大應用方向
根據使用目的和底層邏輯不同,AI 數字人可大致分成三大應用方向。
方向一:主要以創建 IP 影響力或打造粉絲經濟為目的的 AI 數字人應用,包括虛擬偶像、虛擬 KOL、虛擬演員、虛擬主播等。
基于“IP 孵化 + 內容運營”,賦予 Ta 們獨特的人設和人格特質,以此來吸引不同受眾群體的關注,從而形成一定規模的流量基礎和情感鏈接,再通過諸如直播帶貨、跨界品牌代言、IP 授權周邊衍生品、娛樂演藝等多種手段來實現價值閉環或進行商業化變現。
方向二:主要以替代真人服務、實現降本增效為目的的 AI 數字人應用,包括虛擬客服、虛擬前臺、虛擬導游、虛擬主持人等。
Ta 們根據各自領域所長,能夠“7×24 小時”在崗不間斷的提供服務支持,尤其針對標準化、重復性高的真人服務可以實現數字化替代,并結合業務流程自動化,幫助企業進一步提高生產效率、降低人工服務成本,為企業數字化轉型提供新路徑。
方向三:隨著人工智能、虛擬現實等相關技術的逐步成熟,通過深度學習和認知泛化,AI數字人將會全面突破應用邊界,升級成為數字世界的“超級助手”。
與前兩個應用方向不同,AI 數字人的第三大應用方向不再僅遵循真實世界的“替代”邏輯,初衷更在于滿足用戶與數字世界的連接和交互需求,實現對于數字世界的直接操作。正如《元宇宙”破壁人“:做虛實融合世界的賦能者》白皮書中所描繪的圖景一樣,“這些數字人將成為我們在數字世界的 AI 代理人”。通過與 Ta們的直接交互,可以“隨機應變”的針對用戶個性化、多樣化需求,提供全天候、全方位的人性化陪伴和智能化服務,成為人們通向虛實融合世界的超級入口。
四、AI數字人的八大應用場景
場景1:金融網店“新窗口”
商湯為寧波銀行上海分行打造的超寫實型 AI 數字人大堂經理“小寧”,以栩栩如生的客服形象為銀行客戶提供各類業務咨詢和服務辦理。
生動的形象和擬真的交互體驗,AI 數字人讓銀行客戶倍感新鮮,有效提升了客戶關注時間,不僅能為銀行創造更多業務推廣機會,在網點“智能化、無人化”的趨勢下,成為銀行服務線下客群的“新窗口”,以及提升服務效率、提高服務質量和標準的重要載體。
場景2:在線互金“新入口”
基于手機銀行在線服務問題,渤海銀行與商湯合作開發 AI 數字人“小海豚”,以生動、可愛的 3D 卡通形象,為渤海銀行的線上用戶提供全程“貼身服務”,包括自助式業務引導和辦理、金融知識的專業講解,以及理財產品的智能推薦等,為客戶創造全新的交互觸達式體驗,成為手機銀行提供在線互金服務的“新入口”。
例如,在自助業務辦理上,小海豚可以正確“理解”客戶需求,并快速定位到客戶所需辦理的業務界面,大大縮減了繁瑣的操作流程,幫助客戶高效完成業務辦理,為客戶提供了一個親切交互、快捷便利的無障礙金融體驗。
場景3:商場交互“新觸點”
廣州新塘的永旺夢樂城與商湯聯合打造了超寫實型 AI 數字人“小糖”,主要承擔商場內客服咨詢、導航導購等多項服務工作。
例如,作為虛擬客服人員,“小糖”可以隨時隨地為顧客提供準確、快速的店鋪位置導覽、停車路線指引、積分兌換等問詢服務。當遇到“超綱”問題時,后臺管理人員可以及時進行遠程接管。作為虛擬導購員,“小糖”通過與顧客的自然交互和意圖理解,判斷顧客的實地需求,將新品上線、新店開業、優惠活動等商場或店鋪信息更有效的向顧客進行精準推薦,有助于營銷轉化效果的提升。
場景4:文博講解“新體驗”
中共一大紀念館與商湯合作,于 2021 年建黨 100 周年之際在展館內推出 001 號 AI 數字人講解員“申小伊”。Ta 不僅能夠主動迎接和問候,還能為來自全國各地的參觀群眾和黨員干部講解中共一大黨史。
在形象設計上,“申小伊”達到了超寫實級別精度,嚴格遵循紀念館內制服標準著裝“上崗”;在講解專業性上,“申小伊”基于中共一大相關的黨史典籍建立知識庫體系進行深度學習,并通過知識泛化覆蓋上萬條黨史問題,不僅能夠熟練講解黨史內容,還能輕松解答各類黨史相關問題。
場景5:品牌營銷“新代言”
商湯基于 AIGC,僅結合幾張真人照片即快速生成超寫實 AI 數字人“大真”。Ta 不僅可以充當活動虛擬主持,與同臺真人主持一起與觀眾進行實時互動,還可以登錄直播間 24 小時不間斷直播帶貨,與用戶“面對面”進行彈幕互動,自助解答品牌相關問題。
場景6:企業前臺“新形象”
根據企業形象定制的 AI 數字人,不僅擁有符合企業文化氣質的外觀形象,還能替代真人前臺根據員工預約信息,對已預約的到訪客戶進行主動式的迎賓接待,并基于豐富的企業知識庫體系,為到訪客戶進行企業介紹、發展歷程的講解,并能與訪客進行實時對話,親切耐心地解答企業相關問詢。
場景7:指揮車艙“新助手”
車機大屏已成為新一代智能終端,承載著載具內人機交互、調用軟件服務等功能,也影響著智慧車艙的交互體驗。將車機系統功能進行集成,并通過生動的 AI 數字人形象作為人機交互的主要媒介,相對傳統語音或觸屏等方式,為車主帶來更具個性化、人格化的行車體驗。
場景8:虛擬活動“新服務”
在沉浸式活動 / 會議系統中,AI 數字人可以作為活動隨行助手,全程“陪伴”參會者左右,隨時隨地提供咨詢服務,回答活動相關問題,并提供活動接待、講解、導覽、記錄、推介等各類服務和支持。一方面減少活動主辦方人工客服投入,提升用戶體驗;另一方面可以通過對 AI 數字人交互數據的收集和分析,幫助主辦方掌握參會人員實際需求,更好的實現活動效果的轉化,達到主辦活動的目的。