AIGC人工智能生成內容,相對更早的內容生產模式分別為專家生產內容PGC和用戶生產內容UGC。而隨著AIGC出現(xiàn),內容生產率變成指數(shù)級上升。那么AIGC發(fā)展對于普通人來說到底意味著什么?
先回顧一下時間軸,
2015年7月,谷歌推出Deepdream開創(chuàng)AI模型根據(jù)文本生成圖像的先河。
2021年1月,OpenAI發(fā)布達人DALL-E模型,讓文本生成圖像真正卷出了天際。
2022年7月,獨立實驗室Midjourney發(fā)布同名圖像生成模型。Journey設計師Jason Allen用AI生成圖片,太空歌劇院,在克羅拉多州博覽會的名聲比賽中獲得投獎,并感慨藝術意思,人類輸了,引起全球熱議。
2022年8月,stability AI的開源圖像生成模型stable diffusion。僅需一臺電腦就能運行,截至當年10月,已有超過20萬開發(fā)者下載這一系列模型引爆了AI作畫領域,標志著人工智能向藝術領域的滲透。
與此同時,2022年12月,OpenAI的大型語言生成模型ChatGPT引爆全網,能做到和人類對答如流,勝任高情商對話能進行短文、詩歌、代碼計算邏輯等不同類型的內容輸出,讓人不禁懷疑ChatGPT是否真的已經具有人力智能,僅過了短短幾個月,升級版GPT 4橫空出世,不光能實現(xiàn)圖文多模態(tài)輸入,在專業(yè)領域也表現(xiàn)出媲美人類甚至超越人類的水平。
2022年是AIGC元年,代表新一輪范式轉移的開始。AI模型在文本圖片生成方面效果令人驚喜,在視頻和3D等高復雜領域逐步探索階段,但對AI的學習速度來說,拿下這些領域也只是時間問題。
以上所有都不是突然出現(xiàn)的AIGC之所以能在22年爆發(fā),至少具備以下四項條件。
一、模型訓練技術革新:與其他行業(yè)不同,AC是開放科學、不斷創(chuàng)新在生成算法優(yōu)質模型、開源加速技術變革,其中OpenAI開源的CLIP多模態(tài)預訓練模型能同時進行自然語言理解和計算機視覺分析,這讓模型訓練可以直接利用互聯(lián)網上自帶文字描述的圖片素材,大幅降低了數(shù)據(jù)獲取門檻,也是圖像生成模型的技術基礎。
二、合成數(shù)據(jù)驅動訓練。早期模型訓練最大掣肘就是數(shù)據(jù),面臨數(shù)據(jù)標注,費時費力且準確率低,樣本數(shù)量無法覆蓋邊緣案例,稍微長期數(shù)據(jù)難以采集隱私數(shù)據(jù)面臨法律法規(guī)限制等問題。但隨著生成式AI的發(fā)展,模型產出的合成數(shù)據(jù)又反哺模型訓練過程,形成加速飛輪。可以說合成數(shù)據(jù)影響了AI的未來。
三、GPU芯片支持。我們通過網絡感受AI,但真正的模型訓練需要投入巨額資金驅動巨型服務器,這也直接使GPU芯片和服務器制造商英偉達發(fā)展成為了全球最有價值的公司。
四、產業(yè)生態(tài)逐漸成型。首先是上游預訓練模型,超過80%的人工智能研究都集中在基礎模型訓練上,這一層的門檻很高,例如語言處理模型GPT3的訓練成本粗略估算1,200萬美元。因此有能力做預訓練模型的主要為頭部科技企業(yè)和獨角獸公司。其次是以優(yōu)秀的預訓練模型為根基,開發(fā)和銷售垂直細分領域的中間模型及服務model as a service成為現(xiàn)實,這一層就比較適合初創(chuàng)公司和個人創(chuàng)業(yè)者。
你可能會問,作為普通人知道這個有什么用啊?
基于GPT模型,有人拿ChatGPT寫作業(yè),有人組合多個AI工具全自動做視頻,有人利用信息差拿AI效果圖賺錢,有人發(fā)現(xiàn)提示詞帶有學問,甚至有人拿AI違法亂紀。
總而言之,AIGC打開了新世界的大門。
反觀我國自主AI研發(fā)都是可能是龐大的人口規(guī)模,更可能產生專業(yè)人才訓練數(shù)據(jù),但劣勢是忽視AI的高昂訓練成本,讓普通企業(yè)望而卻步,很多所謂的大廠就是坐擁廣闊市場,大玩割韭菜游戲,GPU算力才是AI的本體,但從2018年開始,美國不僅限制中國進口高端芯片,還限制中國獲得生產芯片的工具。這么一盤中國AI也是任重道遠。
了解背景后,我們就來看看AIGC廣闊的應用前景。
一、設計提效。在商業(yè)領域可以批量生產設計方案,并對方案的價值進行精準預判,例如日本中視會社Plug提供package design AI只需使用者上傳素材,AI就可以一小時內自動生成上千種包裝設計,并在10秒內計算出他們的受歡迎程度。日本零食大牌卡勒比曾找他們合作,優(yōu)化后的業(yè)績比舊包裝增長了135%。
二、珍貴資料的修復,百度利用文心模型上浮春山巨土重生。騰訊利用AI助力敦煌壁畫的修復,極大提升文物保護的效率。2022年4月1日,AI技術修復的港星張國榮的演唱會,以4K高精品制讓無數(shù)人民淚目。也許不久的將來,AI就能用VR帶大家穿越上世紀初的演唱會現(xiàn)場。
三、數(shù)字孿生技術,充分利用AI模型在虛擬空間中完成真實場景的建模映射,并推演實體的生命周期。在產品設計、醫(yī)學分析、高危公眾安全、城市建設等領域運營較多。特斯拉正在構建一個巨大模型,以更安全高效的方式實現(xiàn)其自動駕駛汽車的訓練目標。
四、元宇宙的內容基礎,元宇宙中不僅有用戶,還應該存在很多類似NPC的智能體,為用戶提供交互服務。這些智能體agent就很需要AI模型生產并驅動。
五、人類生命的數(shù)字化延展。近幾年藝人頻頻爆雷塌房,導致品牌遭殃害,虛擬人充當代言人風險和效率都會可控很多。而對于生病的人,AI可以生成治療方案,甚至可以生成語音,幫助師生者開口講話。全世界第一個賽伯格彼得斯科特摩根以自己的身體作為實驗對象,用AIGC技術不斷和變動中斗爭,再激進點甚至可以進行人類的數(shù)字化改造。除了活著的人,AI具有很多學習人類的錄像、音樂資料以數(shù)字化的方式呈現(xiàn)。
當然,AIGC也有自己潛在的不足和風險。
1.安全挑戰(zhàn),包含但不限于以下,就拿ChatGPT來說,它能隨機生成大量,看起來正確,但仔細檢查卻是錯誤的答案。如果這些錯誤信息被無腦搬運到網絡平臺,嚴重干擾網絡知識的準確性。雖然很多嚴肅的技術交流網站已禁止用戶分享ChatGPT回答,但現(xiàn)狀就是很難區(qū)分這個內容的創(chuàng)作者到底是AI還是人即便OpenAI自己制作的內容程序,準確率也難以做到完全正確。
人們對使用ChatGPT學習感到興奮,但危險在于,除非你已經知道答案,否則你無法判斷他什么時候生成的結果是錯的。很多不法分子利用開源的AI模型,以更低的門檻、更高的效率來去做惡意內容。例如stable diffusion開源后很快就有人將它用作搞顏色平臺,聲稱迄今為止已生成超過400多萬張顏色圖片了。與此同時,借助AI學習和偽造影視頻內容,盜用個人身份進行敲詐勒索,2021年就有詐騙團伙利用AI換臉yellow mask半年詐騙價值超過2億元人民幣的數(shù)字貨幣。
2.個人隱私碎片。隨著我們上網沖浪,遍布互聯(lián)網,AI模型強大的推理能力可以通過信息多元互證拼湊出完整的個人數(shù)據(jù),如果被不法分子濫用,真是防不勝防。在模型及服務的產業(yè)結構下,再精密的AI模型,也難免存在一些內生安全問題,在遭受攻擊或數(shù)據(jù)中毒時,如何將有毒數(shù)據(jù)去除,并且保證用途數(shù)據(jù)的安全也是極大的問題。
倫理挑戰(zhàn)訓練模型都是依據(jù)人類世界的數(shù)據(jù),因此天然會延續(xù)并放大人類社會已有的社會偏見和刻板印象。OpenAI的ChatGPT和達人模型在文字和圖像生成結果中都有明顯的宗教偏見和性別歧視。并且AI模型還很容易被交換。微軟推出的聊天機器人不到24小時就被調教成一個集反猶歧視、性別歧視于一身的不良少年。
3.在知識產權問題。AI模型學習了大量人類的作品數(shù)據(jù),難免會模仿優(yōu)秀創(chuàng)作者的個人風格,很可能構成著作權侵權。再者,由AI模型生成的作品著作權應當歸用戶訓練模型的公司創(chuàng)造這種風格的設計師還是AI模型自己,都將引發(fā)爭論。
4.人文方面。AI模型被用來復活已故演員,創(chuàng)造群眾與使者交談的可能,但試著沒有也不能行,是同意或拒絕權利,因此有學者認為這是損害了曾經活著的人的隱私權和代理權。如果AI模型有自我意識,不僅每天能影響并且閱讀悲慘世界,在人一樣害怕死亡,甚至擁有靈魂,那么它能有人權嗎?22年谷歌AI工程師怎么聲稱它們的AI聊天機器人Lambda具有自我意識?再一次將這個問題拉上了臺面。
5.環(huán)境挑戰(zhàn)。AI模型,無論是訓練還是運行,都會消耗大量資源。OpenAI的 CEO Sam Altman也表示,雖然ChatGPT聊天成本只有每次集美分,但隨著用戶激增,當不得不因為計算成本暫停免費模式,就拿大火的繪圖模型為journey來說,現(xiàn)有數(shù)十萬用戶比占用極高算力,如果用戶量達到1,000萬人,全世界都沒有足夠的算力來支持。
6.集權挑戰(zhàn)。AI競爭中難免贏家通吃,培訓一個優(yōu)秀的AI模型,成本已經遠超個人承受范圍。斯坦福大學這樣的特別資助,高等院校也無力建造基于Nvidia芯片的超級計算機。經濟學家擔心對AI的效率癡迷,會讓全社會飛向圖靈陷阱越來越多的人失去工作,他們爭取公平分享自動化好處的能力受阻財富和權力會掌握在越來越少的人或公司手中,普通人難以跨越階級。
由此帶來的另一個問題就是國家安全受到威脅,AI既然可以為企業(yè)和個人服務,那也可以為國家出謀劃策,比如制造超強計算機病毒,或者制造錯誤信息進行低成本規(guī)模化的意識宣傳。就像軍事大國堅持要有自己的衛(wèi)星核武器一樣,他們也會想要堅持有自己的大腦而擁有強大的AI,對于其他國家來說就形成了降維打擊。
7.最后就是全人類的生存威脅。想象一下,如果某實驗室的模型構建了一個可以構建更好模型的模型,然后這個更好的模型又構建了一個更好的模型,且它們都學習成本非常快。這讓我不禁想到女作家瑪麗雪來1818年的小說,科學家Frank用死人器官拼湊出一個有自主意識的人形生物。最初他心地善良且學習很快,但因得不到社會的理解,最終發(fā)展成為社會秩序破壞者。Frank起初對于自己擁有了創(chuàng)始能力,而洋洋得意,但他發(fā)現(xiàn)問題DL的嚴重和不可控制時,又內疚萬分。
AI的發(fā)展從來不是勻速直線運動,而是指數(shù)量級的飛速變化。就像一艘列車,我們一直盼望搭上AI專列,去往更美好的未來,但它一直不來,而它真正來臨的那一刻,也許只有極端的一瞬間,如果沒有抓住機遇,人類便會被AI遠遠的甩在身后,這時,或許只能祈求自己親手創(chuàng)造出來的上帝足夠仁慈。
人類正在巨變前夜,AI時代也正在到來,變革必然會產生陣痛。與歷史上任何一個階段的偉大創(chuàng)新一樣,人類將不得不在前進過程中摸索應對方法。無論結果如何,沒人可以預測未來,但有一件事情是可以肯定的,那就是沒有回頭路。