如果將人工智能按照用途進(jìn)行簡單分類的話,人工智能可以劃分為決策式AI以及生成式AI兩類。所謂決策式AI就是通過學(xué)習(xí)訓(xùn)練數(shù)據(jù)的中的條件概率分布情況來進(jìn)行判斷決策,判斷樣本屬于指定目標(biāo)的概率,比如人臉識(shí)別就是典型的決策式AI,終端設(shè)備根據(jù)攝像頭獲取到的人臉圖像來進(jìn)行特征信息匹配,和后臺(tái)系統(tǒng)中的人臉特征庫進(jìn)行對(duì)比來判斷當(dāng)前人臉信息是否在系統(tǒng)人臉特征庫中或者是否有權(quán)限執(zhí)行操作。而以ChatGPT為代表的生成式AI通過對(duì)大量數(shù)據(jù)的聯(lián)合概率進(jìn)行學(xué)習(xí),對(duì)已有的數(shù)據(jù)和知識(shí)進(jìn)行歸納總結(jié),同時(shí)結(jié)合深度學(xué)習(xí)技術(shù),自動(dòng)生成新的內(nèi)容,而新生成的內(nèi)容可以是文字、圖片甚至是視頻等多模態(tài)內(nèi)容。本文主要簡要介紹深度學(xué)習(xí)以及大模型基礎(chǔ)內(nèi)容,后續(xù)文章中將會(huì)繼續(xù)深入分析這兩方面的技術(shù)原理。
深度學(xué)習(xí)
深度學(xué)習(xí)是生成式AI背后比較核心的實(shí)現(xiàn)技術(shù),它是機(jī)器學(xué)習(xí)的重要優(yōu)化手段,而機(jī)器學(xué)習(xí)又是人工智能領(lǐng)域重要的落地實(shí)現(xiàn)措施。因此要想理解深度學(xué)習(xí),我們先看下什么是機(jī)器學(xué)習(xí),再來分析下它存在哪些不足才催生發(fā)展出來深度學(xué)習(xí)。關(guān)于機(jī)器學(xué)習(xí)有這樣的定義。
怎么理解這句話呢?舉個(gè)栗子大家瞬間就明白了,假如你開發(fā)了一個(gè)和別人下中國象棋的程序。那么E就表示下象棋的經(jīng)驗(yàn),T表示下象棋這件事情,而P就是下象棋可以取勝的概率。所以如果你編寫的程序可以通過不斷下象棋獲得足夠多的下象棋的經(jīng)驗(yàn),而通過經(jīng)驗(yàn)的累積又能夠提高下象棋獲勝的概率,那么我們就可以認(rèn)為你編寫的下象棋的程序具備機(jī)器學(xué)習(xí)的能力。那么這種根據(jù)經(jīng)驗(yàn)來實(shí)現(xiàn)程序?qū)W習(xí)能力優(yōu)化提升到底是通過什么工程技術(shù)來實(shí)現(xiàn)的呢?人工神經(jīng)網(wǎng)絡(luò)就是通過工程技術(shù)手段來落地模擬人腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能從而實(shí)現(xiàn)機(jī)器學(xué)習(xí)。
人工神經(jīng)網(wǎng)絡(luò)
仿生學(xué)一直是人類追求進(jìn)步的工具,比如人類希望像鳥一樣飛行于是發(fā)明了飛機(jī),人類希望像魚一樣潛入水底于是發(fā)明了潛水艇,人類希望機(jī)器能夠像人一樣進(jìn)行思考推理,于是開始研究自身大腦運(yùn)行機(jī)理。人們發(fā)現(xiàn)自身大腦是由數(shù)百億個(gè)神經(jīng)元組成,這些神經(jīng)元本身結(jié)構(gòu)并不復(fù)雜,而這些神經(jīng)元互相協(xié)作卻能完成各項(xiàng)信息的接收處理以及輸出,從而構(gòu)成人的感知,記憶,分析,思考等高階行為能力。而且隨著人年齡的增長,學(xué)習(xí)能力也是在不斷增強(qiáng)。因此如果可以設(shè)計(jì)出類似人類神經(jīng)網(wǎng)絡(luò)能力具備學(xué)習(xí)能力的系統(tǒng),那么機(jī)器也會(huì)像人一樣學(xué)習(xí)進(jìn)步。實(shí)際上從本質(zhì)上來看,我們可以將人類的大腦看作為一個(gè)信息處理器,視覺、聽覺、觸覺等都是大腦信息的輸入信號(hào),而大腦的神經(jīng)元系統(tǒng)就是信息處理器處理各種輸入信號(hào)給出對(duì)應(yīng)的行為響應(yīng)。
正因?yàn)槭艿搅巳四X神經(jīng)元結(jié)構(gòu)的啟發(fā),先驅(qū)們?cè)噲D通過模擬人腦神經(jīng)系統(tǒng)來讓機(jī)器具備人類分析問題解決問題的智能行為。實(shí)際上早在1943年,數(shù)學(xué)家皮茨(Pitts)和麥卡洛克(McCulloch)就發(fā)表了論文《A Logical Calculus of Ideas Immanent in Nervous Activity》(《神經(jīng)活動(dòng)中思想內(nèi)在性的邏輯演算》)揭開了人工神經(jīng)網(wǎng)絡(luò)研究的序幕。在這篇論文中提出了"人工神經(jīng)元"抽象的數(shù)學(xué)模型(M-P Model)用以描述神經(jīng)元的行為以及信息傳遞方式。
在M-P模型中,人工神經(jīng)元可以接收來自外部的多個(gè)輸入信號(hào),每個(gè)輸入信號(hào)與神經(jīng)元之間的連接都有相應(yīng)的連接權(quán)重,和生物學(xué)意義上的神經(jīng)元類似,人工神經(jīng)元同樣擁有閾值,達(dá)到閾值才會(huì)激活神經(jīng)元。而將將人工神經(jīng)元進(jìn)行收尾相連,如同大腦數(shù)以億計(jì)的神經(jīng)元網(wǎng)絡(luò),信息在不同的層級(jí)的神經(jīng)元之間進(jìn)行傳遞、處理以及抽象,這個(gè)過程我們就稱之為思考。
此后在M-P模型基礎(chǔ)之上,先驅(qū)們不但進(jìn)行研究優(yōu)化,海布學(xué)習(xí)規(guī)則、感知機(jī)學(xué)習(xí)以及適?于多層感知器的反向傳播算法BP算法等都被相繼提出,但是受限于計(jì)算機(jī)硬件算力的限制以及其他各種條件的影響。直到2006年,人工智能通過?監(jiān)督的學(xué)習(xí)?法逐層訓(xùn)練算法,再使用有監(jiān)督的反向傳播算法進(jìn)?調(diào)優(yōu),這種無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)相結(jié)合的方法在人工智能領(lǐng)域掀起了深度學(xué)習(xí)的研究浪潮,深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)AlexNet,循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetworks,RNN)、長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)、生成式對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)等被相繼提出。
如上圖所示,對(duì)于機(jī)器學(xué)習(xí)來說它需要人工介入進(jìn)行特征提取來幫助機(jī)器學(xué)習(xí)來實(shí)現(xiàn)分類處理,而深度學(xué)習(xí)不需要人工介入干預(yù),自身便可以實(shí)現(xiàn)特征提取,這是兩者最大的區(qū)別。
大模型
以前我們需要對(duì)大量標(biāo)注過的數(shù)據(jù)進(jìn)行訓(xùn)練,這樣訓(xùn)練出來的模型都是專門應(yīng)對(duì)某一領(lǐng)域的專才,就像AlphaGo一開始他只會(huì)下圍棋,你讓它下中國象棋它就不會(huì)了,如果需要它具備下中國象棋的技能就需要重新訓(xùn)練一套模型來支持。這就好比我們?cè)缙诘臒焽枋降募夹g(shù)架構(gòu),都是針對(duì)某一項(xiàng)特定的業(yè)務(wù)場(chǎng)景來進(jìn)行系統(tǒng)平臺(tái)的建設(shè)。但是隨著大數(shù)據(jù)技術(shù)的發(fā)展、GPU強(qiáng)大算力支撐以及模型不斷迭代優(yōu)化帶來了深度學(xué)習(xí)技術(shù)長足發(fā)展,特別是大模型出現(xiàn)之后可以以海量無標(biāo)注的數(shù)據(jù)中進(jìn)行自我學(xué)習(xí)來進(jìn)行預(yù)訓(xùn)練 ,從而獲得具備通用知識(shí)能力的大模型,而后再結(jié)合特定領(lǐng)域知識(shí)以及訓(xùn)練任務(wù)進(jìn)行模型微調(diào)訓(xùn)練,讓大模型成為某個(gè)領(lǐng)域的專家模型。比如結(jié)合醫(yī)療領(lǐng)域知識(shí),那么就可以通過微調(diào)任務(wù)得到醫(yī)療領(lǐng)域模型,如果結(jié)合法律領(lǐng)域知識(shí),那么就可以獲取到法律領(lǐng)域模型,而不需要再重新訓(xùn)練一套模型。其實(shí)大模型的訓(xùn)練過程和我們?nèi)祟悓W(xué)習(xí)的過程是一樣的,我們小的時(shí)候語數(shù)外政治歷史地理物理化學(xué)生物啥都學(xué),但是到了大學(xué)開始分專業(yè),到了研究生就在特定的專業(yè)領(lǐng)域進(jìn)行深耕,最終成為一個(gè)專業(yè)人才。這個(gè)過程是不是和大模型的訓(xùn)練過程有異曲同工之妙。
總結(jié)
本文主要對(duì)生成型AI進(jìn)行了初步闡述,同時(shí)針對(duì)生成型AI最核心的兩個(gè)技術(shù)點(diǎn)分別進(jìn)行了初步說明,后面的專欄文章中將繼續(xù)以深度學(xué)習(xí)以及大模型核心技術(shù)點(diǎn)作為切入點(diǎn)來深入分析生成型AI背后的技術(shù)原理。希望通過系列文章的說明,讓大家對(duì)于類似ChatGPT這樣的生成型AI有一個(gè)更加深刻的理解。