精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

深入理解生成式AI技術原理:初識生成式AI

如果將人工智能按照用途進行簡單分類的話,人工智能可以劃分為決策式AI以及生成式AI兩類。所謂決策式AI就是通過學習訓練數據的中的條件概率分布情況來進行判斷決策,判斷樣本屬于指定目標的概率,比如人臉識別就是典型的決策式AI,終端設備根據攝像頭獲取到的人臉圖像來進行特征信息匹配,和后臺系統中的人臉特征庫進行對比來判斷當前人臉信息是否在系統人臉特征庫中或者是否有權限執行操作。而以ChatGPT為代表的生成式AI通過對大量數據的聯合概率進行學習,對已有的數據和知識進行歸納總結,同時結合深度學習技術,自動生成新的內容,而新生成的內容可以是文字、圖片甚至是視頻等多模態內容。本文主要簡要介紹深度學習以及大模型基礎內容,后續文章中將會繼續深入分析這兩方面的技術原理。

深度學習

深度學習是生成式AI背后比較核心的實現技術,它是機器學習的重要優化手段,而機器學習又是人工智能領域重要的落地實現措施。因此要想理解深度學習,我們先看下什么是機器學習,再來分析下它存在哪些不足才催生發展出來深度學習。關于機器學習有這樣的定義。

圖片

怎么理解這句話呢?舉個栗子大家瞬間就明白了,假如你開發了一個和別人下中國象棋的程序。那么E就表示下象棋的經驗,T表示下象棋這件事情,而P就是下象棋可以取勝的概率。所以如果你編寫的程序可以通過不斷下象棋獲得足夠多的下象棋的經驗,而通過經驗的累積又能夠提高下象棋獲勝的概率,那么我們就可以認為你編寫的下象棋的程序具備機器學習的能力。那么這種根據經驗來實現程序學習能力優化提升到底是通過什么工程技術來實現的呢?人工神經網絡就是通過工程技術手段來落地模擬人腦神經系統的結構和功能從而實現機器學習。

圖片

人工神經網絡

仿生學一直是人類追求進步的工具,比如人類希望像鳥一樣飛行于是發明了飛機,人類希望像魚一樣潛入水底于是發明了潛水艇,人類希望機器能夠像人一樣進行思考推理,于是開始研究自身大腦運行機理。人們發現自身大腦是由數百億個神經元組成,這些神經元本身結構并不復雜,而這些神經元互相協作卻能完成各項信息的接收處理以及輸出,從而構成人的感知,記憶,分析,思考等高階行為能力。而且隨著人年齡的增長,學習能力也是在不斷增強。因此如果可以設計出類似人類神經網絡能力具備學習能力的系統,那么機器也會像人一樣學習進步。實際上從本質上來看,我們可以將人類的大腦看作為一個信息處理器,視覺、聽覺、觸覺等都是大腦信息的輸入信號,而大腦的神經元系統就是信息處理器處理各種輸入信號給出對應的行為響應。

正因為受到了人腦神經元結構的啟發,先驅們試圖通過模擬人腦神經系統來讓機器具備人類分析問題解決問題的智能行為。實際上早在1943年,數學家皮茨(Pitts)和麥卡洛克(McCulloch)就發表了論文《A Logical Calculus of Ideas Immanent in Nervous Activity》(《神經活動中思想內在性的邏輯演算》)揭開了人工神經網絡研究的序幕。在這篇論文中提出了"人工神經元"抽象的數學模型(M-P Model)用以描述神經元的行為以及信息傳遞方式。

在M-P模型中,人工神經元可以接收來自外部的多個輸入信號,每個輸入信號與神經元之間的連接都有相應的連接權重,和生物學意義上的神經元類似,人工神經元同樣擁有閾值,達到閾值才會激活神經元。而將將人工神經元進行收尾相連,如同大腦數以億計的神經元網絡,信息在不同的層級的神經元之間進行傳遞、處理以及抽象,這個過程我們就稱之為思考。

圖片

此后在M-P模型基礎之上,先驅們不但進行研究優化,海布學習規則、感知機學習以及適?于多層感知器的反向傳播算法BP算法等都被相繼提出,但是受限于計算機硬件算力的限制以及其他各種條件的影響。直到2006年,人工智能通過?監督的學習?法逐層訓練算法,再使用有監督的反向傳播算法進?調優,這種無監督學習和有監督學習相結合的方法在人工智能領域掀起了深度學習的研究浪潮,深度卷積神經網絡架構AlexNet,循環神經網絡(RecurrentNeuralNetworks,RNN)、長短期記憶網絡(LongShort-TermMemory,LSTM)、生成式對抗網絡(GenerativeAdversarialNetwork,GAN)等被相繼提出。

圖片

如上圖所示,對于機器學習來說它需要人工介入進行特征提取來幫助機器學習來實現分類處理,而深度學習不需要人工介入干預,自身便可以實現特征提取,這是兩者最大的區別。

大模型

以前我們需要對大量標注過的數據進行訓練,這樣訓練出來的模型都是專門應對某一領域的專才,就像AlphaGo一開始他只會下圍棋,你讓它下中國象棋它就不會了,如果需要它具備下中國象棋的技能就需要重新訓練一套模型來支持。這就好比我們早期的煙囪式的技術架構,都是針對某一項特定的業務場景來進行系統平臺的建設。但是隨著大數據技術的發展、GPU強大算力支撐以及模型不斷迭代優化帶來了深度學習技術長足發展,特別是大模型出現之后可以以海量無標注的數據中進行自我學習來進行預訓練 ,從而獲得具備通用知識能力的大模型,而后再結合特定領域知識以及訓練任務進行模型微調訓練,讓大模型成為某個領域的專家模型。比如結合醫療領域知識,那么就可以通過微調任務得到醫療領域模型,如果結合法律領域知識,那么就可以獲取到法律領域模型,而不需要再重新訓練一套模型。其實大模型的訓練過程和我們人類學習的過程是一樣的,我們小的時候語數外政治歷史地理物理化學生物啥都學,但是到了大學開始分專業,到了研究生就在特定的專業領域進行深耕,最終成為一個專業人才。這個過程是不是和大模型的訓練過程有異曲同工之妙。

圖片

總結

本文主要對生成型AI進行了初步闡述,同時針對生成型AI最核心的兩個技術點分別進行了初步說明,后面的專欄文章中將繼續以深度學習以及大模型核心技術點作為切入點來深入分析生成型AI背后的技術原理。希望通過系列文章的說明,讓大家對于類似ChatGPT這樣的生成型AI有一個更加深刻的理解。

猜你喜歡