無論你是喜歡、還是厭惡、亦或害怕,以ChatGPT為代表的新興人工智能(AI)平臺,目前正在更加深入地邁向公共領域。它們不僅表現為各種聰明的聊天機器人,而且能夠在幕后以多種創新方式被廣泛使用。其中,最為典型一種方式是,我們可以使用AI驅動的計算機視覺(computer vision,CV),作為單獨的一個網絡安全的層面,持續協助抵御網絡釣魚攻擊。
什么是計算機視覺?
眾所周知,ChatGPT和Bing Chat等工具會使用龐大的文本數據庫,對用戶的輸入生成類似人類的響應。而計算機視覺雖然在概念上類似于GPT-4等大語言模型,但是它僅在大量的圖像數據存儲庫中,使用到了相似的概念。同時,正如AI聊天機器人背后的大語言模型,能夠通過使用深度學習,來理解上下文等因素那樣,CV使用深度學習,來理解圖像的相關上下文。因此,計算機視覺可以被描述為:具有“計算機速度”的人類視覺功能。
如何使用計算機視覺來檢測網絡釣魚攻擊
如今,網絡釣魚攻擊已經成為了欺詐者采用的最為廣泛的網絡攻擊策略之一。鑒于此類威脅正在變得越來越復雜,而傳統檢測方法的迭代與更新速度較為緩慢,計算機視覺旨在補足“傳統的黑名單編錄時間過長”這一短板。
通常情況下,釣魚網站從啟動到被列入黑名單,至少需要數小時的時間。而這段時間間隔,足以讓它給網絡環境造成大量的破壞。
就技術層面而言,計算機視覺既不單一依賴黑名單,也無需檢測被嵌入的惡意代碼。相反,它會使用多種技術,來標記出可疑的項目。其典型的檢測流程為:
首先,它會從相關電子郵件、網頁、以及其他可能包含威脅的來源處,收集各種圖像。
然后,計算機視覺技術會進行四類主要的檢測與處理,其中包括:Logo/商標檢測、對象/場景檢測、文本檢測、以及視覺搜索。
最后,CV使用被稱為“風險元素聚合”的檢測對過程進行深入檢查,并將相關檢測結果標記為可疑項目。
下面,讓我們來深入討論CV是如何通過四類主要檢測,來發現網絡釣魚的攻擊線索。
Logo/商標檢測
品牌欺騙(Brand spoofing)是詐騙者最常使用的技術手段。通過程序代碼,計算機視覺可以將那些被詐騙者常用的logo、電子郵件的具體內容、以及它們的優先級結合起來。例如,一封被標記為緊急且帶有某銀行logo的電子郵件,更容易被判定為具有極強的欺詐性。在此基礎上,計算機視覺會根據CV數據庫中的相關記錄,進一步檢驗logo的真實性。
對象檢測
詐騙者通常也會通過圖形與代碼的混淆技術--“muddy the waters”,將按鈕或表格等對象轉換為圖形,以便繞開安全防護系統對于文件和字符的檢查。當然,此類加密腳本往往只能在電子郵件或網站顯示之后,方可執行表單創建等操作。
而對象檢測則會在呈現網站或電子郵件后,立即尋找視覺線索。它甚至可以檢測諸如按鈕或表單等圖形格式的對象。同時,它也會在電子郵件或網站呈現之前,去檢查各種已加密的元素。
文本檢測
為了對文本進行相應地偽裝,詐騙者還會用到一系列策略與技術,其中包括:
對此,計算機視覺可以使用文本分析(類似光學字符識別,但比其更為強大),來檢測密碼、帳戶詳細信息、以及login等觸發詞。同樣,由于它運行在呈現之后,因此可以有效地掃描和捕獲到所有的文本。
視覺搜索
作為反網絡釣魚工具包的重要部分,視覺搜索主要依賴于已錄入的數據參考。其工作原理是:在圖像數據庫中保存了已知合規圖像(known good images,KGI)和已知不良圖像(known bad images,KBI)的模板。然后,據此信息來執行比較,以檢測并發現異常情況。
不過,類似于那些依賴黑名單進行比較分析的安全檢測系統,視覺搜索的效果主要取決于給定的數據。
計算機視覺可以作為獨立的網絡釣魚防護系統嗎?
簡單而言,答案是“不一定。”目前,計算機視覺雖然僅能作為一個額外的安全層,為企業和組織提供一種可行的選擇,但是在持續使用過程中,計算機視覺能夠作為后臺守護進程,實時地掃描網絡中、以及主機上的各種對象,而無需像過去那樣,僅依賴那些更新滯后的黑名單、或代碼威脅檢測機制。可以說,在“魔高一尺,道高一丈”的、詐騙者和安全專家之間的軍備競賽中,它顯然可以讓企業在信息安全態勢上,先欺詐者“一手”。
計算機視覺是反網絡釣魚武器的未來發展方向嗎?
雖然計算機視覺在反網絡釣魚領域,不太可能產生類似AI驅動的聊天機器人那樣巨大的影響,但它已經在被稱為技術采用曲線的概念上取得穩步進展。就在不久之前,某大型企業已開始大舉投入該技術領域,并將其作為基于云端的解決方案或本地服務,為其網絡基礎架構保駕護航。借助云計算的優勢,在不久的將來,會有更多的企業通過訂閱服務的方式,從任何位置獲取此類反網絡釣魚服務。
計算機視覺即保護
雖然像計算機視覺之類顛覆性較小的技術,目前尚未能頻繁登上新聞頭條,但是它正在幕后悄悄地在掀起波瀾。我們能夠在個人電腦上使用到此類服務,增強抗網絡釣魚攻擊的能力,也將只是時間問題。