精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

實施穩健的AI治理以實現數據民主化

實施穩健的AI治理以實現數據民主化

GenAI的迅速出現使更多的人能夠釋放數據的力量,以獲得新的見解和更好的決策,但允許更廣泛地訪問數據需要一種數據治理戰略。能夠平衡這些看似對立的趨勢的企業——數據民主化,同時對數據保持強有力的治理——將通過釋放獨特的數據驅動洞察力,在市場上脫穎而出。

根據Gartner的數據,到2026年,超過80%的企業將使用GenAI API和模型,或在生產中部署啟用GenAI的應用程序,而去年這一比例不到5%。GenAI的自然語言界面允許非技術用戶,從部門負責人到一線工作人員,更輕松地訪問和使用數據。這在獲取信息和技能方面創造了公平的競爭環境,Gartner稱這是“本十年最具顛覆性的趨勢之一”。

如果公司要避免隱私、安全和數據質量方面的風險增加,以這種方式實現數據民主化就會使強有力的治理變得更加關鍵,這意味著準確地知道你擁有什么數據、駐留在哪里、誰有權訪問這些數據以及每種類型的用戶被允許如何使用這些數據,但一個企業如何在不壓制創新的情況下實施全面控制?

在較高級別上,理想的方法是將數據統一到一個綜合存儲庫中,多個團隊和工作組可以輕松、安全地訪問該存儲庫,統一數據使企業能夠集中管理并擴大對數據的訪問,同時最大限度地降低復雜性并優化成本。

在現實中,這可能是具有挑戰性的,因為數據主權法律要求將某些數據保存在特定的國家或地區。在這種情況下,企業應該努力消除孤島,并在其數據平臺上應用一致的治理框架。

除此之外,幾種特定的方法和技術有助于確保企業可以保持強大的治理,同時仍然通過GenAI擴大對數據的訪問,其中一些是適用于任何環境的基本治理實踐,但當GenAI進一步民主化數據訪問時,它們變得更加重要。

針對隱私和法規遵從性的精細控制

隨著越來越多的員工訪問更多的數據,個人身份信息(PII)可能被泄露或被錯誤的用戶看到的潛在風險只會增加,精細的控制策略以及匿名化和身份識別技術對于確保法規遵從性和防止數據被錯誤的人訪問至關重要。

在我們分析雪花數據云趨勢的新《數據趨勢2024》報告中,我們注意到治理功能的使用顯著增加,這些功能在提供對數據的精細控制的同時,還適當地將其提供給更多的用戶,用于更多的用例,例如,在截至2024年1月31日的12個月中,應用的掩碼或行訪問策略的使用量與去年同期相比增加了98%,與此同時,分配了掩碼策略的列數增長了97%。

然而,值得注意的是,針對受策略保護的對象運行的查詢總數上升了142%,這個數字意義重大,因為它表明良好的數據治理不是說“不”和限制數據使用。盡管看到越來越多的治理通過使用標簽和屏蔽政策,但報告指出,使用這些數據所做的工作量正在迅速上升。

在某些情況下,員工可能希望檢查他們不能被授予直接訪問權限的數據集,在這種情況下,差異隱私是一項強大的技術,因為它允許用戶通過查看數據集內的模式來共享和探索數據集,而不會泄露任何個人用戶的PII。更進一步,數據凈化室允許多方在不向彼此披露原始數據的情況下就數據進行協作,數據凈化室通常用于在不同企業之間共享數據,但我們正在看到內部使用的技術來滿足日益增長的監管和隱私需求,它可以成為在GenAI界面環境中探索PII數據的有效技術。

一致、協調的安全性

安全應該構建在數據平臺的結構中,而不是試圖稍后為個別數據集和用戶固定它,支持對話界面的技術不應該復制數據上的身份和其他核心權限,這將導致脆弱的設置。如果兩個或多個系統都在跟蹤誰可以訪問哪些數據,則出錯和未經授權訪問的可能性會大大增加。

在保護GenAI用例的數據方面發揮關鍵作用的技術包括持續的風險監控和保護、基于角色的訪問控制(RBAC)和細粒度授權策略。基于角色的標記和基于標記的掩碼策略允許你通過將掩碼策略分配給標記,然后在一個或多個數據庫對象上設置該標記,從而在列級別保護數據。

數據孤島是良好治理的敵人

將數據的副本或片段存儲在不同的系統中,使得跟蹤誰可以訪問哪些信息以及保持訪問和控制策略的一致性變得極其困難,這就是為什么數據孤島是強大治理的敵人。

數據孤島還使得很難確保員工查詢的是最新、最準確的數據,這可能會導致代價高昂的錯誤。為了通過GenAI實現對數據的廣泛訪問,企業需要一個單一的真實來源,以確保所有員工都在查看相同的信息,并且可以在所有數據中全面應用和更新控制和策略。

確保數據質量以獲得準確的結果

即使你消除了孤島并擁有適當的權限,也不能保證員工訪問的信息是正確的,數據質量框架基于應用于表中特定列或一組列的可配置數據質量規則,可以幫助檢測質量問題并確保準確的信息。

此外,到目前為止,我們都知道,GenAI有時會產生幻覺,并產生實際上沒有根據的答案,這對于企業使用來說是不可接受的。企業可以通過將大型語言模型(LLM)與他們知道值得信任的數據源相結合來解決這一問題,例如內部客戶數據庫或來自可信第三方提供商的經過審查的數據集。

這些受信任的數據源可以使用需要LLM定制(如微調)或不需要LLM定制(如即時工程或檢索增強生成(RAG))的過程合并。無論是哪種情況,這些技術都有助于確保員工收到準確、高質量的結果,同時遵守內部云環境中內置的治理標準。

數據訪問和通用搜索的威力

GenAI治理的一個重要方面是讓員工很容易找到合適的數據集和數據產品來幫助他們進行分析,人工智能如此強大的一個原因是,它允許員工在不通過中央團隊的情況下與數據交互,但這需要這些員工知道他們可以獲得什么數據,以及如何找到這些數據。

搜索功能提供了這一功能,允許用戶查找和查詢數據集和數據產品,這一搜索功能本身可以由LLM提供支持,使數據搜索更加直觀-這是我們在Snowflake開發的,作為我們通用搜索的一部分。

治理是數據民主化的基礎

商業用戶渴望更廣泛地利用他們組織的數據,而GenAI最終使這成為可能。多虧了LLMS和自然語言處理,財務、人力資源、銷售和運營等領域的員工現在可以針對自己的角色制定問題,并獲得他們做出更明智決策所需的答案。

但要滿足企業的安全和法規遵從性需求,這只能在具有強大治理的環境中發生,治理越強,你的員工就越能自由地瀏覽數據,而不會給公司帶來額外的風險,GenAI為真正的數據民主化打開了大門,而良好的治理是使之成為可能的基礎。

猜你喜歡