精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

專家觀點:AI應用中寬數據比大數據更有價值

在當今快節奏的數字世界中,數據的使用不斷發展,以幫助企業更好地理解來自大量結構化和非結構化數據存儲庫的見解。然而,雖然大數據可以提供對業務至關重要的分析,但這些數據主要是用來展示過去時態發生了什么。在執行預測性和說明性分析時,越來越多地必須考慮廣泛的數據。

這就是人工智能可以發揮作用的地方,也是大數據對人工智能的需求出現分歧的地方。大數據被定義為三個因素:容量、速度和多樣性。體積是指可用數據的大小,速度是指數據到達和處理的速度。

然而,企業要想有效地將數據用于人工智能的預測目的,就需要各種數據。隨著人工智能在各個領域的應用日益普及,訪問不同數據集的能力至關重要,也是人工智能算法的催化劑。換句話說,不要讓數據太過平淡無奇,而要讓它更多樣化。

我們將這種數據稱為各種各樣的“寬數據”(Wide Data),這些數據來自組織的內部、外部、結構化和非結構化數據。這一點至關重要,因為在全球化經濟中,企業業績取決于許多參數。

大數據應用的一個例子是看看在美國不同地區設計產品的兩個制造工廠。這兩家工廠的地理位置會對生產產生影響,尤其是在發生暴風雪等自然災害的情況下。考慮天氣和其他幾個不同的外部因素,再結合內部數據來為人工智能算法提供數據,將會對每個制造組織的庫存、供應鏈和需求做出更準確的預測。數據的多樣性提供了更多的相關性,因此AI算法可以更好地學習,從而提供準確的結果。

為什么不是數據容量?

由于缺乏不同的因變量,數據量并不一定意味著算法的學習效果更好。雖然從理論上講,擁有大量數據對人工智能應用很重要,但對于高效的算法而言,數據的多樣性比數據的大小更重要。

舉個例子,我們正在做一個預測癌癥患者數據的項目。研究對象并不多,只生成了150行數據。這產生了相對較少的數據來篩選,它不被認為是大數據。這就提出了一個問題——人工智能算法是否有足夠的數據來學習和預測癌癥患者的后續情況?在這種情況下,答案是肯定的。因為雖然只有150行,但生物識別、生物傳感器和癥狀數據卻構成了數千列,這使它成為一個廣泛的數據。

關鍵在于,對于人工智能應用而言,數據的多樣性比數據量更重要。

寬數據的類型

如前所述,有不同類型的數據,當組合時,使其成為一個寬數據,如:

內部結構化數據:位于軟件應用程序(如 ERP、CRM 系統甚至財務系統)中的數據。

內部非結構化數據:作為內部非結構化數據一部分的文檔、圖像、報告、圖表和圖表。

外部數據:來自外部來源的數據,如天氣、社會、經濟數據、人口普查數據、證券交易所數據等。

外部非結構化數據:來自組織防火墻外部的新聞、圖像、視頻等。

CUPP 框架:提供數據策略

為了成功采用人工智能,擁有最佳人工智能實踐非常重要。一個這樣的框架是 CUPP,它代表收集、統一、處理和呈現。部署這四個步驟是組織開始其 AI 之旅的典型方式。

可能沒有數據戰略或數據平臺的傳統企業將受益于創建像 CUPP 這樣的框架。在確保準確性或數據準確性方面,框架也很重要。組織需要干凈、高質量的數據來確定理想的結果,而準確性會顯著加快這一過程。

以下是組織使用 CUPP 框架所經歷的基本步驟:

1、 從數據普查開始

利用數據普查方法來發現組織內部和外部擁有的數據資產。

此規劃過程的一部分是定位結構化和非結構化數據的來源。許多組織可能會對他們擁有多少非結構化數據感到驚訝,并且進行數據普查可以讓他們盤點所有數據資產。

2、了解您的數據資產

在建模之前,重要的是要了解組織已經擁有什么。這有助于開發 AI 最佳實踐,但需要一點耐心。這將作為AI 應用采用的基礎并提供能力投資回報率。

企業還需要研究其內部-外部結構化和非結構化數據的收集和統一策略。

3、 使用機器學習和自然語言處理以及機器學習來轉換和理解非結構化內容

組織可以獲取他們獲取的非結構化數據并利用自然語言處理將其轉換為結構化內容以訓練您的數據。

組織也應該對非結構化內容感到鼓舞,而不是害怕它,因為現在有幾種技術可用于對這些內容進行非常有意義的使用。

關于需要使用寬數據的關鍵要點

廣泛的數據可以更快地啟動 AI 之旅,并且對于幫助組織將來自各種大小、非結構化和結構化數據源的見解情境化至關重要。隨著技術的發展和發展,沒有企業可以忽視數據的作用和價值,都需要圍繞獲取和分析各種數據來制定數據策略。

猜你喜歡