精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當(dāng)前位置:首頁(yè) > 最新資訊 > 行業(yè)資訊

AutoML綜合分析

該圖片由Gerd Altmann 在Pixabay上發(fā)布

介紹

一個(gè)改變一切的舊觀念是自動(dòng)化。我們以某種方式創(chuàng)造的每一種工具和方法都涉及某種程度的自動(dòng)化。一個(gè)被稱為自動(dòng)化機(jī)器學(xué)習(xí)或 AutoML 的新興領(lǐng)域自動(dòng)化了創(chuàng)建機(jī)器學(xué)習(xí)模型以對(duì)數(shù)據(jù)建模的過程。借助適用于 ML 項(xiàng)目的最佳 AutoML,機(jī)器學(xué)習(xí)項(xiàng)目現(xiàn)在非常容易完成。新手和專家都可以隨時(shí)從機(jī)器學(xué)習(xí)應(yīng)用程序的 AutoML 庫(kù)中受益匪淺,而不會(huì)出現(xiàn)錯(cuò)誤。這些庫(kù)以提供資源來自動(dòng)識(shí)別涉及預(yù)測(cè)建模的任務(wù)的頂級(jí)機(jī)器學(xué)習(xí)計(jì)劃而聞名。讓我們探索一下最近在研究人員中流行的機(jī)器學(xué)習(xí)項(xiàng)目的十大 AutoML 庫(kù)中的一些。

什么是自動(dòng)機(jī)器學(xué)習(xí)?

術(shù)語(yǔ)“AutoML”是指部分或全部機(jī)器學(xué)習(xí)模型構(gòu)建過程的自動(dòng)化,包括特征選擇和配置、性能指標(biāo)調(diào)整、特征選擇和構(gòu)建、訓(xùn)練多個(gè)模型、評(píng)估模型性能和選擇最佳模型.

在具有多個(gè)預(yù)處理步驟(缺失值插補(bǔ)、縮放、PCA、特征選擇等)的管道中,所有模型和預(yù)處理步驟的超參數(shù),以及在管道內(nèi)集成或堆疊算法的各種方法。

AutoML 考慮了各種機(jī)器學(xué)習(xí)算法(隨機(jī)森林、線性模型、SVM 等)。

采用 AutoML 的好處是它可以自動(dòng)化機(jī)器學(xué)習(xí)過程中參與度最低且最耗時(shí)的組件。它允許數(shù)據(jù)科學(xué)家專注于更具創(chuàng)造性和戰(zhàn)略性的任務(wù),而不是浪費(fèi)時(shí)間自動(dòng)化費(fèi)力但計(jì)算要求高的建模階段。

使用 AutoML 的缺點(diǎn)是自動(dòng)化的特征工程和預(yù)處理可能會(huì)使判斷模型是否過度擬合變得困難。此外,強(qiáng)大的性能不一定來自自動(dòng)化模型訓(xùn)練。

為什么 AutoML 是未來的需要?

從應(yīng)用的角度來看,過去幾年對(duì)機(jī)器學(xué)習(xí)系統(tǒng)的需求急劇增長(zhǎng)。許多不同的應(yīng)用程序都結(jié)合了機(jī)器學(xué)習(xí)。盡管已經(jīng)證明機(jī)器學(xué)習(xí)可以改善對(duì)某些企業(yè)的支持,但許多企業(yè)仍然難以部署 ML 模型。

替代某些人類勞動(dòng)是人工智能的理論目標(biāo)之一。特別是,采用適當(dāng)?shù)乃惴梢詭椭瓿?AI 的很大一部分設(shè)計(jì)工作。以參數(shù)調(diào)整為例,通過利用增加的計(jì)算能力,貝葉斯、NAS 和進(jìn)化編程等算法可以在參數(shù)調(diào)整過程中替代人工。

一個(gè)組織首先需要一個(gè)經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家團(tuán)隊(duì),他們?cè)诓渴?AI 模型之前需要高薪。即使企業(yè)擁有一流的員工,選擇最適合企業(yè)的模型通常也需要比 AI 專業(yè)知識(shí)更多的經(jīng)驗(yàn)。由于機(jī)器學(xué)習(xí)在一系列應(yīng)用中的成功,機(jī)器學(xué)習(xí)系統(tǒng)的需求不斷增長(zhǎng),即使對(duì)于非專家來說也是如此。在最少的人為干預(yù)下,Automl 傾向于盡可能多地自動(dòng)化 ML 管道步驟,同時(shí)保持較高的模型性能。

使用 AutoML 的三個(gè)主要好處是:

自動(dòng)運(yùn)行重復(fù)性雜務(wù)以提高工作效率。因此,數(shù)據(jù)科學(xué)家現(xiàn)在可以更多地關(guān)注問題而不是模型。

自動(dòng)化 ML 管道還有助于防止體力勞動(dòng)帶來的潛在錯(cuò)誤。

AutoML 使任何人都可以使用 ML 功能,這是邁向機(jī)器學(xué)習(xí)民主化的重要一步。

各種 AutoML 平臺(tái)

1.自動(dòng)Sklearn

創(chuàng)建了一個(gè)名為 Auto-Sklearn 的開源 Python 包來自動(dòng)化機(jī)器學(xué)習(xí) (AutoML) 過程。它為一系列分類器、回歸和聚類技術(shù)自動(dòng)進(jìn)行模型選擇和超參數(shù)調(diào)整,這是機(jī)器學(xué)習(xí)中最耗時(shí)但最不令人興奮的部分。Auto-sklearn 實(shí)現(xiàn)了支持向量機(jī) (SVM)、隨機(jī)森林、梯度提升機(jī) (GBM)、k-means 和其他 ML 技術(shù)。

2.AutoKeras

通過一系列高級(jí) Python API,AutoKeras 自動(dòng)化預(yù)處理過程,包括特征提取和縮放。使用 AutoKeras 的好處是可以自動(dòng)執(zhí)行所有困難的機(jī)器學(xué)習(xí)活動(dòng),包括數(shù)據(jù)處理、模型選擇和參數(shù)調(diào)整。

3. 超級(jí)選擇

用于大規(guī)模 AutoML 的開源庫(kù)稱為 HyperOpt。流行的 Scikit-Learn 機(jī)器學(xué)習(xí)庫(kù)由 HyperOpt-Sklearn 支持,它是 HyperOpt 的包裝器。這包括收集數(shù)據(jù)準(zhǔn)備技術(shù)以及分類和回歸方法。

4.數(shù)據(jù)塊

您可以使用 Databricks AutoML 輕松創(chuàng)建基線模型和筆記本。通過使用其 MLlib 庫(kù)(自動(dòng)執(zhí)行特征提取和縮放等預(yù)處理任務(wù)),它實(shí)現(xiàn)了機(jī)器學(xué)習(xí)的自動(dòng)化。使用 Databricks AutoML 的好處是可以自動(dòng)執(zhí)行所有困難的機(jī)器學(xué)習(xí)活動(dòng),包括數(shù)據(jù)處理、模型選擇和參數(shù)調(diào)整。

5.變形金剛

TransmogrifAI 是一個(gè)著名的用于機(jī)器學(xué)習(xí)項(xiàng)目的 AutoML 包,它在 Scala 中構(gòu)建并在 Apache Spark 之上運(yùn)行。通過機(jī)器學(xué)習(xí)自動(dòng)化和 API,它旨在提高機(jī)器學(xué)習(xí)開發(fā)人員在 ML 項(xiàng)目中的生產(chǎn)力。它有助于高效構(gòu)建模塊化和緊密類型的機(jī)器學(xué)習(xí)工作流,以及通過較少的手動(dòng)修改來訓(xùn)練高質(zhì)量的機(jī)器學(xué)習(xí)模型。

6. 盒子

MLBox 具有快速讀取、分布式數(shù)據(jù)準(zhǔn)備或格式化、非常強(qiáng)大的特征選擇和泄漏檢測(cè)、精確的超參數(shù)優(yōu)化以及模型解釋預(yù)測(cè)等功能,是用于機(jī)器學(xué)習(xí)項(xiàng)目的著名 AutoML 包。它專注于超參數(shù)優(yōu)化、實(shí)體嵌入和漂移識(shí)別。

7. H20 自動(dòng)機(jī)器學(xué)習(xí)

用于機(jī)器學(xué)習(xí)應(yīng)用程序的最佳 AutoML 庫(kù)之一是 H20 AutoML,它可以自動(dòng)執(zhí)行迭代建模、超參數(shù)調(diào)整、特征生成和算法選擇。它有助于機(jī)器學(xué)習(xí)模型的無差錯(cuò)訓(xùn)練和評(píng)估。它有望減少對(duì)機(jī)器學(xué)習(xí)知識(shí)的需求,從而提高項(xiàng)目績(jī)效。

8. 自膠子

AutoGluon 是一個(gè)易于使用且易于擴(kuò)展的 AutoML 庫(kù),適用于機(jī)器學(xué)習(xí)項(xiàng)目。它有助于自動(dòng)化堆棧集成、深度學(xué)習(xí)以及跨文本和圖像的真實(shí)應(yīng)用程序。它允許使用幾行代碼快速構(gòu)建深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型的原型,并利用自動(dòng)超參數(shù)調(diào)整。

9. TPOT

TPOT 是一個(gè)著名的 AutoML 包,用于自動(dòng)為需要預(yù)測(cè)建模的工作尋找一流的機(jī)器學(xué)習(xí)模型。它是一個(gè)帶有機(jī)器學(xué)習(xí)模型和 scikit-learn 數(shù)據(jù)準(zhǔn)備框架的開源庫(kù)。它是一個(gè)用于基因修改機(jī)器學(xué)習(xí)過程的 Python AutoML 工具。從數(shù)以千計(jì)的潛在管道中選出最合適的管道用于自動(dòng)化重復(fù)和繁瑣的流程。

10. 自動(dòng) ViML

在龐大的 AutoML 庫(kù)中,機(jī)器學(xué)習(xí)任務(wù)是使用 Auto-ViML 完成的。其目的是使用更少的變量創(chuàng)建高效、可解釋的模型。只需一行代碼,即可自動(dòng)構(gòu)建多個(gè)機(jī)器學(xué)習(xí)項(xiàng)目。這個(gè) AutoML 包具有吸引人的特性,包括 SMOTE、Auto NLP、數(shù)據(jù)時(shí)間變量和特征工程。

11.路德維希

借助直接且適應(yīng)性強(qiáng)的數(shù)據(jù)驅(qū)動(dòng)配置機(jī)制,聲明式機(jī)器學(xué)習(xí)框架 Ludwig 使機(jī)器學(xué)習(xí)管道的設(shè)計(jì)變得簡(jiǎn)單。Linux Foundation AI and Data host Ludwig,可用于廣泛的 AI 活動(dòng)。

輸入和輸出功能以及適當(dāng)?shù)臄?shù)據(jù)類型在配置中聲明。用戶可以指定額外的參數(shù)來預(yù)處理、編碼和解碼特征,從預(yù)訓(xùn)練模型加載數(shù)據(jù),構(gòu)建內(nèi)部模型架構(gòu),調(diào)整訓(xùn)練參數(shù),或執(zhí)行超參數(shù)優(yōu)化。

Ludwig 將使用配置的顯式參數(shù)自動(dòng)創(chuàng)建端到端的機(jī)器學(xué)習(xí)管道,同時(shí)將那些不是的設(shè)置恢復(fù)為智能默認(rèn)值。

12.亞馬遜轉(zhuǎn)錄

通過使用一種稱為自動(dòng)語(yǔ)音識(shí)別 (ASR) 的深度學(xué)習(xí)方法,Amazon Transcribe 使開發(fā)人員可以輕松地將語(yǔ)音轉(zhuǎn)文本功能添加到他們的應(yīng)用程序中。

此外,AWS 還提供 Amazon Transcribe Medical,它使臨床文檔應(yīng)用程序能夠?qū)⑨t(yī)療語(yǔ)音轉(zhuǎn)換為文本。

AutoGluon 專注于自動(dòng)堆棧集成、深度學(xué)習(xí)和涵蓋文本、圖像和表格數(shù)據(jù)的實(shí)際應(yīng)用,提供易于使用和易于擴(kuò)展的 AutoML。

Amazon Transcribe 的主要優(yōu)勢(shì)包括:

創(chuàng)建易于閱讀的轉(zhuǎn)錄

過濾特定字詞

通過自定義轉(zhuǎn)錄提高準(zhǔn)確性

Amazon Transcribe 的一些示例用例是:

客戶體驗(yàn)

通話后分析

臨床談話文件

字幕和字幕工作流程

編目音頻檔案

13.數(shù)據(jù)機(jī)器人

對(duì)于預(yù)測(cè)模型,DataRobot 按需提供自動(dòng)化機(jī)器學(xué)習(xí)。它使用所有可用數(shù)據(jù),自動(dòng)執(zhí)行特征工程、模型選擇和超參數(shù)優(yōu)化,無需重新訓(xùn)練模型。

14. 亞馬遜 Sagemaker 自動(dòng)駕駛儀

Amazon Sagemaker AutoPilot 提供機(jī)器學(xué)習(xí)模型訓(xùn)練和擴(kuò)展的無服務(wù)器和分布式自動(dòng)化。使用這個(gè)完全托管的解決方案,可以在 Amazon ECM 或 Amazon SageMaker 上以任何規(guī)模部署機(jī)器學(xué)習(xí)模型。

15. 谷歌云自動(dòng)機(jī)器學(xué)習(xí)

AutoML 由 Google Cloud 作為云服務(wù)提供。它針對(duì)機(jī)器學(xué)習(xí)問題自動(dòng)化模型構(gòu)建和超參數(shù)調(diào)整,包括情感分析、自然語(yǔ)言處理 (NLP)、圖片分類等。

16. SMAC

SMAC(基于順序模型的算法配置)是一個(gè)用 Python 編寫的 Automl 庫(kù),它可以自動(dòng)訓(xùn)練大量模型(網(wǎng)格搜索)和使用各種行業(yè)標(biāo)準(zhǔn)評(píng)估對(duì)分類或回歸問題模型的性能進(jìn)行評(píng)估指標(biāo),例如準(zhǔn)確性。

17. Azure 自動(dòng)機(jī)器學(xué)習(xí)

Microsoft Azure 的 AutoML 通過使用其獨(dú)特的算法來使用最有效的機(jī)器學(xué)習(xí)算法來配置、訓(xùn)練和評(píng)分模型,從而實(shí)現(xiàn)機(jī)器學(xué)習(xí)的自動(dòng)化。

18.PyCaret

PyCaret 是一個(gè)著名的 Python 機(jī)器學(xué)習(xí)框架,它使用低代碼并且是開源的,用于自動(dòng)化機(jī)器學(xué)習(xí)模型。它是一種廣受歡迎、實(shí)用且成功的模型管理和端到端機(jī)器學(xué)習(xí)解決方案,可提高生產(chǎn)力。這種自動(dòng)化機(jī)器學(xué)習(xí)應(yīng)用程序具有許多不同的功能,例如數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、超參數(shù)調(diào)整、分析和可解釋性。

19. 汽車維卡

這個(gè)數(shù)據(jù)挖掘軟件的名稱是 AutoWeka。Weka 機(jī)器學(xué)習(xí)軟件是其基礎(chǔ)。由于其卓越的可用性和強(qiáng)大的功能,它適合新手和專家。該工具支持使用兩種機(jī)器學(xué)習(xí)技術(shù)(即支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò))快速構(gòu)建預(yù)測(cè)數(shù)據(jù)挖掘模型。

20. 斯普倫克

Splunk 的主要賣點(diǎn)是實(shí)時(shí)處理。您肯定注意到,雖然存儲(chǔ)和 CPU 技術(shù)隨著時(shí)間的推移而進(jìn)步,但數(shù)據(jù)傳輸卻沒有。所以,Splunk 會(huì)解決這個(gè)問題。該平臺(tái)使您能夠?yàn)檫\(yùn)營(yíng)智能創(chuàng)建知識(shí)對(duì)象,在機(jī)器狀態(tài)開始時(shí)接收警報(bào)/事件,并準(zhǔn)確預(yù)測(cè)基礎(chǔ)設(shè)施擴(kuò)展所需的資源。

21.亞馬遜萊克斯

這使您可以開發(fā)具有基于語(yǔ)音或文本的用戶界面并由支持 Amazon Alexa 的相同技術(shù)提供支持的程序。為了在應(yīng)用程序中設(shè)計(jì)、構(gòu)建、測(cè)試和部署對(duì)話界面,完全托管的人工智能 (AI) 服務(wù) Amazon Lex 使用高級(jí)自然語(yǔ)言模型。

22. 大機(jī)器學(xué)習(xí)

BigML 是 AutoML 最著名的解決方案之一,它使公司可以輕松利用一系列機(jī)器學(xué)習(xí)模型和平臺(tái)來推進(jìn)其運(yùn)營(yíng)。這個(gè)自動(dòng)化機(jī)器學(xué)習(xí)軟件提供了一個(gè)完整的平臺(tái)、快速訪問、易于理解和導(dǎo)出的模型、協(xié)作、自動(dòng)化、適應(yīng)性部署以及許多其他功能。

23. 自動(dòng)機(jī)器學(xué)習(xí) JADBio

JADBio AutoML 是一個(gè)著名的 AutoML 系統(tǒng),無需腳本即可提供用戶友好的機(jī)器學(xué)習(xí)。使用此工具,AutoML、研究人員、數(shù)據(jù)科學(xué)家和其他用戶可以成功地與機(jī)器學(xué)習(xí)模型進(jìn)行交互。準(zhǔn)備數(shù)據(jù)進(jìn)行分析、進(jìn)行預(yù)測(cè)分析、學(xué)習(xí)新信息、分析結(jié)果以及部署經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型是使用 AutoML 所需的僅有的五個(gè)過程。

24. 阿基奧

Akkio 是一個(gè)用戶友好的可視化平臺(tái),您可以使用它來增強(qiáng)銷售、營(yíng)銷和財(cái)務(wù)運(yùn)營(yíng)。在不到五分鐘的時(shí)間內(nèi),AI 模型就可以訓(xùn)練好并投入使用。不是顧問。無需安裝任何軟件。沒有與銷售相關(guān)的對(duì)話。以前的 AI 經(jīng)驗(yàn)不是必需的。

25. MLJAR

它是與 Mercury 交換 Python Notebooks 并使用 MLJAR AutoML 獲得最佳結(jié)果的最佳 AutoML 工具之一。對(duì)于表格數(shù)據(jù),可以使用最復(fù)雜的自動(dòng)化機(jī)器學(xué)習(xí)算法。由于其全面的特征工程、算法選擇和修改、自動(dòng)文檔和 ML 解釋,它使構(gòu)建廣泛的機(jī)器學(xué)習(xí)管道變得更加容易。MLJAR AutoML 框架眾所周知,因?yàn)樗兴姆N內(nèi)置模式。

26. 踏子愛

Tazi.ai 是一個(gè)著名的可用于實(shí)時(shí)數(shù)據(jù)的連續(xù)機(jī)器學(xué)習(xí) AutoML 產(chǎn)品。允許業(yè)務(wù)領(lǐng)域?qū)<覒?yīng)用機(jī)器學(xué)習(xí)以生成預(yù)測(cè)是有利的。AutoML 應(yīng)用程序使用監(jiān)督、非監(jiān)督和半監(jiān)督機(jī)器學(xué)習(xí)模型。

27.增強(qiáng)器

Enhencer 是一個(gè) AutoML 平臺(tái),非常強(qiáng)調(diào)可用性和開放性。其尖端的用戶界面使快速開發(fā)機(jī)器學(xué)習(xí)模型成為可能。Enhencer 提供透明的性能指標(biāo),便于評(píng)估和微調(diào)模型性能。此外,Enhencer 接口允許隨著時(shí)間的推移跟蹤模型性能。

28.艾布爾

Aible 以直接、快速和安全的方式開發(fā)對(duì)業(yè)務(wù)具有明顯影響的人工智能。當(dāng) AI 針對(duì)業(yè)務(wù)效果而非準(zhǔn)確性進(jìn)行訓(xùn)練時(shí),商業(yè)人士會(huì)根據(jù)他們實(shí)際的成本效益權(quán)衡和資源限制來構(gòu)建 AI。Aible 處理剩下的事情,從數(shù)據(jù)到影響,只需要回答三個(gè)業(yè)務(wù)問題。

29. 點(diǎn)數(shù)據(jù)

在機(jī)器學(xué)習(xí)公司中獨(dú)一無二的 dotData 建立在一個(gè)大膽的理念之上,即如果數(shù)據(jù)科學(xué)可以盡可能簡(jiǎn)單,任何人都可以從中獲益。DotData 是在著名數(shù)據(jù)科學(xué)家、NEC 119 年歷史上最年輕的研究員 Ryohei Fujimaki 博士的指導(dǎo)下建立的。企業(yè)尊重客戶并努力為他們提供自動(dòng)化機(jī)器學(xué)習(xí) (AutoML) 的最佳價(jià)值。DotData 是第一家使用機(jī)器學(xué)習(xí)為企業(yè)提供完整的數(shù)據(jù)科學(xué)自動(dòng)化的公司。通過自動(dòng)化加速、民主化和操作整個(gè)數(shù)據(jù)科學(xué)流程,其數(shù)據(jù)科學(xué)自動(dòng)化平臺(tái)縮短了實(shí)現(xiàn)價(jià)值的時(shí)間。

30. 機(jī)器人

基于 Python 的魯棒貝葉斯優(yōu)化系統(tǒng)。Robo 的基本構(gòu)建塊是一個(gè)模塊化架構(gòu),可以輕松添加和更換貝葉斯優(yōu)化組件,如各種采集函數(shù)或回歸模型。

它包括一系列不同的獲取函數(shù),例如預(yù)測(cè)改進(jìn)、改進(jìn)可能性、置信下限或信息增益,以及各種回歸模型,例如高斯過程、隨機(jī)森林或貝葉斯神經(jīng)網(wǎng)絡(luò)。

31. 自動(dòng)對(duì)開

選擇最佳選擇策略及其超參數(shù)允許 AutoFolio 最大化算法選擇系統(tǒng)的性能。

算法選擇 (AS) 策略需要從預(yù)期最有效地解決特定問題實(shí)例的算法組中選擇算法,在解決許多眾所周知的 AI 挑戰(zhàn)方面顯著推進(jìn)了最新技術(shù)水平。

32. 活頁(yè)夾

Flexfolio 是一種基于投資組合的模塊化和開放式求解器架構(gòu),其中包含多種基于投資組合的算法選擇方法和策略。它提供了一個(gè)特殊的框架,用于將幾種基于投資組合的算法選擇方法和方法進(jìn)行對(duì)比并將其集成到一個(gè)單一的、有凝聚力的框架中。

33. 數(shù)據(jù)庫(kù)

Dataiku 是一個(gè)將數(shù)據(jù)和人工智能的使用系統(tǒng)化的平臺(tái)。它的目標(biāo)是整合人工智能和數(shù)據(jù),使其成為日常運(yùn)營(yíng)不可或缺的一部分。他們專門針對(duì)企業(yè)、技術(shù)專業(yè)人員(如分析師)和業(yè)務(wù)專家(如工程師、架構(gòu)師和數(shù)據(jù)科學(xué)家)。缺乏數(shù)據(jù)科學(xué)經(jīng)驗(yàn)的用戶可能不是 Dataiku 的最佳人選,因?yàn)槌晒κ褂迷撈脚_(tái)的功能可能需要相當(dāng)多的技術(shù)專長(zhǎng)。

34. 創(chuàng)建ML

Apple 提供了一種名為 CreateML 的無代碼機(jī)器學(xué)習(xí)工具,可讓您直接在 Mac 上開發(fā)、訓(xùn)練和部署模型。用戶可以通過使用 CreateML 顯著減少訓(xùn)練和部署 ML 模型所需的時(shí)間,并在很短的時(shí)間內(nèi)完成。由于該工具的拖放功能,模型構(gòu)建現(xiàn)在變得更加簡(jiǎn)單和方便。用戶可以開發(fā)和使用模型來執(zhí)行任務(wù),包括從文本中提取含義、識(shí)別噪聲、識(shí)別視頻中的活動(dòng)以及識(shí)別圖像。

35.Prevision.io

Prevision.io 是一個(gè)人工智能 (AI) 平臺(tái),旨在幫助數(shù)據(jù)科學(xué)家和開發(fā)人員快速輕松地構(gòu)建、部署、監(jiān)控和管理模型,以便更多的數(shù)據(jù)科學(xué)項(xiàng)目可以快速投入生產(chǎn)。由于其功能和清晰的用戶界面,用戶可以在幾分鐘內(nèi)設(shè)置平臺(tái)。該平臺(tái)可在 Google Cloud Marketplace 上使用,并采用即用即付許可模式。

36.顯然.ai

明顯地。AI 是一種無代碼 AutoML 工具,可以輕松創(chuàng)建和維護(hù)預(yù)測(cè)性機(jī)器學(xué)習(xí)模型。由于該工具的無代碼功能,企業(yè)用戶、公民數(shù)據(jù)科學(xué)家和基本上任何其他人都可以在不編寫一行代碼的情況下開始進(jìn)行預(yù)測(cè)。數(shù)據(jù)科學(xué)技能匱乏的問題已通過 Obviously.ai 的解決方案得到解決。即使公司沒有重要的數(shù)據(jù)科學(xué)團(tuán)隊(duì),他們?nèi)匀豢梢允褂?ML 進(jìn)行預(yù)測(cè)分析。

37. 人工智能和分析引擎

它是一個(gè)端到端的無代碼 AutoML 平臺(tái),稱為 AI 和分析引擎。該引擎無需花費(fèi)數(shù)天或數(shù)周時(shí)間,而是加快了從原始數(shù)據(jù)到消費(fèi)者模型部署的過程。通過在每個(gè)階段提供簡(jiǎn)單的 AI 指導(dǎo)建議,該平臺(tái)使任何用戶,無論其機(jī)器學(xué)習(xí)能力如何,都能夠構(gòu)建和部署模型。該引擎面向范圍廣泛的用戶,從個(gè)人和團(tuán)體到企業(yè)。因此,有訂閱定價(jià)計(jì)劃來適應(yīng)每個(gè)級(jí)別的使用。

38.食譜

另一個(gè)構(gòu)建在 Scikit-Learn 之上的有趣的 AutoML 工具是 RECIPE 或 REsilient ClassifIcation Pipeline Evolution。它從其他進(jìn)化框架中脫穎而出,因?yàn)樗梢员苊猱a(chǎn)生無效的個(gè)體,并將大量可能有用的數(shù)據(jù)預(yù)處理和分類技術(shù)組織成一個(gè)語(yǔ)法。RECIPE 使用遺傳編程來發(fā)展具有上下文無關(guān)語(yǔ)法定義的管道,可以實(shí)現(xiàn)更高水平的靈活性。

39. 自動(dòng)目標(biāo)

一個(gè)名為 AutoGOAL 的 Python 包可以自動(dòng)確定完成任務(wù)的最有效方法。它主要是為 AutoML 創(chuàng)建的,用于開發(fā)人員有多種選擇來完成任務(wù)的各種情況。它已經(jīng)有幾個(gè)低級(jí)機(jī)器學(xué)習(xí)算法,可以自動(dòng)組合到管道中以解決各種問題。

它用作程序綜合的框架,程序綜合是選擇最佳程序來解決特定問題的過程。用戶必須能夠指定所有潛在程序的空間才能運(yùn)行。ML 程序員會(huì)喜歡這個(gè)額外的 AutoML 工具箱,因?yàn)樗峁┝舜祟惞ぞ咄ǔ2痪邆涞亩喙δ苄浴?/p>

40. 快速礦工

RapidMiner 的機(jī)器學(xué)習(xí)技術(shù)可以顯著減少為任何不關(guān)心部門、資產(chǎn)或估計(jì)的協(xié)會(huì)或組織開發(fā)預(yù)測(cè)模型所需的時(shí)間和工作。

使用自動(dòng)模型,可以在大約五分鐘內(nèi)生成預(yù)測(cè)模型。它不需要任何特定的專業(yè)知識(shí)。客戶可以輕松傳輸他們的數(shù)據(jù)并確定他們需要的結(jié)果。

屆時(shí),Auto Model 將產(chǎn)生高評(píng)價(jià)的體驗(yàn)。計(jì)算機(jī)化的數(shù)據(jù)科學(xué)可以用 RapidMiner Auto Model 完成。分析和顯示數(shù)據(jù)是其中的一部分。

41.改變

通過一系列軟件解決方案,Alteryx 提供數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)功能。該自助服務(wù)平臺(tái)擁有 260 多個(gè)拖放式構(gòu)建組件,其中最突出的特點(diǎn)是 Alteryx Designer。Alteryx Designer 可自動(dòng)執(zhí)行數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)混合、報(bào)告、預(yù)測(cè)分析和數(shù)據(jù)科學(xué)。Alteryx 的用戶可以輕松地選擇和比較各種算法的性能,并立即看到變量關(guān)系和分布。該軟件可以在托管環(huán)境、云中、您自己的防火墻后面或兩者中設(shè)置,無需任何編碼知識(shí)。

42. IBM 沃森工作室

用戶可以使用 IBM Watson Studio 在任何云上大規(guī)模創(chuàng)建、運(yùn)行和管理 AI 模型。該項(xiàng)目是 IBM Cloud Pak for Data 的一個(gè)組件,IBM Cloud Pak for Data 是該組織的 AI 和數(shù)據(jù)核心平臺(tái)。該解決方案使您能夠管理和保護(hù)開源筆記本、通過一鍵集成部署和執(zhí)行模型、可視化地準(zhǔn)備和構(gòu)建模型、通過可解釋的 AI 管理和監(jiān)控模型以及自動(dòng)化 AI 生命周期管理。由于軟件提供的靈活架構(gòu),IBM Watson Studio 的用戶可以使用 PyTorch、TensorFlow 和 sci-kit-learn 等開源框架。

43. 尼姆

用于數(shù)據(jù)科學(xué)開發(fā)的開源平臺(tái)是 KNIME Analytics。它提供了一個(gè)圖形化的拖放界面,無需腳本即可構(gòu)建可視化工作流。為了設(shè)計(jì)工作流、為分析的每個(gè)階段建模、調(diào)節(jié)數(shù)據(jù)流并保證工作是最新的,用戶可以從 2000 多個(gè)節(jié)點(diǎn)中進(jìn)行選擇。為了生成統(tǒng)計(jì)數(shù)據(jù)、清理數(shù)據(jù)以及提取和選擇特征,KNIME 可以組合來自任何來源的數(shù)據(jù)。該軟件使用人工智能和機(jī)器學(xué)習(xí),使用傳統(tǒng)圖表和前沿圖表可視化數(shù)據(jù)。

44. MathWorks 軟件

MathWorks MATLAB 將原生表達(dá)矩陣和數(shù)組數(shù)學(xué)的編程語(yǔ)言與針對(duì)迭代分析和設(shè)計(jì)過程優(yōu)化的桌面環(huán)境相結(jié)合。為了在可執(zhí)行筆記本中編寫混合代碼、輸出和格式化文本的腳本,它附帶了實(shí)時(shí)編輯器。專業(yè)創(chuàng)建、全面審查和測(cè)試的 MATLAB 工具箱。您還可以使用 MATLAB 程序使用您的數(shù)據(jù)測(cè)試各種算法。

45.TIBCO

對(duì)于現(xiàn)代 BI、描述性和預(yù)測(cè)性分析、流分析和數(shù)據(jù)科學(xué),TIBCO 提供了廣泛的產(chǎn)品。用戶可以使用 TIBCO Data Science 準(zhǔn)備數(shù)據(jù)、構(gòu)建模型、部署這些模型并監(jiān)控它們。此外,它還嵌入了 Jupyter 筆記本,用于共享可重復(fù)使用的模塊、拖放式工作流和 AutoML。用戶可以在 TIBCO 的 Spotfire Analytics 上運(yùn)行工作流程時(shí),使用 TensorFlow、SageMaker、Rekognition 和 Cognitive Services 編排開源。

46. 螺旋鉆

俄歇。最精確的 AutoML 平臺(tái)是 AI。通過 Auger 專有的基于貝葉斯優(yōu)化的算法/超參數(shù)組合搜索,可以更快地開發(fā)預(yù)測(cè)模型。得益于開源 A2ML 項(xiàng)目(Auger、Google Cloud AutoML 或 Microsoft Azure AutoML),開發(fā)人員可以利用任何基于云的 AutoML 提供商創(chuàng)建預(yù)測(cè)模型。Auger 的機(jī)器學(xué)習(xí)審查和監(jiān)控 (MLRAM) 工具可確保在 Auger 或任何其他機(jī)器學(xué)習(xí)平臺(tái)上開發(fā)的訓(xùn)練有素的預(yù)測(cè)模型的持續(xù)準(zhǔn)確性。

47.亞馬遜波莉

它是一種從文本中模擬語(yǔ)音的服務(wù)。利用深度學(xué)習(xí)的力量有助于創(chuàng)建新的語(yǔ)音商品類別,并有助于開發(fā)會(huì)說話的應(yīng)用程序。此外,它代表了為殘障人士創(chuàng)建包容性應(yīng)用程序方面的重大進(jìn)步。

在其他語(yǔ)言中,Polly 主要支持英語(yǔ)、普通話、巴西葡萄牙語(yǔ)、丹麥語(yǔ)、法語(yǔ)、日語(yǔ)、韓語(yǔ)和丹麥語(yǔ)。

Polly 的神經(jīng)文本轉(zhuǎn)語(yǔ)音 (TTS) 支持兩種說話時(shí)態(tài)-

新聞閱讀器風(fēng)格的新聞敘述用例。

電話和會(huì)話風(fēng)格等雙向應(yīng)用的理想選擇。

此外,它還提供 Amazon Polly Brand,使企業(yè)能夠設(shè)計(jì)自己的聲音。

FICO、今日美國(guó)、ProQuest、CBSi、Whooshkaa、MapBox 等公司使用 Amazon Polly Brand。

48.對(duì)話流

使用 Dialogflow(一個(gè)用于創(chuàng)建語(yǔ)言和視覺機(jī)器人的平臺(tái)),可以設(shè)計(jì)對(duì)話用戶界面并將其集成到移動(dòng)應(yīng)用程序、Web 應(yīng)用程序和交互式語(yǔ)音響應(yīng)系統(tǒng)中。該技術(shù)可以分析各種輸入,包括文本和音頻數(shù)據(jù)。

下面列出的術(shù)語(yǔ)用于 Dialogflow 環(huán)境:

代理:管理與最終用戶通信的虛擬代理稱為代理。

意圖:最終目標(biāo)用戶的交流反映在他們的意圖中。每個(gè)代理可能有許多意圖,這些意圖組合起來形成對(duì)話。Dialogflow 意圖執(zhí)行意圖分類任務(wù),將最終用戶表達(dá)與定義的代理的最佳感覺相匹配。

父意圖自動(dòng)接收上下文,后續(xù)意圖接收具有相同名稱的輸入上下文。

實(shí)體:每個(gè)意圖參數(shù)都存在一個(gè)名為 Entity 的類型,它提取最終用戶表達(dá)式。

上下文:對(duì)話流可以由 Dialogflow 中的上下文管理。

后續(xù)意圖:后續(xù)意圖是它所連接的父級(jí)意圖的子級(jí)。建立后續(xù)意圖時(shí),會(huì)自動(dòng)將具有相同名稱的輸入上下文添加到父意圖,并且將具有相同名稱的輸出上下文添加到后續(xù)意圖。

對(duì)話流控制臺(tái):用于管理 Dialogflow 代理的基于 Web 的用戶界面是 Dialogflow 控制臺(tái)。

Dialogflow 的示例用例:

聊天機(jī)器人——可以配置為接收請(qǐng)求、設(shè)置約會(huì)、訪問訂單和響應(yīng)查詢的界面。

物聯(lián)網(wǎng) (IoT) —它可用于提高對(duì)上下文的理解和 IoT 設(shè)備響應(yīng)的準(zhǔn)確性。

49. 亞馬遜識(shí)別

在照片和視頻中,Amazon Rekognition 可能有助于識(shí)別物體、人物、場(chǎng)景、文本和活動(dòng),并標(biāo)記任何令人反感的內(nèi)容。此外,它還提供精確的面部分析和搜索功能,以查找、檢查和對(duì)比面部以進(jìn)行用戶身份驗(yàn)證工作。

使用 Amazon Rekognition 有幾個(gè)優(yōu)勢(shì):

它提供標(biāo)簽來區(qū)分自行車、電話、建筑物等物體以及停車場(chǎng)、海灘和城市等風(fēng)景。

自定義標(biāo)簽增加了可以檢測(cè)到的事物的數(shù)量。

內(nèi)容審查

文字識(shí)別

人臉識(shí)別與評(píng)估

人臉驗(yàn)證和搜索

Amazon Rekognition 被一些大公司使用,包括 NFL、CBS、國(guó)家地理、Marinus Analytics 和 SkyNews。

50.亞馬遜理解

為了揭示文本中的模式和聯(lián)系,Amazon Comprehend 使用機(jī)器學(xué)習(xí)進(jìn)行自然語(yǔ)言處理 (NLP)。

這些技術(shù)利用機(jī)器學(xué)習(xí)來揭示非結(jié)構(gòu)化數(shù)據(jù)中的模式和聯(lián)系。該服務(wù)識(shí)別句子的語(yǔ)言并提取重要的單詞、短語(yǔ)、名稱、組織或事件。

為了發(fā)現(xiàn)醫(yī)學(xué)問題、藥物和藥物開發(fā),Amazon Comprehend Medical 經(jīng)常被用來提取醫(yī)學(xué)語(yǔ)料庫(kù)信息。

Amazon Comprehend 的一些用例:

呼叫中心分析

索引和搜索產(chǎn)品評(píng)論

網(wǎng)站上的個(gè)性化內(nèi)容

客戶支持工單處理

臨床試驗(yàn)招募

LexisNexis、TeraDACT、FINRA 和 Vidmob 等公司使用 Amazon Comprehend。

AutoML 會(huì)取代數(shù)據(jù)科學(xué)家嗎?

不,是答案。

盡管 AutoML 擅長(zhǎng)創(chuàng)建模型,但它們?nèi)匀粺o法處理數(shù)據(jù)科學(xué)家的大部分任務(wù)。要定義業(yè)務(wù)關(guān)注點(diǎn),仍然需要數(shù)據(jù)科學(xué)家。為了創(chuàng)建更有用的功能,數(shù)據(jù)科學(xué)家仍然需要運(yùn)用他們的主題專業(yè)知識(shí)。如今,autoML 只能處理一小部分問題,例如分類和回歸問題。他們目前無法創(chuàng)建推薦和排名模型。最重要的是,單獨(dú)使用 AutoML 不會(huì)從數(shù)據(jù)中產(chǎn)生有用的見解;仍然需要數(shù)據(jù)科學(xué)家。

盡管如此,AutoML 仍然是數(shù)據(jù)科學(xué)家為其利益相關(guān)者創(chuàng)造價(jià)值的有效工具。因此,下一個(gè)邏輯查詢是:

我們應(yīng)該如何以及何時(shí)使用 AutoML?

數(shù)據(jù)科學(xué)家什么時(shí)候可以利用 AutoML 平臺(tái)發(fā)揮自己的優(yōu)勢(shì)?

在這里,我想列出一些可能值得的實(shí)例。

性能優(yōu)先于可解釋性:在其他情況下,利益相關(guān)者可能只對(duì)模型的準(zhǔn)確性感興趣,而可解釋性可能不是最重要的因素。根據(jù)我們的測(cè)試,AutoML 與適當(dāng)?shù)奶卣鞴こ滔嘟Y(jié)合時(shí)似乎可以產(chǎn)生令人滿意的性能。然而,我們案例中的可解釋性僅適用于對(duì)兩個(gè)平臺(tái)都至關(guān)重要的功能。換句話說,如果特征重要性足以滿足您的情況,AutoML 可能是提高精度的最佳選擇。

快速部署到生產(chǎn)中:您可以使用 Google 和 Azure 輕松地將模型部署到生產(chǎn)中。例如,批量預(yù)測(cè)和在線預(yù)測(cè)都可以通過谷歌云輕松訪問。您還可以使用他們的 API 將您的模型部署到您的網(wǎng)站。這些特性可以幫助數(shù)據(jù)科學(xué)家更快、更省力地完成工作。

更好的時(shí)間管理:數(shù)據(jù)科學(xué)家面臨著無數(shù)可能令人筋疲力盡的職責(zé)。作為數(shù)據(jù)科學(xué)家,時(shí)間可能是您最有限的資源。你的日子充滿了與利益相關(guān)者(產(chǎn)品經(jīng)理、業(yè)務(wù)部門的員工和客戶)的幾次會(huì)議、當(dāng)前模型的維護(hù)、數(shù)據(jù)的收集和清理、為下次會(huì)議做準(zhǔn)備等等。AutoML 可以成為一個(gè)非常棒的省時(shí)工具,因?yàn)樗恍椟c(diǎn)擊幾下并花費(fèi)幾美元來訓(xùn)練一個(gè)性能良好的模型。因此,您可以專注于最有益的活動(dòng)(有時(shí),花時(shí)間創(chuàng)建出色的演示文稿比將模型的準(zhǔn)確性提高 1% 更有價(jià)值)。

結(jié)論

我希望您通過本文對(duì) AutoML 背后的概念有所了解。AutoML 的主要目標(biāo)是釋放數(shù)據(jù)科學(xué)家的時(shí)間,以便他們可以通過自動(dòng)化重復(fù)性任務(wù)(如管道創(chuàng)建和超參數(shù)調(diào)整)來專注于實(shí)際業(yè)務(wù)問題。此外,AutoML 使每個(gè)人,而不僅僅是少數(shù)人,都能使用機(jī)器學(xué)習(xí)技術(shù)。使用 AutoML 構(gòu)建極其有效的機(jī)器學(xué)習(xí)的數(shù)據(jù)科學(xué)家可以加速 ML 的開發(fā)。

成功或失敗將取決于 AutoML 的使用方式以及機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展方式。然而,AutoML 無疑將在機(jī)器學(xué)習(xí)的未來發(fā)揮重要作用。

猜你喜歡