【机器学习】微软出品!FLAML:一款可以自动化机器学习过程的神器!
機器學習是我們使用一組算法解決來解決生活中問題的過程。創建機器學習模型很容易,但選擇在泛化和性能方面都最適合的模型是一項艱巨的任務。
有多種機器學習算法可用于回歸和分類,可根據我們要解決的問題來選擇,但選擇合適的模型是一個需要高計算成本、時間和精力的過程。
為解決上述問題,今天我給大家分享一款非常棒的工具包:FLAML,它是一個由微軟開源的輕量級 Python 庫,有助于自動、高效地找出最佳機器學習模型,不僅速度快,節省時間,而且設計輕巧。
讓我們詳細的介紹一下它吧…
安裝所需的庫
我們將首先使用 pip 安裝來安裝 FLAML。下面給出的命令將使用 pip 安裝。
pip?install?flaml導入所需的庫
在這一步中,我們將導入創建機器學習模型和下載數據集所需的所有庫。
from?flaml?import?AutoML解決分類問題
現在我們將從解決分類問題開始。我們將在這里使用的數據是著名的 Iris 數據集,可以從 Seaborn 庫輕松加載。讓我們開始創建模型。
#Loading?the?Dataset from?sklearn.datasets?import?load_iris為 Automl 創建實例很重要,同時也定義 Automl 設置,因此在這一步中,我們還將創建 Automl 實例并定義設置。
automl?=?AutoML() automl_settings?=?{"time_budget":?10,??#?in?seconds"metric":?'accuracy',"task":?'classification' }接下來,我們將拆分數據并將其擬合到模型中。最后,我們還將使用模型進行預測并找到最佳模型。
X_train,?y_train?=?load_iris(return_X_y=True) #?Train?with?labeled?input?data automl.fit(X_train=X_train,?y_train=y_train,**automl_settings) print(automl.predict_proba(X_train).shape) #?Export?the?best?model print(automl.model)在這里,我們可以清楚地看到 ExtraTreeEstimator 是此數據的最佳模型。現在讓我們打印模型的最佳超參數和準確性。
print('Best?ML?leaner:',?automl.best_estimator) print('Best?hyperparmeter?config:',?automl.best_config) print('Best?accuracy?on?validation?data:?{0:.4g}'.format(1-automl.best_loss)) print('Training?duration?of?best?run:?{0:.4g}?s'.format(automl.best_config_train_time))同樣,對于回歸問題,我們也將遵循相同的過程。
解決回歸問題
現在將解決一個回歸問題。我們將在這里使用的數據是著名的波士頓數據集,可以從 Seaborn 庫輕松加載。我們可以遵循與分類問題完全相同的過程。
from?sklearn.datasets?import?load_bostonautoml?=?AutoML()automl_settings?=?{"time_budget":?10,??#?in?seconds"metric":?'r2',"task":?'regression' } X_train,?y_train?=?load_boston(return_X_y=True) #?Train?with?labeled?input?data automl.fit(X_train=X_train,?y_train=y_train,**automl_settings) #?Predict print(automl.predict(X_train).shape) #?Export?the?best?model print(automl.model)print('Best?ML?leaner:',?automl.best_estimator) print('Best?hyperparmeter?config:',?automl.best_config) print('Best?accuracy?on?validation?data:?{0:.4g}'.format(1-automl.best_loss)) print('Training?duration?of?best?run:?{0:.4g}?s'.format(automl.best_config_train_time))在這里,我們也可以清楚地看到回歸問題的最佳模型和超參數。同樣,你可以對你關注的數據集執行此過程,并找到最佳模型和超參數。
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯黃海廣老師《機器學習課程》視頻課本站qq群851320808,加入微信群請掃碼:
總結
以上是生活随笔為你收集整理的【机器学习】微软出品!FLAML:一款可以自动化机器学习过程的神器!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在Android实现录屏直播
- 下一篇: 【NLP】保姆级教程:手把手带你CNN文