在兩行Python程式碼中應用 40 個機器學習模型
我們將使用lazypredict庫,它允許我們只用一行程式碼在我們的資料集上實現許多機器學習模型,本文將演示lazypredict的快速使用。
步驟1、使用以下命令安裝lazypredict 庫:
pip install lazypredict
步驟2、匯入pandas庫,以載入我們的機器學習資料集。
資料集連結:https ://raw.githubusercontent.com/tirthajyoti/Machine-Learning-with-Python/master/Datasets/Mall_Customers.csv
import pandas as pd df=pd.read_csv("Mall_Customers.csv")
步驟3、檢視機器學習資料集前幾行。
df.head()
步驟4、拆分訓練集和測試集。這裡 Y 變數是 Spending Score 列,而其餘列是 X 變數。
from sklearn.model_selection import train_test_split x=df.loc[:,df.columns!='Spending Score (1-100)'] y=df['Spending Score (1-100)'] x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3)
步驟5、讓我們匯入之前安裝的lazypredict庫,lazypredict裡面有兩個類,一個是Classification類,一個是Regression類。
import lazypredict from lazypredict.Supervised import LazyRegressor from lazypredict.Supervised import LazyClassifier
匯入後,我們將使用 LazyRegressor,因為我們正在處理迴歸問題,如果您處理的分類問題,這兩種型別的問題都需要類似的步驟。
multiple_ML_model=LazyRegressor(verbose=0,ignore_warnings=True,predictions=True) models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)
在這裡,prediction = True意味著您想要獲得每個模型的準確性並想要對每個模型進行預測。
模型的變數包含每個模型的準確度,以及其他一些重要的資訊。
models
如您所見,它已經在我的迴歸問題上實現了42 個 機器學習模型,本指南更側重於如何測試許多模型而不是提高它們的準確性。
檢視每個機器學習模型的預測如下:
predictions
您可以使用這些預測來建立混淆矩陣。
如果您正在處理分類問題,這就是您使用lazypredict 庫的方式。
multiple_ML_model=LazyClassifier(verbose=0,ignore_warnings=True,predictions=True) models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)
要記住的關鍵點:
- 該庫僅用於測試目的,為您提供有關哪種模型在您的資料集上表現良好的資訊。
- 因為我將要使用的庫需要的是特定版本,所以建議使用一個單獨環境。
「其他文章」
- Spring中實現非同步呼叫的方式有哪些?
- 帶引數的全型別 Python 裝飾器
- 整理了幾個Python正則表示式,拿走就能用!
- 設計模式之狀態模式
- 如何實現資料庫讀一致性
- SOLID:開閉原則Go程式碼實戰
- React中如何引入CSS呢
- 慢查詢 MySQL 定位優化技巧,從10s優化到300ms
- 一個新視角:前端框架們都卷錯方向了?
- 編碼中的Adapter,不僅是一種設計模式,更是一種架構理念與解決方案
- 手寫程式語言-遞迴函式是如何實現的?
- 一文搞懂模糊匹配:定義、過程與技術
- 新來個阿里 P7,僅花 2 小時,做出一個多執行緒永動任務,看完直接跪了
- Puzzlescript,一種開發H5益智遊戲的引擎
- @Autowired和@Resource到底什麼區別,你明白了嗎?
- “四招”守護個人資訊保安
- CSS transition 小技巧!如何保留 hover 的狀態?
- React如此受歡迎離不開這4個主要原則
- 我是怎麼入行做風控的
- 重溫三十年前對於 NN 的批判:神經網路無法實現可解釋 AI