在兩行Python程式碼中應用 40 個機器學習模型

語言: CN / TW / HK

我們將使用lazypredict庫,它允許我們只用一行程式碼在我們的資料集上實現許多機器學習模型,本文將演示lazypredict的快速使用。

步驟1、使用以下命令安裝lazypredict 庫:

pip install lazypredict

步驟2、匯入pandas庫,以載入我們的機器學習資料集。

資料集連結:https ://raw.githubusercontent.com/tirthajyoti/Machine-Learning-with-Python/master/Datasets/Mall_Customers.csv

import pandas as pd
df=pd.read_csv("Mall_Customers.csv")

步驟3、檢視機器學習資料集前幾行。

df.head()

步驟4、拆分訓練集和測試集。這裡 Y 變數是 Spending Score 列,而其餘列是 X 變數。

from sklearn.model_selection import train_test_split
x=df.loc[:,df.columns!='Spending Score (1-100)']
y=df['Spending Score (1-100)']


x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3)

步驟5、讓我們匯入之前安裝的lazypredict庫,lazypredict裡面有兩個類,一個是Classification類,一個是Regression類。

import lazypredict
from lazypredict.Supervised import LazyRegressor
from lazypredict.Supervised import LazyClassifier

匯入後,我們將使用 LazyRegressor,因為我們正在處理迴歸問題,如果您處理的分類問題,這兩種型別的問題都需要類似的步驟。

multiple_ML_model=LazyRegressor(verbose=0,ignore_warnings=True,predictions=True)
models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)

在這裡,prediction = True意味著您想要獲得每個模型的準確性並想要對每個模型進行預測。

模型的變數包含每個模型的準確度,以及其他一些重要的資訊。

models

如您所見,它已經在我的迴歸問題上實現了42 個 機器學習模型,本指南更側重於如何測試許多模型而不是提高它們的準確性。

檢視每個機器學習模型的預測如下:

predictions

您可以使用這些預測來建立混淆矩陣。

如果您正在處理分類問題,這就是您使用lazypredict 庫的方式。

multiple_ML_model=LazyClassifier(verbose=0,ignore_warnings=True,predictions=True)
models,predictions=multiple_ML_model.fit(x_train,x_test,y_train,y_test)

要記住的關鍵點:

  1. 該庫僅用於測試目的,為您提供有關哪種模型在您的資料集上表現良好的資訊。
  2. 因為我將要使用的庫需要的是特定版本,所以建議使用一個單獨環境。