Scikit-learn 是一個機器學習庫,提供了各種機器學習算法的工具,包括分類、回歸、集群、降維、模型選擇和預處理等。使用 Scikit-learn 可以快速而有效地建構機器學習模型,並對數據進行分析和預測。
在進行機器學習任務之前,首先需要安裝 Scikit-learn。您可以通過 pip 安裝 Scikit-learn,使用以下命令:
pip install scikit-learn
安裝完成後,您就可以開始使用 Scikit-learn 了。以下是一個簡單的 Scikit-learn 範例,展示了如何使用 Scikit-learn 進行分類:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# 加載數據集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 將數據集分為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 創建 KNN 分類器
clf = KNeighborsClassifier(n_neighbors=3)
# 在訓練集上訓練模型
clf.fit(X_train, y_train)
# 在測試集上進行預測
y_pred = clf.predict(X_test)
# 評估模型性能
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: %.2f" % accuracy)
在這個範例中,我們首先使用 datasets.load_iris()
方法加載了一個經典的鳶尾花數據集。然後我們將數據集分為訓練集和測試集,接著創建了一個 KNN 分類器並在訓練集上進行訓練。最後我們使用測試集進行預測,並通過 accuracy_score()
函數計算了模型的準確率。
這只是一個簡單的 Scikit-learn 範例,Scikit-learn 還提供了許多其他功能和模型,例如支持向量機、決策樹、隨機森林、神經網絡等。如果您想了解更多關於 Scikit-learn 的用法,可以參考官方文檔:https://scikit-learn.org/stable/documentation.html。祝您在機器學習的道路上成功!