Então, você está interessado em aprender Machine Learning com Scikit-learn? Ótimo! Neste tutorial, vou te ensinar como criar 3 projetos práticos de Machine Learning usando a biblioteca Scikit-learn, ideal para iniciantes.
Antes de começarmos, certifique-se de que você tenha Python instalado em seu computador, pois Scikit-learn é uma biblioteca Python. Se ainda não tiver, você pode baixá-lo em python.org.
Agora, vamos aos projetos:
Projeto 1: Classificação de flores usando o dataset Iris
- Crie um novo arquivo Python e importe as bibliotecas necessárias:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
- Carregue o dataset Iris e divida os dados em treino e teste:
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
- Treine um modelo de classificação KNN e avalie sua precisão:
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
predictions = knn.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f'A precisão do modelo é: {accuracy}')
Projeto 2: Previsão de preço de casas usando o dataset Boston
- Importe as bibliotecas necessárias:
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
- Carregue o dataset Boston e divida os dados em treino e teste:
boston = load_boston()
X = boston.data
y = boston.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
- Treine um modelo de regressão linear e avalie seu desempenho com o erro médio quadrado:
lr = LinearRegression()
lr.fit(X_train, y_train)
predictions = lr.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f'O erro médio quadrado do modelo é: {mse}')
Projeto 3: Detecção de fraude em transações financeiras usando o dataset Credit Card Fraud Detection
- Importe as bibliotecas necessárias:
from sklearn.ensemble import IsolationForest
from sklearn.metrics import confusion_matrix
- Carregue o dataset Credit Card Fraud Detection e divida os dados em treino e teste:
data = pd.read_csv('creditcard.csv')
X = data.drop('Class', axis=1)
y = data['Class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
- Treine um modelo Isolation Forest para detectar fraudes e avalie sua performance com uma matriz de confusão:
iforest = IsolationForest()
iforest.fit(X_train)
predictions = iforest.predict(X_test)
cm = confusion_matrix(y_test, predictions)
print(f'A matriz de confusão do modelo é: {cm}')
E pronto! Agora você aprendeu como criar 3 projetos práticos de Machine Learning com Scikit-learn. Espero que esse tutorial tenha sido útil e que você esteja empolgado para continuar sua jornada de aprendizado em Machine Learning. Se tiver alguma dúvida, não hesite em perguntar. Boa sorte!