3 Projetos Práticos de Aprendizado de Máquina com Scikit-learn para Iniciantes!

Posted by

Então, você está interessado em aprender Machine Learning com Scikit-learn? Ótimo! Neste tutorial, vou te ensinar como criar 3 projetos práticos de Machine Learning usando a biblioteca Scikit-learn, ideal para iniciantes.

Antes de começarmos, certifique-se de que você tenha Python instalado em seu computador, pois Scikit-learn é uma biblioteca Python. Se ainda não tiver, você pode baixá-lo em python.org.

Agora, vamos aos projetos:

Projeto 1: Classificação de flores usando o dataset Iris

  1. Crie um novo arquivo Python e importe as bibliotecas necessárias:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
  1. Carregue o dataset Iris e divida os dados em treino e teste:
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. Treine um modelo de classificação KNN e avalie sua precisão:
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
predictions = knn.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f'A precisão do modelo é: {accuracy}')

Projeto 2: Previsão de preço de casas usando o dataset Boston

  1. Importe as bibliotecas necessárias:
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
  1. Carregue o dataset Boston e divida os dados em treino e teste:
boston = load_boston()
X = boston.data
y = boston.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. Treine um modelo de regressão linear e avalie seu desempenho com o erro médio quadrado:
lr = LinearRegression()
lr.fit(X_train, y_train)
predictions = lr.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f'O erro médio quadrado do modelo é: {mse}')

Projeto 3: Detecção de fraude em transações financeiras usando o dataset Credit Card Fraud Detection

  1. Importe as bibliotecas necessárias:
from sklearn.ensemble import IsolationForest
from sklearn.metrics import confusion_matrix
  1. Carregue o dataset Credit Card Fraud Detection e divida os dados em treino e teste:
data = pd.read_csv('creditcard.csv')
X = data.drop('Class', axis=1)
y = data['Class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  1. Treine um modelo Isolation Forest para detectar fraudes e avalie sua performance com uma matriz de confusão:
iforest = IsolationForest()
iforest.fit(X_train)
predictions = iforest.predict(X_test)
cm = confusion_matrix(y_test, predictions)
print(f'A matriz de confusão do modelo é: {cm}')

E pronto! Agora você aprendeu como criar 3 projetos práticos de Machine Learning com Scikit-learn. Espero que esse tutorial tenha sido útil e que você esteja empolgado para continuar sua jornada de aprendizado em Machine Learning. Se tiver alguma dúvida, não hesite em perguntar. Boa sorte!