Makine öğrenmesi alanında en popüler ve kullanıcı dostu kütüphanelerden biri olan Scikit-Learn, Python programlama diliyle geliştirilmiş bir makine öğrenimi kütüphanesidir. Scikit-Learn, kolay ve hızlı bir şekilde makine öğrenimi modelleri oluşturmak, eğitmek ve test etmek için kullanılabilir. Bu tutorialda, Scikit-Learn kütüphanesini öğrenmeye başlayacağız ve temel konuları kapsayacağız.
Scikit-Learn kütüphanesini kullanmaya başlamadan önce, Python programlama diline aşina olmanız gerekmektedir. Ayrıca, makine öğrenimi hakkında temel bir anlayışa sahip olmanız da faydalı olacaktır. Eğer bu konularda deneyiminiz yoksa, öncelikle Python ve makine öğrenimi temellerini öğrenmenizi tavsiye ederim.
İlk adım olarak, Scikit-Learn kütüphanesini bilgisayarınıza kurmanız gerekmektedir. Bunun için, pip veya conda gibi Python paket yöneticilerini kullanabilirsiniz. Örneğin, pip kullanarak Scikit-Learn’ü kurmak için aşağıdaki komutu terminal veya komut istemcisine yazabilirsiniz:
pip install -U scikit-learn
Kurulum işlemi tamamlandıktan sonra, Scikit-Learn kütüphanesini kullanmaya başlayabiliriz. İlk olarak, Scikit-Learn’in veri setlerine erişmek için sağladığı veri setlerini kullanarak basit bir örnek yapalım. Scikit-Learn kütüphanesinde birçok önceden yüklenmiş veri seti bulunmaktadır. Bu veri setlerinden biri olan iris veri setini kullanarak bir sınıflandırma modeli oluşturalım.
İlk adım olarak, iris veri setini yükleyip verileri inceleyelim:
from sklearn.datasets import load_iris
import pandas as pd
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
print(df.head())
Bu kod parçası ile iris veri setini yükleyip veri çerçevemize dönüştürdük ve ilk 5 örneği ekrana yazdırdık. Bu veri seti 150 örnekten oluşmaktadır ve 4 özellik ile bir sınıf etiketi içermektedir.
Şimdi, veri setini eğitim ve test verileri olarak ayırarak bir sınıflandırma modeli oluşturalım:
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
clf = RandomForestClassifier()
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
Bu kod parçası ile iris veri setini eğitim ve test verilerine ayırdık, Random Forest sınıflandırıcı modelini oluşturduk ve eğittik. Son olarak, test verilerini kullanarak modelin doğruluğunu hesapladık ve ekrana yazdırdık.
Scikit-Learn kütüphanesi çok daha fazla özellik ve fonksiyon içermektedir. Bu tutorialda sadece temel bir örnek üzerinden nasıl kullanılabileceğini göstermeye çalıştım. Daha fazla özellik ve fonksiyon hakkında bilgi edinmek için Scikit-Learn resmi dokümantasyonunu inceleyebilir ve farklı örnekler deneyerek pratik yapabilirsiniz. Makine öğrenmesi alanında daha ileri gitmek için Scikit-Learn kütüphanesini öğrenmek kesinlikle iyi bir başlangıç olacaktır. Umarım bu tutorial size faydalı olmuştur. Başarılar dilerim!
Yeni başlıyorum mükemmel oldu . bir çok kafa karışıklığım gitti
Hocam çok güzel anlatmışsınız ağzınıza sağlık. Sunumunuzu rica etsem paylaşabilir misiniz
hocam, veriyi sizin yaptığınız gibi ölçeklendirdim ve cross validation ile R^2 değerini buldum.
sonra da ölçeklendirmeden cross validation ile R^2 değerini buldum.
aynı çıktılar.
ölçeklendirme yapmamızın ne etkisi oldu anlayamadım?
teşekkürler hocam
Dersteki Jupyter notebook dosyasını indirmek için: https://drive.google.com/file/d/1XfGbIkb-IKiYooyktF7EL1IDZoemOrfS/view?usp=sharing