Scikit-Learn Kütüphanesi ve Makine Öğrenmesi Üzerine Bilgi Edinelim.

Posted by


Makine öğrenmesi alanında en popüler ve kullanıcı dostu kütüphanelerden biri olan Scikit-Learn, Python programlama diliyle geliştirilmiş bir makine öğrenimi kütüphanesidir. Scikit-Learn, kolay ve hızlı bir şekilde makine öğrenimi modelleri oluşturmak, eğitmek ve test etmek için kullanılabilir. Bu tutorialda, Scikit-Learn kütüphanesini öğrenmeye başlayacağız ve temel konuları kapsayacağız.

Scikit-Learn kütüphanesini kullanmaya başlamadan önce, Python programlama diline aşina olmanız gerekmektedir. Ayrıca, makine öğrenimi hakkında temel bir anlayışa sahip olmanız da faydalı olacaktır. Eğer bu konularda deneyiminiz yoksa, öncelikle Python ve makine öğrenimi temellerini öğrenmenizi tavsiye ederim.

İlk adım olarak, Scikit-Learn kütüphanesini bilgisayarınıza kurmanız gerekmektedir. Bunun için, pip veya conda gibi Python paket yöneticilerini kullanabilirsiniz. Örneğin, pip kullanarak Scikit-Learn’ü kurmak için aşağıdaki komutu terminal veya komut istemcisine yazabilirsiniz:

pip install -U scikit-learn

Kurulum işlemi tamamlandıktan sonra, Scikit-Learn kütüphanesini kullanmaya başlayabiliriz. İlk olarak, Scikit-Learn’in veri setlerine erişmek için sağladığı veri setlerini kullanarak basit bir örnek yapalım. Scikit-Learn kütüphanesinde birçok önceden yüklenmiş veri seti bulunmaktadır. Bu veri setlerinden biri olan iris veri setini kullanarak bir sınıflandırma modeli oluşturalım.

İlk adım olarak, iris veri setini yükleyip verileri inceleyelim:

from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target

print(df.head())

Bu kod parçası ile iris veri setini yükleyip veri çerçevemize dönüştürdük ve ilk 5 örneği ekrana yazdırdık. Bu veri seti 150 örnekten oluşmaktadır ve 4 özellik ile bir sınıf etiketi içermektedir.

Şimdi, veri setini eğitim ve test verileri olarak ayırarak bir sınıflandırma modeli oluşturalım:

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

clf = RandomForestClassifier()
clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

Bu kod parçası ile iris veri setini eğitim ve test verilerine ayırdık, Random Forest sınıflandırıcı modelini oluşturduk ve eğittik. Son olarak, test verilerini kullanarak modelin doğruluğunu hesapladık ve ekrana yazdırdık.

Scikit-Learn kütüphanesi çok daha fazla özellik ve fonksiyon içermektedir. Bu tutorialda sadece temel bir örnek üzerinden nasıl kullanılabileceğini göstermeye çalıştım. Daha fazla özellik ve fonksiyon hakkında bilgi edinmek için Scikit-Learn resmi dokümantasyonunu inceleyebilir ve farklı örnekler deneyerek pratik yapabilirsiniz. Makine öğrenmesi alanında daha ileri gitmek için Scikit-Learn kütüphanesini öğrenmek kesinlikle iyi bir başlangıç olacaktır. Umarım bu tutorial size faydalı olmuştur. Başarılar dilerim!

0 0 votes
Article Rating

Leave a Reply

5 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
@74n3r
3 hours ago

Yeni başlıyorum mükemmel oldu . bir çok kafa karışıklığım gitti

@arzu6704
3 hours ago

Hocam çok güzel anlatmışsınız ağzınıza sağlık. Sunumunuzu rica etsem paylaşabilir misiniz

@williamwallace326
3 hours ago

hocam, veriyi sizin yaptığınız gibi ölçeklendirdim ve cross validation ile R^2 değerini buldum.
sonra da ölçeklendirmeden cross validation ile R^2 değerini buldum.
aynı çıktılar.
ölçeklendirme yapmamızın ne etkisi oldu anlayamadım?

@atukenmez396
3 hours ago

teşekkürler hocam

@CanerErden
3 hours ago

Dersteki Jupyter notebook dosyasını indirmek için: https://drive.google.com/file/d/1XfGbIkb-IKiYooyktF7EL1IDZoemOrfS/view?usp=sharing

5
0
Would love your thoughts, please comment.x
()
x