در این آموزش، ما قصد داریم یک مدل ساده با استفاده از کتابخانه scikit-learn در زبان برنامه نویسی پایتون بسازیم. این کتابخانه یکی از معروفترین و کارآمدترین کتابخانههای برای مباحث یادگیری ماشین و هوش مصنوعی است و امکانات بسیار خوبی برای ساخت مدلهای پیشبینی دقیق و تحلیل دادهها فراهم میکند.
برای شروع، ابتدا باید ابزارهای لازم را نصب کنید. برای نصب کتابخانه scikit-learn وابسته به قرارگیری آن در محیط مجازی خود، از دستور زیر استفاده کنید:
pip install -U scikit-learn
حالا که کتابخانه scikit-learn را نصب کردید، میتوانیم شروع به ساخت یک مدل ساده با استفاده از آن کنیم. در اینجا، یک مثال ساده از الگوریتمهای یادگیری ماشین با استفاده از دادههای از پیش آماده شده ارائه خواهیم داد.
فرض کنید میخواهیم یک مدل ساده برای پیشبینی قیمت مسکن بسازیم. برای این منظور، ما از دادههای متغیرهای ورودی مثل تعداد اتاقها، متراژ مسکن و مکان مسکن استفاده خواهیم کرد. ابتدا، دادههای ما را بارگذاری کرده و آنها را به طور متناوب به دو بخش آموزشی و تست تقسیم خواهیم کرد.
import numpy as np
from sklearn.model_selection import train_test_split
# فرض میکنیم دادههای ما در دو آرایه زیر آمدهاند
X = np.array([[1, 1], [2, 2], [3, 3], [4, 4]])
y = np.array([100, 200, 300, 400])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
در این بخش، ما دادهها را به دو آرایه تقسیم کردهایم که X شامل متغیرهای ورودی و y شامل متغیر خروجی (قیمت مسکن) میباشد.
حالا میتوانیم مدل خود را با استفاده از یک الگوریتم ساده مانند Linear Regression ایجاد کنیم و آن را با دادههای آموزشی آموزش دهیم:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
در این مرحله، مدل ما ایجاد شده است و آموزش دیده است. حالا میتوانیم از آن برای پیشبینی قیمتها بر اساس ورودیهای تست استفاده کنیم:
predictions = model.predict(X_test)
print(predictions)
در اینجا، مدل ما قیمتهای پیشبینی شده بر اساس ویژگیهای ورودی تست را چاپ میکند.
و در نهایت، برای ارزیابی کارآیی مدل خود میتوانید از معیارهای مختلفی مانند میانگین مربعات خطا (Mean Squared Error) استفاده کنید:
from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test, predictions)
print('Mean Squared Error:', mse)
در اینجا، میانگین مربعات خطا مدل ما را با دادههای واقعی تست مقایسه میکند و نتیجه را چاپ میکند.
این بود. این آموزش به شما نشان داد که چگونه یک مدل ساده با استفاده از کتابخانه scikit-learn در زبان برنامه نویسی پایتون بسازید. امیدوارم که این آموزش برای شما مفید بوده باشد و به شما کمک کرده باشد تا بهتر با مفاهیم یادگیری ماشین آشنا شوید.