Python 활용 데이터 분석 최적화 – 09 공정 데이터 생산시간 예측하기 (Scikit Learn 라이브러리 실습)
데이터 분석은 현대 비즈니스에서 중요한 역할을 하고 있습니다. 특히 공정 데이터의 생산시간을 예측하는 것은 생산성을 높이는데 매우 중요합니다. 이번 실습에서는 Python의 Scikit Learn 라이브러리를 사용하여 공정 데이터의 생산시간을 예측해보겠습니다.
코드 예시:
“`python
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 데이터 불러오기
data = pd.read_csv(‘production_data.csv’)
# 독립변수와 종속변수 분리
X = data.drop(‘생산시간’, axis=1)
y = data[‘생산시간’]
# 학습 데이터와 테스트 데이터로 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 선형 회귀 모델 학습
model = LinearRegression()
model.fit(X_train, y_train)
# 테스트 데이터로 예측
y_pred = model.predict(X_test)
# 평균 제곱 오차 계산
mse = mean_squared_error(y_test, y_pred)
print(‘Mean Squared Error:’, mse)
“`
위 코드는 데이터 분석을 위한 기본적인 프로세스를 보여줍니다. 데이터를 불러와서 독립변수와 종속변수를 분리한 후, 학습 데이터와 테스트 데이터로 분리하여 선형 회귀 모델을 학습시키고 예측을 수행한 뒤, 평균 제곱 오차를 계산하는 방법을 보여줍니다.
Scikit Learn 라이브러리를 사용하면 간단하고 효율적으로 데이터 분석을 수행할 수 있습니다. 따라서 데이터 분석을 통해 생산시간을 예측하여 생산성을 높이는데 도움이 될 것입니다.