[ML] Catboost and DT - Sample Script

인공지능

[ML] Catboost and DT - Sample Script

YONG_X 2025. 4. 12. 18:43

[ML] Catboost and DT - Sample Script

머신러닝 모델을 설계중인 캐주얼 차림의 투명 플라스틱 안경테의 짧은 크롭 셔츠를 입은 미모의 슬림한 체형의 한국인 젊은 여성 기획자의 모습. 긴머리에 약간의 웨이브가 있다. 배경은 sky blue 사무실 벽. 대각선 방향으로 사무실 조명이 있다. 1970년대 미국 만화 화풍을 적용하라. 단, 잉크의 번짐이나 점묘 방식의 질감은 적용하지 않는다. square shape

from sklearn.tree import DecisionTreeRegressor
from sklearn import tree

dt = DecisionTreeRegressor(max_depth=3, min_samples_leaf=100)

dtfeatures = ['is_female','is_seoul','age']
dt.fit(cust_prfl1[dtfeatures], cust_prfl1['amt'])

# sklearn decision trees do not handle categorical data

plt.figure(figsize=(16,8), dpi=80)
tree.plot_tree(dt, feature_names=dtfeatures,
filled=True, fontsize=11, precision=2)
plt.show()

# create a prediction model

from catboost import CatBoostRegressor

categorical_features_indices = np.where(cust_prfl5[dtfeatures].dtypes == np.object)[0]
cust_prfl5shuff = cust_prfl5.sample(frac=1)
cust_prfl5a = cust_prfl5shuff.head(3000)
cust_prfl5b = cust_prfl5shuff.tail(6000)

iters = 5000
cbmodel = CatBoostRegressor(iterations=iters,
                             eval_metric='R2',
                             learning_rate=0.005,
                             loss_function= 'RMSE',
                             use_best_model=True,
                             depth=3,
                             random_seed=42,
                             metric_period = int(iters/50))
cbmodel.fit(cust_prfl5b[dtfeatures], cust_prfl5b['amt2020'],
            cat_features=categorical_features_indices,
            eval_set=(cust_prfl5a[dtfeatures], cust_prfl5a['amt2020']),
            plot=True)

# Mapping Feature Importance

plt.figure()
fea_imp = pd.DataFrame({'imp': cbmodel.feature_importances_, 'feature': dtfeatures})
fea_imp['imp'] = round(fea_imp.imp, 2)
mean_vimp = fea_imp.imp.mean()
fea_imp = fea_imp.sort_values(['imp', 'feature'], ascending=[True, False])
# to limit number of features? --> .iloc[-5:]
_ = fea_imp.plot(kind='barh', x='feature', y='imp', figsize=(4, 4), alpha=0.7)
plt.title('Var Imp from CatBoost')
plt.axvline(mean_vimp, linestyle=':')
plt.show()

fea_imp1 = fea_imp.sort_values('imp', ascending=False)

# add row total
fea_imp1['cum_sum_imp']= round(fea_imp1['imp'].cumsum(),2)
fea_imp1.loc['row_total'] = fea_imp.apply(lambda x: x.sum())
fea_imp1

# k-means clustering

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

# 데이터 불러오기 (예시: iris dataset)
from sklearn.datasets import load_iris
data = load_iris()
df = pd.DataFrame(data.data, columns=data.feature_names)

# 데이터 표준화
scaler = StandardScaler()
scaled_data = scaler.fit_transform(df)

# k-means 클러스터링
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(scaled_data)
labels = kmeans.labels_

# PCA로 2차원 축소
pca = PCA(n_components=2)
pca_components = pca.fit_transform(scaled_data)

# 결과를 DataFrame으로 정리
result_df = pd.DataFrame(data=pca_components, columns=['PC1', 'PC2'])
result_df['Cluster'] = labels

# 시각화
plt.figure(figsize=(8, 6))
for cluster in result_df['Cluster'].unique():
    clustered = result_df[result_df['Cluster'] == cluster]
    plt.scatter(clustered['PC1'], clustered['PC2'], label=f'Cluster {cluster}')

plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.title('KMeans Clusters (PCA-reduced Features)')
plt.legend()
plt.grid(True)
plt.show()

'인공지능' 카테고리의 다른 글

챗GPT (2024-04-19) : 할 수 있는 것에 대한 오해와 대책 (1)	2025.04.19
지금의 챗GPT의 수준 정밀 검토 [2025.04] (0)	2025.04.18
챗GPT 미국 만화 스타일 사람 모습 그리기 - 프롬프트 예제 (0)	2025.04.12
챗GPT 프롬프트에서 특히 신경써야 하는 3가지 조건 (0)	2025.04.11
초보자를 위한 챗GPT 프롬프트 작성법 123 (0)	2025.04.06

현재글[ML] Catboost and DT - Sample Script

리비젼 CRM ( revisioncrm )

CRM, 프롬프트, 데이터 분석, R, 빅 데이터, 데이터 사이언티스트, 리비젼, 빅데이터, 머신러닝, GPT, 리비젼컨설팅, 데이터분석, 전용준 빅데이터, 인공지능, 전용준, 프롬프트엔지니어링, chatGPT, AI, 디지털마케팅, 챗GPT,

Today :
Yesterday :

[ML] Catboost and DT - Sample Script

[ML] Catboost and DT - Sample Script

'인공지능' 카테고리의 다른 글

'인공지능'의 다른글

티스토리툴바

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

[ML] Catboost and DT - Sample Script

[ML] Catboost and DT - Sample Script

'인공지능' 카테고리의 다른 글

'인공지능'의 다른글

관련글

티스토리툴바