>RE::VISION CRM

Python데이터분석 29

[머신러닝] 디시젼트리와 XGBoost 인기도 변화 추이

[머신러닝] 디시젼트리와 XGBoost 인기도 변화 추이 요점: 코로나 바이러스 COVID-19 사태로 인해 전세계적으로 머신러닝 기법에 관한 관심이 줄어들었으나 XGBoost 기법에 대한 관심이 디시젼트리에 대한 관심이상으로 높음. 정확도 높은 고급 머신러닝 기법을 찾는 사람들이 많음 2021년 현재까지 트리기반 앙상블 머신러닝의 대표선수는 XGBoost 파이썬이 머신러닝을 위한 분석용 환경으로 지배적 지위를 가진지 3년 가량이 지났음 supervised machine learning을 위해 디시젼트리와 XGBoost는 가장 많이 활용되는 모델링 기법들 전세계적인 인기도를 구글트렌드 지수를 기준으로 살펴보면 XGBoost가 전통적인 디시젼트리 보다 조금은 더 많은 관심을 받고 있음을 알수 있음 R에서와..

[파이썬] kmeans scatter plot: plot different colors per cluster

파이썬 scatter plot에 클러스터 또는 그룹별로 다른 색을 칠하고 싶다면 컬러를 구분할 벡터를 먼저 생성한 후 맵을 만들어서 대응되는 색을 가져오도록 처리 예를들면 아래처럼 The color= or c= property should be a matplotlib color, as mentioned in the documentation for plot. To map a integer label to a color just do LABEL_COLOR_MAP = {0 : 'r', 1 : 'k', ...., } label_color = [LABEL_COLOR_MAP[l] for l in labels] plt.scatter(x, y, c=label_color) # ........ OR If you don't..

[Python] 파이썬 데이터 처리 기초 연습문제 [1]

#-------- 파이썬 데이터 처리 기초 연습문제 ----------- # 아래는 한 회사의 고객 리스트이다. 이 데이터를 활용하여 아래의 문제들에 대한 답을 찾는 Python 스크립트를 작성하라. import pandas as pdimport numpy as np # data to usecust = pd.DataFrame({'age' : np.arange(30,51), 'sales' : np.repeat([65,60,80],7)}) freq = np.repeat([3,7,4,2,1,1,2],3) # sales는 각 고객별 총판매금액이며 freq는 구매횟수이다. . # 문제1: 고객의 수를 계산하라 # 문제2: 고객의 나이를 큰값에서 작은 값의 순서로 정렬하라 # 문제3: 고객의 나이 중 두번째로 큰 ..

[디지털마케팅서밋] 디지털 마케터를 위한 탐색적 데이터 분석 Workshop

디지털 마케팅 서밋 2020 Workshop : 디지털 마케터를 위한 탐색적 데이터 분석 행사안내 페이지 :: https://digitalmarketingsummit.co.kr/yj_jeon/ 디지털 마케터를 위한 Python 탐색 분석 부트캠프 (EDA using Python Boot Camp for Digital Marketer) 2020년 3월 4일 이 Hands-on 워크샵에서는 디지털 마케팅의 기반이 되는 시..