:: 머신러닝 실전 - R을 활용한 예측과 이상패턴 탐지
============================
......... 전용준. 리비젼컨설팅 대표. 경영학박사
......... xyxonxyxon@empal.com
>> 개요 : 기업에서 머신러닝을 적용하는 과정을 실전적으로 짚어본다.
R을 사용해서 데이터준비 및 탐색적 분석을 거쳐,
앙상블 머신러닝 기반의 예측 모델을 만들고 그 결과를 해석하고 평가하는
실전 프로세스를 직접 참여하여 밟아본다.
비즈니스 실전 주제의 데이터를 사용해 미래행동예측과
비정상(anomaly) 의심패턴을 발견하는 과정을 직접 "체험" 해 본다.
** 슬라이드
전용준_리비젼_AIS_ML_ws_20181201.pdf
** R 과 R Studio 설치 필요
# 실습 진행 순서
#---[A] 예측모델 개발 (using Random Forests) ---------------------
#-----[A1] 분석용 데이터 (모바일 Game 이용이력) 로딩
#-----[A2] 탐색적 분석 EDA 및 고객 행동 데이터 집계
#-----[A3] 기본 변수 데이터셋 생성과 탐색적분석 EDA
#-----[A4] 추가 파생변수 생성 및 데이터 정제
#-----[A5] 예비적 모델 개발
#-----[A6] 데이터 분할과 모델 평가
#-----[A7] 추가적 파생변수 생성
#---[B] 이상패턴 탐지 (anomaly detection) ---------------------
#-----[B1] data set 로딩
#-----[B2] data partitioning (과거 Vs. 미래)
#-----[B3] 기본적인 집계변수 생성
#-----[B4] Anomaly Detection 모델 생성
#-----[B5] Anomaly Score 의미 이해
#-----[B6] 변수 설계 재검토
#-----[B7] 로그변환한 변수를 사용한 AD 모델 생성
#-----[B8] 추가적인 파생변수들 생성 후 재분석
# 설치 필요한 라이브러리 리스트
install.packages("party")
install.packages("randomForest")
install.packages("ROCR")
아래 라이브러리 설치 전 RTools 설치 필요
https://cran.r-project.org/bin/windows/Rtools/
Rtools35.exe 다운로드 후 설치
install.packages("IsolationForest", repos="http://R-Forge.R-project.org")
** Hands-On 스크립트 (R)
AIsummit_ML_ws_scrpt_20181130.txt
'R 데이터 분석' 카테고리의 다른 글
[KDATA PLOT EDA retail] 플롯 그리기 (0) | 2019.06.08 |
---|---|
[kdata 2019 recsys 0030] retail recommender using R[전용준 리비젼 recsys r] (0) | 2019.05.18 |
GameLog-In 데이터준비 (0) | 2018.10.16 |
[R분석] 실전 EDA 탐색적분석 R 팁 3 (0) | 2018.10.05 |
[R분석] LAD goes wrong. Why? a.f. 20180928 (0) | 2018.09.28 |