>RE::VISION CRM

R 데이터 분석

[AI Summit workshop] rf anomaly 1206

YONG_X 2018. 11. 30. 17:10

::  머신러닝 실전 - R을 활용한 예측과 이상패턴 탐지
============================

......... 전용준. 리비젼컨설팅 대표. 경영학박사
......... xyxonxyxon@empal.com


>> 개요 :  기업에서 머신러닝을 적용하는 과정을 실전적으로 짚어본다.
R을 사용해서 데이터준비 및 탐색적 분석을 거쳐,
앙상블 머신러닝 기반의 예측 모델을 만들고 그 결과를 해석하고 평가하는
실전 프로세스를 직접 참여하여 밟아본다.
비즈니스 실전 주제의 데이터를 사용해 미래행동예측과
비정상(anomaly) 의심패턴을 발견하는 과정을 직접 "체험" 해 본다.



** 슬라이드


전용준_리비젼_AIS_ML_ws_20181201.pdf





** R 과 R Studio 설치 필요


# 실습 진행 순서

#---[A] 예측모델 개발 (using Random Forests) ---------------------
#-----[A1] 분석용 데이터 (모바일 Game 이용이력) 로딩
#-----[A2] 탐색적 분석 EDA 및 고객 행동 데이터 집계
#-----[A3] 기본 변수 데이터셋 생성과 탐색적분석 EDA
#-----[A4] 추가 파생변수 생성 및 데이터 정제
#-----[A5] 예비적 모델 개발
#-----[A6] 데이터 분할과 모델 평가
#-----[A7] 추가적 파생변수 생성 

#---[B] 이상패턴 탐지 (anomaly detection) ---------------------
#-----[B1] data set 로딩
#-----[B2] data partitioning (과거 Vs. 미래)
#-----[B3] 기본적인 집계변수 생성
#-----[B4] Anomaly Detection 모델 생성
#-----[B5] Anomaly Score 의미 이해
#-----[B6] 변수 설계 재검토
#-----[B7] 로그변환한 변수를 사용한 AD 모델 생성
#-----[B8] 추가적인 파생변수들 생성 후 재분석


# 설치 필요한 라이브러리 리스트
install.packages("party")
install.packages("randomForest")
install.packages("ROCR")


아래 라이브러리 설치 전 RTools 설치 필요

https://cran.r-project.org/bin/windows/Rtools/

Rtools35.exe 다운로드 후 설치

install.packages("IsolationForest", repos="http://R-Forge.R-project.org")



** Hands-On 스크립트 (R)


AIsummit_ML_ws_scrpt_20181130.txt






전용준_리비젼_AIS_ML_ws_20181201.pdf
0.88MB
전용준_리비젼_AIS_ML_ws_20181201.pdf
0.89MB
AIsummit_ML_ws_scrpt_20181130.txt
0.05MB
AIsummit_ML_ws_scrpt_20181130.txt
0.05MB