[R 데이터 분석 연습] 플롯과 heatmap을 통한 추가적 EDA 탐색적 분석 # 데이터 마이닝 과정에서 매우 빈번하게 사용되는 변수간 관계의 시각적 확인 # 탐색적 분석을 위해 기초적인 플롯이나 그래프를 그린 후 시각적 의미 파악 가능 하도록 # 데이터와 그래픽 옵션을 조절해나가는 과정이 필요 # 앞서 플롯을 사용해 변수간 관계를 확인하기 위해 수행했던 .. R 데이터 분석 2013.02.08
[R 데이터 분석 연습] ctree 를 보기 좋게 수정하는 custom 함수 활용 # ctree를 사용한 디시젼트리는 트리 플롯을 그렸을때 터미널 노드간의 오버랩이 발생되며 # 노드의 통계값이 잘 보이지 않는 문제가 골칫거리임 # 이를 해결하기 위해 아래의 custom function을 활용하면 말끔해짐 # 링크 : http://stackoverflow.com/questions/13772715/show-volume-in-each-node-using-ctree-plot-in-r in.. R 데이터 분석 2013.02.06
[R 데이터 분석 연습] RFM 데이터 준비와 모델링 # 이번에는 유통업체의 CRM 고객 데이터 분석에서 가장 대표적인 # RFM 변수를 사용한 고객 미래 행동에 대한 예측을 수행하는 사례로 연습 # CRM의 데이터 분석에서 흔히 사용되는 주요 처리 방법들 즉, # SQL 사용, 데이터 입출력, 변수명 변경, 그룹에 대한 집계, 변수값 변환, 널 null 처리 # .. R 데이터 분석 2013.02.05
R 마이닝 첫경험[?] [디시젼트리 만들기] # =========== creating decision tree =============== # 데이터 셋은 데이터 처리 연습에서 사용하던 것을 그대로 가져다 사용 # 다시 한번 돌려서 머지된 RBI와 OPS 있는 데이터 셋을 사용하든지 아니면 # k6 데이터 셋을 사용하든지 attach(k6) k7 <- aggregate(OPS~team, FUN=median, na.rm=TRUE) k8 <- aggregate(rbi~team, FU.. R 데이터 분석 2013.02.01
R을 사용한 데이터 처리 [왕초보용 연습 example] 빅데이터 분석이라고 일단 R을 배워야 한다고들 아는 사람들이 많은데, 일단 설치하고 돌려라도 봐야할테니... [R]에 대해 제목만 들어봤을 뿐 전혀 접해보지 않은 사람들을 위한 아주 간단한 샘플. R studio를 설치한 후 어떻게 돌아가는 것인지는 눈으로 한번 보는 용도로 많이 사용되는 간.. R 데이터 분석 2013.01.31