>RE::VISION CRM

R 데이터 분석

[ CRMAJU2018 ] 기말고사

YONG_X 2018. 6. 20. 08:20


CRMAJU2018_기말_학번_성명.txt

[  CRMAJU2018 ] 기말고사


# 학과 : 

# 학번 :

# 성명 : 




# http://blog.daum.net/revisioncrm/394  (

[CRMAJU2018] 고객데이터분석 using R ) 의 고객세분화 연습용 샘플 데이터 엑셀파일을 

다운로드 받은 후 R에 읽어들일 것



# 엑셀에서 사용되었던 천단위 comma가 포함된 것을 gsub 함수로 제거

cs1$amt_books <- as.numeric(gsub(",","",as.character(cs1$amt_books)))



[1] 탐색적 분포분석


도서와 비도서 구매금액의 산점도를 작성하라.

x, y양 축은 0에서 출발하도록 하라.

양축의 라벨은 한글명으로 변경하라.



[2] 그리드기반의 세분화


도서구매금액 기준으로 상위 20%에 포함되는 고객의 수는 몇명인가?


상위 20%에 포함되는 고객의 이름을 출력하라.



[3] 세분집단 특성확인


이 고객세분집단의 도서와 비도서 구매금액의 스캐터플롯을 작성하라.

스캐터플롯의 양 축은 0에서 출발하도록 하라.

두 변수 각각의 중위수를 기준으로 abline 수직, 수평 보조선을 점선형식으로 추가하라.


해당 집단중 남녀 고객의 비율을 막대플롯으로 작성하라

남성의 막대는 파란색으로 여성의 막대는 핑크색으로 표시하라


남성집단과 여성집단의 구매쟝르수 중위수를 집계한 후 

하나의 데이터프레임으로 생성하라.


남성집단과 여성집단 각각의 sms 수신동의 비율을 산출해 데이터프레임을 생성하라

 

성별 구매쟝르수 중위수와 sms 수신동의 비율을 결합한 하나의 데이터프레임을

생성하라.

수신동의비율을 백분률로 단위 변경하라.



[4] 클러스터링을 활용한 고객세분화


고객리스트 데이터 파일에서 변수별 데이터타입을 확인하라.


가용한 데이터 항목 중 모든 수치형 항목을 사용하여 세개의 집단으로 군집화를 실시하라



[5] 클러스터 프로파일링


군집별 소속된 고객의 수를 산출하고, 이를 보여주는 플롯을 생성하라.

군집화에 사용된 변수들 중 임의의 4개를 선정하여 두개 씩의 조합으로

두개의 산점도를 작성하라.

군집별로 다른 색상을 지정하고 각 점이 겹치지 않도록하라.


2번 클러스터 소속 고객들의 성비를 구하라



[6] 의사결정나무 분석


도서구매금액을 종속변수로하는 Decision Tree를 ctree 함수를 사용해 생성하라.

분기가 이루어질 수 있도록 하나의 리프노드에 포함될 개체의 수를 

minbucket 옵션을 활용하여 조절하라.

생성된 트리에서 가장 처음 분기에 사용된 변수를 제외한 후 다시 Decision Tree를 생성하라.

각각의 트리에 대한 플롯을 생성하라.


첫번째 분기에 사용된 변수와 예측대상 타겟변수(종속변수) 간의 관계를

플롯으로 작성하라


트리를 이용한 예측값과 실제 값간의 관계를 보여주는 플롯을 작성하라.

폴리노미얼 추세 보조선을 추가하라

# 예측값과 실제값간 관계 확인


[7] 분석결과를 통한 Action 도출


의사결정나무 생성 결과 나타난 구매금액이 낮은 집단의 특징을 설명하고

이 집단의 구매금액을 높이기 위한 방안으로 어떤 조치가 필요한가에 대한

나름대로의 의견을 제시하라.

필요시 해당 집단의 특성을 분기에 사용되지 않은 다른 변수들을 통해

확인하라 (프로파일링).

단, 만일 이  집단에 대해 조치를 하지 않는 것이 적절하다고 판단한다면

그 이유를 설명하라.



-- 문제 끝 --


제출은 xyxonxyxon@empas.com

파일명은 [ CRMAJU2018_기말_학번_성명.txt ] 로 첨부하여 이메일 제출



CRMAJU2018_기말_학번_성명.txt
0.0MB