빅데이터 분석 기획
==========================
[1] 도메인 이슈 도출하기= 분석과제 AS-IS 및 개선방향 작성 = 분석요건 문제점 정의 -- 분석주제 탐색 - 이슈를 선정하고 인터뷰를 활용. Top-Down, Bottom-Up 모두 사용해서 현행 업무, 시스템, 분석을 확인
[2] 개선과제 작성 - 이슈별 개선방향 도출 > 자료수집 > 개선방향 시나리오 작성 > 개선목표 도출 >> 최종개선방향 수립(목표별 빅데이터 분석 기법/기술 적합도 검토) > 최종개선목표 수립 > 요건정의서 작성
[3] 분석목표 수립하기 (분석목표 정의서 확정) - 데이터 원천 파악, 데이터 입수 난이도 조사, 분석접근방법 및 개별 분석의 난이도와 적용가능성, 분석 수행주기, 분석결과에 대한 (정성적, 정량적) 성과평가 기준을 고려하여 현실성있는 목표 수준을 정리 > 협의를 거쳐 목표 확정 (예시 정의서 참조)
[4] 프로젝트 계획하기 - 소요비용(인건비, H/W, S/W, 기타 비용배분) > WBS 수립(+산출물정의) > 업무분장, 필수산출물 정의, 평가위원회 구성
[5] 보유 데이터 자산 확인하기 - 내·외부 데이터 활용 수준 분석 및 컴플라이언스 점검 - 필요데이터 요약 > 품질점검 (예시 필요 데이터 품질 점검 항목 - 분량, 완전성, 일관성, 정확성 참조) > 데이터 수집경로(+제공형태) 및 유형 파악
[6] 데이터 자산 - 컴플라이언스 준수 - 내부 정보보안 점검, 개인정보 비식별 점검(개인정보 비식별화 가이드라인 + 빅데이터 개인정보 가이드라인) (기존 법률 주요 충돌 항목 표 참조), 비식별 조치(4단계: 사전검토, 비식별 조치, 적정성 평가, 사후관리 - 그림 4-6 참조), 외부 데이터 수집사항 및 데이터 공개 시 점검(정부단체의 경우는 ‘공공 데이터의 제공 및 이용 활성화에 관한 법률’검토), 활용예정 데이터 최종점검
통계적데이터분석
========================
[1] 분석 모델의 가설 평가를 위한 통계치의 기준을 설정하고 적용
[2] 빅데이터 분석 프로젝트의 목적 달성을 위하여 비즈니스 도메인과 수집된 데이터를 파악
[3] 모델에 적용하는 독립변수와 종속변수의 데이터 유형에 따라 다양한 분석기법을 적용
[4] 설정된 가설을 검증하기 위하여 분석모형을 설계
[5] 주어진 데이터 변수 추가하여 모델에서 필요로 되어지는 파생변수 (Drived Variable)를 생성하여 모델링에 활용
[6] 데이터 분석 모델링의 원활한 수행과 결과보고를 위하여 데이터 시각화를 사용
[7] 구현된 모델은 모델 운영의 안정성과 적합성을 평가
[8] 모델 평가를 위한 데이터셋은 훈련 데이터셋과 구분되어 관리되어 평가의 객관성을 확보
[9] 설정되어 있는 모델의 평가 절차 및 기준에 따라 구현된 모델을 평가
[10] 절차에 따라 모델 평가가 완료되어 모델을 운영 시스템에 전개
[11] 모델이 운영시스템에서 원활하게 운영될 수 있도록 운영방안을 수립
[12] 전개된 모델의 생명주기(Life Cycle)를 이해하고 모델의 운영 주기, 모델의 정밀도 등 설정된 평가기준에 따라 모델 개선방안을 수립
'빅데이터' 카테고리의 다른 글
[AI] 인공지능에 대한 논란과 실체, 현실적 선택 (0) | 2017.11.02 |
---|---|
[BI컨퍼런스2017] 4차 산업혁명과 빅데이터 분석: 근본적 이슈와 과제 - PDF다운로드 (0) | 2017.04.07 |
데이터의 가치에 대한 질문들 -- memo (0) | 2016.12.21 |
[빅데이터] 빅데이터 분석 기획을 위한 참조 모델 (0) | 2016.11.02 |
[빅데이터] 데이터를 잘못 읽기 - 배경지식, 상식과 결합한 해석의 중요성 (0) | 2016.10.19 |