>RE::VISION CRM

인공지능

[챗GPT o1] 데이터 시각화 검토 수준의 차이

YONG_X 2025. 1. 14. 23:44

 

[챗GPT o1] 데이터 시각화 검토 수준의 차이

 

ChatGPT o1의 논리적 추론은 데이터 분석에도 여러 가지 측면에서 활용될 수 있을 것으로 보인다.

다음은 (누군가가) 작성한 데이터 시각화 결과에 대해 ChatGPT o1의 논리적 추론 결과 예시이다.

결과를 살펴보면, 기존의 모델 (ChatGPT 4o)가 생성한 결과에서 조차 흔히 발생되는 문제점을 충분히 전문적으로 진단한다는 사실을 알 수 있다.

 

 

 

 

아래는 일반적인 데이터 시각화 원칙을 기준으로 보았을 때, 첨부된 차트가 벗어난(개선이 필요한) 요소를 짚어본 것입니다.


1. 가로축(계절) 구간이 “시간적 흐름”으로 정렬되지 않음

  • 일반적으로 **선 그래프(Line Chart)**는 시간 축(또는 연속적 값)이 가로축에 놓이고, 연속성을 전제로 값을 연결하여 추이를 보여줄 때 사용합니다.
  • 이 차트에서는 “가을 → 겨울 → (계절?) → 봄 → 여름”처럼, 계절이 **전형적인 시간 순서(봄→여름→가을→겨울)**와 맞지 않거나, “계절”이라는 구간이 따로 존재해 혼동을 줄 수 있습니다.
  • 개선 방안:
    1. 가로축을 “봄→여름→가을→겨울”처럼 시간 흐름대로 정렬
    2. “계절”이라는 항목이 왜 따로 있는지(혹은 오타인지) 확인 후, 필요하다면 명확히 정리

2. 범주형 변수(계절) + 여러 상품군을 선 그래프로 표현한 점

  • 선 그래프는 시계열 혹은 연속된 값을 시각화할 때 주로 쓰입니다.
  • ‘봄·여름·가을·겨울’처럼 명확히 구분되는 범주형(이산형) 데이터에 대해 상품군별 평균값을 비교하려면, 보통 **막대 그래프(Bar Chart)**가 더 직관적인 경우가 많습니다.
  • 상품군이 5개(과일·스낵·유류(?)·음료·채소)나 되면, 선이 서로 교차·겹쳐 시각적으로 복잡해질 수 있습니다.
  • 개선 방안:
    • 각 계절별로 상품군 평균판매금액을 세로(막대)로 나란히 보여주는 그룹형 막대 그래프 사용
    • 상품군(범례)이 여러 개라면, 누적 막대 또는 별도의 소그룹으로 정리

3. 범례와 색상 사용이 직관적이지 않을 수 있음

  • 차트에서 색상이 총 5개(오렌지, 노랑, 핑크, 빨강, 파랑)인데, 일부 색상의 구분이 모니터/프로젝터 환경에서 비슷해 보일 수 있습니다.
  • 또한, 데이터 시각화 시 색상만으로 구분할 경우, 색맹/색약 사용자를 고려해 대비나 형태(선 스타일, 마커 등)도 추가하는 편이 좋습니다.
  • 개선 방안:
    • 색맹 친화적 팔레트 사용(예: colorbrewer)
    • 점/선 스타일(●, ■, ▲ 등)을 달리해 시각적 구분도를 높이기

4. 중복되는 제목·레이블

  • 차트 상단에 “상품군별 계절 평균 판매 금액”이라는 제목이 쓰여 있고, 그 위에 또 같은 문구가 반복 표기되어(캡션/툴팁 등) 제목이 중복으로 보일 수 있습니다.
  • 시각적으로 복잡해질 수 있으므로, 같은 텍스트가 여러 번 노출되는지를 확인해야 합니다.
  • 개선 방안:
    • 메인 타이틀은 하나만 두고, 나머지 불필요한 텍스트는 줄이기
    • 혹은 하단에 간단한 부제목을 사용해 설명을 덧붙이되, 본문에서 반복 노출은 지양

5. 불필요하거나 모호한 데이터 범위(축 눈금 등)

  • 가로축(계절) 레이블이 “가을, 겨울, 계절, 봄, 여름” 순이라면, 실제로 **‘계절’**이 어디를 의미하는지 모호합니다.
  • 세로축(평균 판매 금액) 범위가 0~3000 단위인 것도 적절한지, 또는 정확히 금액 단위(예: 만 원, 원 단위 등) 표기가 필요한지 검토가 필요합니다.
  • 개선 방안:
    • 계절 표기 시, 필요하다면 “전년/후년”처럼 년도와 함께 쓰거나 “사계절 평균”이라는 식으로 명확히 표기
    • 세로축 레이블에 실제 금액 단위(원, 만 원 등)를 명시해 정확도 높이기

요약

  1. 범주(계절)에 대한 순서와 표현이 혼동을 주는 구조 → 일반적인 시간 순서대로 재배치, 혹은 카테고리 간 비교라면 막대 그래프 활용
  2. 선 그래프는 시계열(연속 변수)에 더 적합 → 계절별/상품군별 ‘평균값’ 비교라면 막대형(Bar) 차트가 직관적
  3. 색상 구분이 많을수록, 색맹 모드/배경 대비 등을 고려해야 함 → 명확한 차별화가 필요
  4. 차트 제목, 범례, 축 레이블 등 텍스트가 중복되거나 모호 → 필요한 정보만 간결히 전달
  5. 축 범위나 레이블이 실제 데이터 단위와 맞는지 확인, ‘계절’ 표기가 왜 따로 있는지 재검토

이러한 점들을 개선한다면, 한눈에 보기 쉬운 차트로 만들 수 있을 것입니다.