>RE::VISION CRM

카테고리 없음

코로나19 확진자 증가와 공포간 관계 변화추이 분석 - 미국

YONG_X 2020. 7. 9. 13:09

코로나19 확진자 증가와 공포간 관계 변화추이 분석 - 미국

 

last updated - 2020-07-09

 

#트렌드인터프리터 #시장분석 #COVID-19 #코로나19

#머신러닝 #탐색적데이터분석

 

 

[질문]

코로나19 발발 이후 확진자수가 꾸준히 늘어나고 있으며, 신규확진자수 규모가 지속 최고치를 갱신하고 있고 2차 대유행에 대한 우려가 연일 미디어를 수놓고 있음에도 불구하고 왜 사람들이 일상생활로 복귀하고 두려움은 줄어드는 것 처럼 보이는가?

 

 

구글에서의 검색지수는 사람들의 적극적인 관심도를 나타냄. 'confirmed'라는 검색어의 경우 영어권에서 코로나19에 대한 우려를 대변한다고 볼 수 있음. 3월 급등하여 3월13일 주에 최고점을 기록하였으나 이후 급속히 감소했고 꾸준한 감소를 이어왔음. 단 6월 이후 감소가 매우 완만해져 일정 수준을 유지하고 있는 상태임

 

#트렌드인터프리터 . 미국 지역의 confirmed. 이동평균적용. 2020-07-08 기준

 

[전체 추이 이해]

  • 미국에서의 코로나19 확진자는 1월21일 첫 발생 이후 지속적으로 발생해왔으나 1차 확산이 일별 신규확진자수 측면에서 증가세가 다소 둔화되는 변곡을 한 번 겪은 이후 최근 다시 지속 증가하는 추세를 보이고 있음 (CDC 발표자료 기준)
  • 최근의 2차 확산으로 보이는 패턴에서의 확진자 발생 규모는 1차 확산 시기의 2배에 육박하고 있음
  • 일별 신규 사망자수는 1차 확산 시기에서 최고 수준이었고 이후 지속적으로 감소하는 양상을 보이고 있음
  • 2차 감염 확산과는 무관하게 신규 사망자수는 오히려 감소하는 추세임

 

 

data source: https://ourworldindata.org/covid-cases (확진자, 사망자수)

 

 

구글 트렌드(미국으로 지역한정)에서의 확진자('confirmed') 검색지수를 대중의 공포감을 대변하는 항목으로 간주하는 경우, 공포감이 최고점이었던 것은 1차 확산 보다도 빠른 시점이었고 이후 감염 확산에도 불구하고 지속적으로 감소하고 있음

 

 

일별 신규 확진자수는 높지만 오히려 공포감은 낮은 영역이 최근 4주간의 일자별 값이 위치하는 지점임 (red dots) - 확진자수가 증가하는 것과 공포감은 아무런 관련이 없다는 것인가를 의심하게 함

 

 

시기적으로 보면 1차 확산의 직전 시점부터 공포감이 최고조를 보였고 (red) 1차 확산의 정점에서 부터 그 이후에는 공포감이 낮은 수준을 유지하고 있음

 

공포감의 크기(GT index value of 'confirmed')와 관련성이 높은 요인이 무엇인가를 부스팅 머신러닝 알고리즘(CatBoost)을 사용해서 도출한 상대적 변수중요도(Variable Importance)로부터 확인

 

 

  • 누적사망자수(total_deaths)가 상대적으로 가장 영향이 강한 요소이고, 누적확진자수(total_cases)가 다음으로 중요한 요소. 최초발발후경과기간(Week_Seq), 신규확진자수, 신규사망자수 등의 요소는 상대적으로 중요도 낮음
  • 최근 상황보다 누적된 총 수치가 더 중요하다는 것이 상식적이지 않을 수 있으나 미디어가 1차적으로 보여주는 수치가 누적이라는 점이 크게 영향을 미치고 있을 가능성 존재함
  • 사망자수가 확진자수 보다 공포감에 영향미치는 정도가 클 것이라는 가설 도출 가능

 

 

가장 중요한 두 가지 요소만을 기준으로 본다면 어느 영역이 공포감이 큰 곳인가?

- 누적기준 사망자수도 확진자수(total cases)도 작은 영역에서 공포감은 더 컸던 것으로 외형적인 패턴이 보여짐 (superficial relationship)

 

 

두 가지 핵심요소인 누적사망자수와 누적확진자수를 별도로 보는 대신 두 변수간의 비율(=누적 치명률)을 구하여 시간적인 추이에 따라 비교해보면 누적확진자수 대비 누적사망자수 (비율)가 증가하는 시점에서 공포감(GT 'confirmed') 값이 크게 상승하는 패턴을 발견할 수 있음

 

 

누적확진자수 대비 누적사망자수 비율이 plateau 를 형성한 week 15 이후 최근 까지는 정체 내지는 약한 감소를 보이고 있기에 비율의 절대값 자체는 크다고 해도 공포감은 늘어나지 않는 모습을 보이는 것으로 풀이됨. 결국, 단순히 1차 확산이후 시간이 경과하면서 피로감이 누적되었고 점차 둔감해진 것이라는 가설은 성립하지 않는 것으로 보임 

 

즉, 지금부터라도 치명률이 급하게 상승한다면 공포감은 다시 치솟을 가능성도 여전히 남아있다고 추측해 볼 수있음

 

 

[후기 및 참고사항]

  • 제한된 변수를 사용하는 약식의 분석이었다는 점에서 한계가 있으며, Soft한 탐색적 분석임에 주의 필요
  • 각 변수별 추세의 변화를 derived feature로 추가하지 않았기에 직접적으로 추세 변화의 영향을 구분 파악한 결과는 제공하지 못했음
  • 대중의 심리적 상태 변화는 상식적 직관적으로 쉽게 파악할 수 있는 표면적 패턴과는 다를 수 있을 것이라는 사실을 보여주는 한 사례일 것

 

 

[추가 검토해볼만한 사항들]

  • 발생 통계를 전체 집계만을 반영하였으므로 연령대별 집계를 구분해서 영향관계를 추가 분석해본다면 현재의 전체적으로 낮은 공포감의 원인이 사망자가 주로 60대 이상의 고연령대에 집중되어 있기 때문인지를 확인할 수 있을 것 - 사망자가 고연령대에 집중되어 있다면 해당 연령대 이외의 집단들은 코로나19에 무관심할 가능성이 있고 전체적인 양상은 평균적으로 무관심한 것으로 나타날 수 있는 가능성이 존재함

 

 

#트렌드인터프리터 #시장분석 #COVID-19 #코로나19

#머신러닝 #탐색적데이터분석

[전용준. 리비젼컨설팅]