[ 빅데이터, Tableau ]
거주지 군집분석
① 개요
대한민국은 어떤 모습인가?
굉장히 막연한 질문이다. 질문자의 관심사에 따라 다양한 대답이 나올 수 있다.
그러면 좀더 구체적으로 대한민국의 시민들은 지역적으로 어떻게 분포하고 있는가?
여기서 지역은 무엇이고 시민은 무엇인가?
먼저 지역을 보자. 대한민국은 행정구역으로 보면 17개 광역시도, 226개 시군구, 3,559개의 행정동으로 이루어져 있다. 정부에서 행정적으로 관리하는 최소지역은 행정동이다. 지역적으로 어떻게 분포되었는가를 보는 단위의 수준을 광역시도, 시군구, 행정동으로 선택할 수 있다. 가장 최소 수준은 행정동이다.
시민이 어떻게 분포되어 있는가? 시민을 어떤 요소로 볼 것인가?
시민은 다양한 측면의 특성(혹은 속성)을 가지고 있다. 인구적 속성, 사회경제적 속성, 기타 문화적 속성 등. 인구적 속성과 사회경제적 속성이 시민의 속성에서 가장 일반적으로 파악하고자 하는 속성이다. 그러면 대한민국의 시민들은 지역적으로 어떻게 분포되어 있는가? 라는 질문은 다음과 같이 재정의 할 수 있다. 대한민국의 시민들은 행정동 수준에서 인구적 및 사회경제적 측면에서 어떻게 분포되어 있는가?
이를 위해 우리는 대한민국의 3,559개의 행정동별로 인구속성을 나타내는 성별 연령대별 인구수 데이터와 사회경제적 속성을 나타내는 가구소득, 학력, 직업 등의 데이터를 제시할 수 있다. 그러나 3,559개의 행정동별로 각각의 속성값을 일일이 파악하여 시민들의 지역적 분포를 일목요연하게 직관적으로 파악하기는 힘들다.
이러한 이유로 인구속성 및 사회경제적 속성 데이터를 기반으로 행정동을 몇 개의 군집으로 분류하면 보다 직관적으로 일목요연하게 대한민국 시민의 지리적 분포의 특성을 파악할 수 있지 않을까? 이를 통해 지역군집별 특성을 파악하고 그에 따른 다양한 업무적 활용방안을 도출하는데 효과적이지 않을까라고 생각할 수 있다.
이것이 행정동 군집화의 분석 이유이다.
행정동 군집화의 결과 13개의 군집으로 분류하였으며, 그 결과는 아래 그림과 같다. 가시적 이해를 돕기 위해 군집 분포도는 수도권(서울,인천,경기)지역만을 대상으로 제시하였다.
<그림1> 행정동 군집화의 결과(수도권지역을 중심으로) (made by Tableau) * 그림을 클릭하면 Tableau Public으로 연결됩니다.
위의 그림에서, 각 군집은 서로 다른 색깔로 표시되어 군집의 지리적 분포를 파악할 수 있다. 반면에, 13개의 군집이 혼재되어 모든 지역에 표시됨으로써 직관적 이해가 어려운 측면이 있다. 이에 특정한 군집만을 선택하여 해당 군집이 지역적으로 어떻게 분포되어 있는지를 살펴볼 수 있다.
<그림2> ‘고소득 핵가족 가구중심 군집’의 지리적 분포 (made by Tableau) * 이미지를 클릭하면 Tableau Public으로 연결됩니다.
이와 같이 행정동 군집화는 대한민국 시민의 지역적 분포를 일목요연하게 파악하는데 유용한 분석결과임을 알 수 있다.
다음에는 군집화의 분류기준 및 프로파일링에 사용된 행정동별 인구속성, 주택특성, 가구소득 등의 변수들간의 상관관계 분석 매트릭스를 통해 각 대한민국 행정동별 인구사회적 특성의 경향성을 분석하고자 한다.
그 다음으로는 군집분석의 결과로 도출된 군집 중 특성이 뚜렷한 군집에 대해 각 군집별 특성을 설명하고자 한다.
(다음 글에서 계속 이어집니다.)
본 포스트에서 다루는 <행정동군집분석 Report>는 Tableau Public에 게시되어 있습니다.
https://public.tableau.com/app/profile/heejo.shin/viz/_17300903403820/01_