[ 빅데이터, Tableau ]
대한민국 행정동 군집분석
② 지역 군집화: 행정동 속성정보들의 상관관계 매트릭스 분석
부부와 자녀로 이루어진 핵가족은 산업화시대의 일반적인 가족형태로 여겨졌다. 그러나 최근 20년간 진행된 저출산 고령화는 이러한 일반적 핵가족이 부의 상징이 되었다. 소득이 높은 사람들이 결혼하고 자녀를 낳고 또 그들이 고가의 아파트 밀집지역에 모여사는 지리적 구조화가 발생하는 것으로 나타났다. 이는 행정동별 주택인구 속성정보들의 상관분석 및 군집분석을 통해 이루어졌다.
지역별 군집분석을 하기 위해 필요한 정보들을 [표1]과 같은 내역으로 행정동별로 수집하였다.
수집된 정보들은 행정동별 (평균)가구소득, 주거유형별 비율, 주택시세, 그리고 인구속성 정보로 가구원수, 1인가구비율, 성별 비율, 연령대(미취학, 초등, 중고등, 20대, 30대, 40대, 50대, 60대, 65세 이상)별 인구비율 데이터 등이다. 주택수나 인구수 등은 행정동의 크기에 따라 영향을 받기 때문에 비교의 용이성을 위해 비율데이터를 생성하여 분석하였다.
<표1> 사용된 데이터와 수집 출처
먼저 가장 관심이 가는 행정동별 소득을 살펴보자.
행정동별 가구소득의 전체 평균은 6,697만원이고 최저소득 행정동의 가구소득은 1,453만원이고 최대소득 행정동의 가구소득은 2억 1,784만원이다. 제일 부자인(가장 잘사는) 동네와 가장 가난한(못사는) 동네의 차이가 2억이 넘는다. 행정동간 소득 양극화가 심각하고 점점 더 심화해 온 것으로 여겨진다. 이에 관해서는 시계열적 분석이 필요하나 추후의 과제로 미루고자 한다.
행정동별 소득과 다른 행정동 속성과의 상관관계를 살펴본 결과는 아래의 그림과 같다.
소득과 주택 유형별 비율, 주택시세, 그리고 인구 속성들간의 상관관계를 차례로 살펴보자.
<그림1> 행정동별 가구소득과 주택 및 인구 속성정보들간의 상관관계 (made by Tableau) * 그림을 클릭하면 Tableau Public으로 연결됩니다.
행정동별 가구소득은 아파트 비율과 강한 정(양)적 상관관계(.729)를 보이고 있고 반대로 단독주택비율과 강한 부(음)적 상관관계(-.688)를 보이고 있다. 즉 행정동의 아파트비율이 높을수록 단독주택 비율이 낮을수록 행정동 가구소득이 높은 경향이 있다. 이에 더하여 아파트를 포함한 공동주택의 주택시세와 가구소득은 매우 강한 정적 상관관계(.829)를 보이고 있다.
종합하면 행정동 소득은 아파트 비율과 공동주택 시세와 강한 정적 상관관계를 보이고 있어 주택가격이 높고 아파트 비율이 높은 행정동의 가구소득이 높은 경향을 보여준다고 볼 수 있다.
행정동별 속성정보들 간의 전체 상관관계 매트릭스는 아래 그림과 같다
<그림2>행정동별 속성정보들 간의 상관관계 매트릭스 (made by Tableau) * 이미지를 클릭하면 Tableau Public으로 연결됩니다.
행정동별 주택유형 비율과 인구속성 간의 상관관계를 보면, 아파트 비율과 40대인구 비율(.810), 평균가구원수(.788), 초등생 비율(.764), 중고등생 비율(.724), 미취학아동 비율(.704) 등이 강한 정적 상관관계를 보이고 있다. 반면 65세 이상 인구비율(-.817), 60대 인구비율(-.735), 1인가구 비율(-.523) 등으로 아파트 비율과 부적 상관관계를 보이고 있다. 이는 노인인구와 1인가구가 아파트 이외의 단독주택에 많이 거주하는 경향이 있는 것으로 여겨진다.
종합하면 취학아동을 가진 40대 가구들이 아파트 주택유형에 많이 거주하는 경향이 있다고 볼 수 있다.
인구속성들 간의 상관관계를 보면, 가구원수는 초등생 비율(.861), 중고등생 비율(.826), 40대인구 비율(.794) 등과 높은 상관관계를 나타내고 있다. 취학자녀를 둔 가구가 많은 행정동일수록 가구원 수가 많은 것을 알 수 있다.
30대인구 비율은 0세 인구 비율(.734) 및 미취학 아동 비율(.686)과 높은 상관관계를 보이고 있고, 또 다른 한편, 20대인구 비율(.721)과도 높은 상관관계를 보이고 있다.
40대인구 비율은 미취학 아동 비율(.793), 초등생 비율(.893), 중고생 비율(.792)과 높은 정적 상관관계를 보이고 있다.
30대는 어린 자녀를 두고 있는 젊은 가구를 형성하고, 40대는 취학 자녀를 둔 가구를 형성하는 것으로 볼 수 있다.
60대 이상의 인구비율은 50대를 제외한 모든 연령대의 인구비율과 부적 상관관계를 보이고 있다. 노인비율이 높은 행정동은 젊은 연령대의 인구가 적은 경향이 나타나는 것으로 여겨진다.
행정동별로 인구연령대의 분화현상이 가속화되고 있는 것으로 볼 수 있다.
행정동별 소득, 주택, 인구속성들의 상관관계 분석을 통해 행정동별로 소득, 주택, 인구의 구성이 차별화되는 경향이 있는 것으로 여겨진다. 취학자녀를 둔 핵가족 중심의 가구가 많은 행정동의 가구소득이 높고, 주거형태도 사람들이 선호하는 아파트 중심인 것으로 나타난다. 고령인구가 되어갈수록 이러한 행정동에서 벗어나게 되는 경향이 있다.
정부가 추진하는 다양한 계층이 어우러져 살아가는 소셜 믹스(Social Mix)정책과는 반대로 소득계층적으로 연령집단적으로 분화되어 지리적으로 차별적으로 구조화되는 것 같다.
(다음 글에서 계속 이어집니다.)
본 포스트에서 다루는 <행정동군집분석 Report>는 Tableau Public에 게시되어 있습니다.
https://public.tableau.com/app/profile/heejo.shin/viz/_17300903403820/01_