본문바로가기


지난호





|

특집

도시물리학: 우리는 어떻게 모여 사는가?

복잡계와 빅데이터로 이해하는 도시

작성자 : 엄영호 ㅣ 등록일 : 2021-05-11 ㅣ 조회수 : 9,498 ㅣ DOI : 10.3938/PhiT.30.009

저자약력

엄영호 교수는 2009년 KAIST 물리학과에서 박사학위를 받고 2016년부터 2020년까지 영국 스트라스클라이드대 수학 및 통계학과 조교수로 재직하였으며 2020년부터 서울시립대 물리학과와 도시과학빅데이터·AI연구소에서 조교수로 재직 중이다. 빅데이터에 기반하여 복잡계의 구조, 거동, 동역학과 집단현상을 탐구하고 있다.(yheom@uos.ac.kr)

Seeing Cities Through Big Data and Complex Systems

Young-Ho EOM

The data revolution of the 21st century provides us a huge amount of urban data. This featured article briefly surveys how physicists identify quantitative patterns from such data, make sense of those patterns by using simple models, and reveal the underlying mechanisms.

들어가는 말

본 특집은 도시물리학을 개관하고 최신 연구 결과와 동향을 소개한다. 첫 번째 글 - ‘복잡계와 빅데이터로 이해하는 도시’ - 에서는 물리학의 도구와 아이디어로 어떻게 도시를 이해할 수 있을지를 다루고, 두 번째 글 - ‘모빌리티 분석으로 이해하는 도시’ - 에서는 도시에서의 사람들의 이동에 대해 다룬다. 세 번째 글 - ‘도시 성장의 보편성’ - 은 도시의 성장에 대한 물리학을 다루고, 네 번째 글 - ‘건축가가 바라보는 다양한 도시의 미래 스마트 시티’ - 에서는 건축가와 도시계획가들이 전망하는 도시의 미래를 토의하면서 도시에 관심이 있는 물리학자에게 새로운 시각을 제공하고자 한다.

빅데이터 시대의 도시 연구

도시는 인적, 경제적, 사회적, 기술적 자본을 집적하여 인류 역사 속에서 사회 발전과 경제성장 그리고 혁신의 중심지 역할을 해왔다. 19세기 이후로 도시화는 더욱 가속되어 2018년 기준으로 전 인류의 55%가 도시에 거주하고 있으며 2050년 무렵에는 68%가 도시에 거주할 것으로 예상된다.1) 우리나라 또한 이미 10명 중 9명이 도시에 거주하므로 이 글을 읽는 대다수의 독자들은 도시 거주자일 것이다.2)

급격한 도시화에는 어두운 면 또한 존재한다. 현대 도시는 교통 체증, 거주지 공급부족, 환경 악화, 불평등, 기반시설 부족을 비롯한 여러 문제를 겪고 있다. 이러한 문제를 해결하기 위해서는 도시는 대체 무엇이며, 어떤 구조를 가지고 있고, 어떻게 진화해 가는지, 그리고 어떻게 작동하는지에 대한 보다 근본적인 이해가 필요하다.

최근 빅데이터 및 감지 기술의 발달로 도시에 대한 막대한 데이터가 수집되고 있다. 이러한 빅데이터는 지금껏 살피지 못했던 도시의 여러 측면을 측정, 추적, 기술하게 해주어 도시 이해와 도시문제 해결에 큰 도움이 될 것으로 보인다. 더 나아가 이러한 데이터를 바탕으로 도시 스스로 문제를 발견하고 해결하는 (자동차로 보자면 자율주행차라고 할 수 있는) 스마트 도시의 개념도 제안되어 많은 연구자들이 이를 실현하기 위해 노력하고 있다. 하지만 4차 산업혁명과 빅데이터, 인공지능에 대한 현재의 열기와 관심에도 불구하고 빅데이터에 기반한 도시 이해는 아직 갈 길이 멀다. 도시 빅데이터를 분석하거나 이해하기 위한 도구와 이론의 발전이 여전히 부족하기 때문이다.

현상에 대한 방대한 데이터가 있다고 해서 공짜로 현상에 대한 통찰이 주어지는 것은 아니다. 특히 도시에 대한 방대한 데이터는 대개의 경우, 연구나 분석을 위해 수집된 것이 아닌 행정, 관리, 사업 등의 다른 목적을 가진 활동의 부산물로 생긴 경우가 많고 방대한 데이터의 본질상 당면 문제와 관련이 없는 부분이 많을 수밖에 없기 때문에, 제대로 깊게 들여다 보아야 한다. 이는 경제학을 비롯한 다른 분야의 빅데이터 기반의 연구에서도 공통적으로 주의해야 할 사항으로 지적되고 있다.3)

물리학은 어떻게 도시를 연구할 수 있는가?

역사적으로 물리학자들은 복잡한 관측데이터로부터 패턴을 찾아내고 패턴을 잘 설명하는 메커니즘을 상대적으로 단순하지만 정량적인 모델을 통해 알아냈다. 이러한 모델과 메커니즘은 물리학자로 하여금 현상을 이해하는데 도움을 주었을 뿐만 아니라 현상을 예측할 수 있게 하였다. 17세기에 티코 브라헤의 행성 관측 데이터로부터 요하네스 케플러는 행성 운동의 법칙을 이끌어냈고 아이작 뉴턴은 이 법칙들을 중력 모델을 이용하여 설명하였다. 이 결과로 우리는 현재 행성의 먼 미래의 궤도를 매우 정확하게 예측할 수 있다. 20세기에는 DNA의 x선 회절 데이터를 바탕으로 제임스 왓슨과 물리학자인 프랜시스 크릭은 이중나선 모델을 제안하여 DNA 복제 과정을 설명하여 분자 수준에서 유전 현상을 이해하는데 큰 기여를 하였다. 이런 사례로 볼 때, 물리학자들이 도시 현상에 대한 빅데이터로부터 도시의 구조와 동역학에 대한 패턴을 찾아내고 이를 설명하는 메커니즘을 정량적 모델을 통해 찾으려고 하는 것은 딱히 놀라운 일이 아니라고 할 수 있다.

그렇다면 물리학자는 어떻게 도시 빅데이터로부터 패턴을 찾아내고 이를 이해하는 모델을 만들 것인가? 물리학자들뿐만 아니라 다른 분야의 도시 연구자들에게도 현재 주목받고 있는 아이디어는 도시를 단순히 사람과 건물들이 높은 밀도로 있는 장소로 볼 것이 아니라 사람, 탈것, 에너지, 물류, 정보 등의 요소들이 여러 층위의 네트워크를 통해 흐르는 복잡다단하면서 역동적인 무엇으로 바라보아야 한다는 것이다.4) 다르게 말하자면, 도시는 하나의 복잡계이며 도시의 특징적인 현상들은 도시를 이루는 많은 구성요소 간의 상호작용을 통해 창발된 현상이라는 것이다.5) 이렇게 도시를 복잡계로 바라봄으로써 물리학자들은 복잡계를 이해할 때 사용하는 통계물리학, 비선형 동역학 및 네트워크 과학 등의 강력한 도구를 가지고 도시 빅데이터로부터 도시의 구조, 거동, 동역학의 패턴을 찾아낼 뿐만 아니라 이 패턴을 설명하는 메커니즘을 알아내어 물리학자만이 제공할 수 있는 통찰을 주고자 한다.

도시물리학 연구 사례: 어떻게 패턴을 찾고 이를 설명할 메커니즘을 찾을까?

물리학자들이 도시 빅데이터로부터 패턴을 찾는 사례로서 도시교통 흐름의 연구 사례6)를 소개하고, 패턴을 설명하는 메커니즘을 모델링을 통해 찾는 사례로서 도시의 단핵-다핵 구조 간의 전이 연구 사례7)를 간략히 소개하겠다.

도시교통 흐름의 여과 분석. 도시 도로망 위의 차량 흐름의 변화는 정체 상태와 원활 상태를 오간다. 우리는 경험적으로 출퇴근 시간에 정체가 심하고 다른 시간에는 상대적으로 원활한 소통을 한다는 것을 알고 있다. 통계물리학자들은 이러한 정체-원활 상태 사이의 전이를 차량들의 상호작용에 의한 집단 현상의 하나로 보고 이를 이해하려고 노력해왔다.8)

Fig. 1. Road traffic flows in Seoul on Apr. 15th 2021. (A) Measured at 8:29. (B) Measured at 14:05. The images are generated by TOPIS, the transport operation & information service of Seoul.[9]
Fig. 1. Road traffic flows in Seoul on Apr. 15th 2021. (A) Measured at 8:29. (B) Measured at 14:05. The images are generated by TOPIS, the transport operation & information service of Seoul.9)

최근 도시 규모에서 도로망의 교통 흐름에 대한 데이터를 수집하는 것이 가능함에 따라 기존에 연구되었던 고속도로와 같은 일차원 구조의 도로를 넘어서 도시 규모의 도로망에서 거시적 교통 흐름의 정체가 어떻게 일어나고 사라지는지에 대한 관심이 커지고 있다. 단순한 구조의 고속도로와는 달리 복잡한 도시의 도로망이 얼마나 정체를 겪는지를 정의하는 것은 훨씬 어려운 일이다. 간단히 생각하면 각 도로의 속도의 평균을 구하거나 혹은 전체 도로 중 정체를 겪는 도로의 비율을 구하거나 할 수 있겠지만 이러한 방식은 많은 정보를 잃게 된다. 예를 들어 [그림 1]은 서울시 교통정보 시스템 TOPIS9)로부터 내려 받은 2021년 4월 15일의 시간에 따른 서울 도로망의 흐름을 나타낸다. 초록색 도로는 원활, 노란색 도로는 서행, 빨간색 도로는 정체된 상태이다. 그림 1(A)는 오전 8시 29분, (B)는 오후 2시 5분의 도로망의 흐름을 각각 나타낸다. 두 시점에서 도로망의 평균속도는 각각 20.9 km/h와 21.9 km/h로 비슷하지만 정체된 도로의 분포는 상당히 다름을 알 수 있다. 출근시간 대에는 도심부의 소통이 상대적으로 원활하지만 도시를 전체로 이어주는 도로들은 정체 중이고 따라서 도시의 한 부분에서 다른 부분으로 갈 때 항상 정체를 겪을 수밖에 없는 상황이다. 이에 반해 오후 2시 무렵에 도심부는 상대적으로 정체 상태이지만 도시를 전체로서 이어주는 도로들이 원활하기 때문에 정체되는 지역을 굳이 통과하지 않아도 도시의 주요 부분에 도달 가능하며 이는 도로망으로서 더 잘 기능한다고 볼 수 있다.

전체 도로망의 교통 흐름 패턴을 정량적으로 기술하기 위해 통계물리학의 여과 이론(Percolation theory)의 아이디어를 사용할 수 있다. 여과 이론은 다공성 물질부터 추상적인 네트워크까지 시스템을 가로지르는 거시적인 연결상태가 만들어지는 과정에 대한 이론이며 이를 이용하면 도로망, 인터넷, 전력망 등의 네트워크가 네트워크로서 기능을 수행하는지 알 수 있다. 서울 도로망의 예처럼 네트워크가 전체로서 제대로 기능하려면 단순히 연결이 얼마나 많은지 보다 연결들이 네트워크를 가로지르는 덩어리를 만들 수 있느냐가 중요하다. 이러한 덩어리가 존재하지 않는다면 네트워크는 조각난 상태이고 기능을 유지한다고 보기 어렵다. 이는 인터넷이 전체적으로 연결되어 있지 않고 일부 도메인만 도달할 수 있거나 전력망이 조각나서 대다수가 전력을 사용할 수 없는 상황에 비유될 수 있다. 여과 이론은 거시적으로 연결된 덩어리의 유무를 확인하여 네트워크가 조각난 상태인지 연결된 상태인지를 구분하게 해주고 이 상태들 사이의 상전이를 설명한다.

Li와 공동연구자들은 중국 베이징 도로망의 속도 데이터를 이러한 여과 이론의 방법을 통해 분석하여 하루 동안 전체 도로망의 소통 기능이 어떻게 변화하는지 정량화하였다. 특히 각 시점에서 원활 도로의 연결된 덩어리가 조각으로 깨어지는 지점의 전후를 비교하여 도로망의 병목을 찾아냈다.6) 이러한 병목 도로들은 속도를 조금만 개선시켜도 도로망이 전체로서 기능하는데 큰 도움을 주는 도로라는 것을 확인하였다. 이 병목들은 실제 흐름에 대한 고려없이 단순히 도로망의 구조만을 분석하거나 다른 방법으로는 찾아진 적이 없기 때문에 통계물리학의 아이디어를 이용한 데이터 분석의 강력함을 보여준다.

단핵에서 다핵 도시로의 전이의 메커니즘 찾기. 대개의 도시에는 경제 및 사회 활동의 중심지 또는 핵(center)이라고 불리우는 곳이 존재한다. 서울의 경우, 종로와 광화문 일대, 강남역 부근 등을 중심지로 볼 수 있다. 중심지의 수, 활동 수준, 위치 등은 데이터로 통해 확인 가능하다. 연구들은 여러 국가의 핸드폰 사용 데이터를 통해 특정 장소의 특정 시간에 얼마나 많은 사람들이 있음을 추산하였고 이를 이용하여 도시 내 중심지들을 찾고 하나의 중심지를 가지는 단핵 도시와 여러 중심지를 가지는 다핵 도시가 있음을 확인하였다.10)11) 특히 중심지의 숫자(\(\small H\))와 도시의 인구(\(\small P\)) 사이에 다음의 멱함수 관계가 있음이 관측되었다.

\[H \approx P^\beta ,~~~ 0.5 \leq \beta \leq 0.7\]

이 관계식은 인구가 늘어나면서 도시가 자연스레 단핵에서 다핵 도시로 전이하게 됨을 알려줄 뿐만 아니라 전이 지점 또한 예측할 수 있게 해준다.

Fig. 2. The monocentric (A), distance-driven polycentric (B), and attractivity-driven polycentric (C) regimes as produced by the model of Louf and Barthelemy. Each link represents a commute to an activity center. Reproduced with permission from Ref. [7], American Physical Society.
Fig. 2. The monocentric (A), distance-driven polycentric (B), and attractivity-driven polycentric (C) regimes as produced by the model of Louf and Barthelemy. Each link represents a commute to an activity center. Reproduced with permission from Ref. [7], American Physical Society.

그럼 중심지는 어떻게 생기는 것이고 도시의 인구와 중심지 사이의 관계를 만들어내는 메커니즘은 무엇인가? 경제학자들은 지역의 임금, 임대료, 통근비용 등의 요소를 고려한 수학적 모델을 통해 기업들이 매력적인 장소에 뭉쳐지는 집적의 경제(economy of agglomeration) 효과로 중심지가 생겨남을 보여주었다.12) 하지만 이 모델들은 인구가 늘면서 중심지가 멱함수 형태로 늘어나는 관찰된 패턴을 설명하지 못한다. 이에 Louf와 Barthelemy가 진행한 도시물리학 연구는 이 전이의 메커니즘을 찾기 위해 경제학자들의 기존 모델을 임금과 통근비용이라는 두 요소로 단순화하였고 나아가 임금과 같은 굉장히 많은 요소와 상호작용을 가진 복잡한 양을 어떤 무작위한 양으로 취급하였다.7) 이러한 단순화는 모델의 어떤 요소가 작동 메커니즘으로 작용하여 현상에 기여하는지를 파악할 수 있게 하였으며 데이터를 통해 모델을 검증해 볼 수 있게 해주었다. 다르게 말하자면, 그들의 모델은 중심지의 매력과 교통 체증이라는 두 메커니즘 사이의 경쟁이 도시 진화에 작동하며 따라서 인구가 증가하면서 단핵 구조가 불안정해지며 다핵 구조로 전이한다는 것을 보여주었다. 인구가 적을 때는 정체 또한 작기 때문에 모든 사람이 가장 높은 임금을 받을 수 있는 곳으로 몰리면서 하나의 핵이 생기지만[그림 2(A)] 인구가 늘면서 교통 체증으로 인해 통근비용이 늘어나게 되어 하나의 중심지는 불안정해지고 새로운 중심지들이 통근 비용과 장소의 매력의 상대적 수준에 따라 생기게 된다[그림 2(B) and (C)].

Louf와 Barthelemy는 또한 그들의 모델의 예측을 미국 도시들의 고용자 수와 인구 데이터를 통해 검증하였고 모델이 관측된 멱함수 관계를 잘 설명하며 교통 정체 효과가 중심지 수에 미치는 영향을 입증하였다. 이들의 연구는 물리학자가 어떻게 단순한 모델을 통해 현상의 메커니즘을 찾고 모델을 데이터로 검증하는지를 보여주는 좋은 예라고 할 수 있다.

맺음말

물리학은 기존에 다루던 현상을 넘어서 새로운 분야를 개척해 나가는 것에 능하다. 예를 들어, 생물물리학 분야는 한국물리학회에 생물물리학 분과가 있을 정도로 성장하였고 확고한 분야로 자리잡았다. 또한 경제물리학 및 사회물리학 등의 분야도 경제, 사회 현상을 다루며 새로운 물리학의 분야로 자리잡아가고 있다. 도시물리학은 물리학의 아이디어를 도시 현상에 적용할 뿐만 아니라 도시에 대한 정량적이고 예측가능하며 데이터로 검증 가능한 이론과 모델을 개발하여 도시에 대한 이해를 높이고 도시 문제를 해결하는 데에도 실질적인 도움을 주면서 이들 분야들처럼 성장해 나갈 것으로 믿는다. 특히 빠른 속도로 축적되는 도시빅데이터의 존재는 도시물리학의 잠재력을 현실화하는데 큰 도움을 줄 것이다.

다만 도시물리학이 풍부하고 질 높은 데이터에 크게 의존하기 때문에 데이터에 대한 한 가지 아쉬운 점을 강조하고 싶다. 현재 중앙정부와 지자체 모두 데이터 개방의 필요성에 공감하고 있고 공공 데이터 포털13) 및 서울시 열린 데이터 광장14) 등을 통해 여러 데이터의 개방이 이루어지고 있다. 하지만 일반시민의 필요성에 치중되어 학술연구용으로 쓰이기에는 데이터의 종류, 양, 질 모두 부족한 경우가 많다. 또한 데이터에 대한 데이터(메타 데이터)가 부족하여 공개된 데이터조차 제대로 활용하기 힘든 경우가 있다. 노력하고 계신 것을 알지만 더 적극적인 데이터 공유 및 개방을 부탁드린다. 도시에 대한 이해가 높아진다면 도시 문제를 더 잘 해결할 가능성도 함께 커지니 시와 공공기관에도 궁극적으로 큰 도움이 될 것이다. 또한 기업이 보유한 데이터는 대개 공개되어 있는 경우가 드물다. 빅데이터 시대에 데이터는 그 자체로 기업의 자산이라 공유가 어려운 점은 충분히 이해하지만 기업의 핵심 자산이 아니고 특히 학술 연구 목적의 경우, 데이터 공유의 문턱을 낮추어 주신다면 큰 사회공헌이 될 수 있다고 기업 관계자들께 말씀드리고 싶다. 예를 들어, 외국의 기업처럼 4차 산업 혁명 시대의 인재를 키우기 위해 데이터 분석 경진대회 등을 통해 데이터를 공유하는 것도 한 가지 방법일 것이다.

복잡다단한 측면을 가진 도시에 대한 과학은 본질적으로 하나의 학문 분야만의 관점이 아닌 초학제적인 협력을 요구한다. 지리학, 경제학, 사회학, 교통공학, 도시공학, 건축학, 토목공학, 컴퓨터 과학 등 많은 학문들이 도시에 대해 연구하고 있다. 필자가 속한 서울시립대학교 또한 2020년 6월 도시과학빅데이터·AI 연구소를 설립하여 물리학과, 도시공학과, 교통공학과, 공간정보공학과, 통계학과, 도시빅데이터융합학과, 스마트시티학과에 속한 필자를 포함한 여러 연구자들이 참여하고 있다. 현재 서울시의 공공 빅데이터 분석을 통해 서울의 교통, 시민생활, 공공기반시설, 환경 문제 등을 해결하기 위해 노력 중이다. 이 글을 통해 강조한 것처럼 물리학은 인류의 대다수가 살고 있는 도시를 이해하는데 충분히 기여할 수 있고 앞으로 더 크게 기여해야 할 것이라고 믿는다. 도시라는 복잡계를 이해하기 위해 많은 물리학자들의 관심과 참여를 기대하며 글을 마친다.

각주
1)Department of Economic and Social Affairs, United Nations https://www.un.org/development/desa/en/news/population/2018-revision-of-world-urbanization-prospects.html. (2021년 4월 22일 접속 가능)
2)e-나라지표, 도시지역 인구현황 https://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1200. (2021년 4월 22일 접속 가능)
3)L. Einav and J. Levin, Science 346, 715 (2013).
4)M. Batty, The new science of cities (MIT press, 2013).
5)M. Barthelemy, Nat. Rev. Phys. 1, 406 (2019).
6)D. Li et al., Proc. Natl. Acad. Sci. USA 112, 669 (2015).
7)R. Louf and M. Barthelemy, Phys. Rev. Lett. 111, 198702 (2013).
8)Dirk Helbing, Rev. Mod. Phys. 73, 1067 (2001).
9)TOPIS(서울시 교통정보 시스템) https://topis.seoul.go.kr. (2021년 4월 24일 접속 가능)
10)T. Louail et al., Sci. Rep. 4, 5276 (2014).
11)T. Louail et al., Nat. Commun. 6, 6007 (2015).
12)M. Fujita and H. Ogawa, Regional Science Urban Economics 12, 161 (1982).
13)공공데이터포털 https://www.data.go.kr/. (2021년 4월 24일 접속 가능)
14)서울 열린데이터광장 https://data.seoul.go.kr/. (2021년 4월 24일 접속 가능)
물리대회물리대회
사이언스타임즈사이언스타임즈


페이지 맨 위로 이동