본문바로가기


지난호





|

PHYSICS PLAZA

새로운 연구결과 소개

등록일 : 2024-05-16 ㅣ 조회수 : 873

  

Heterogeneous Popularity of Metabolic Reaction from Evolution

이미진, 이덕선, Phys. Rev. Lett. 132, 018401 (2024).

세포 대사에서는 생화학 반응(이하 반응)들이 서로 잘 조율되어 작동하여 물질과 에너지의 생성과 소비를 가능하게 한다. 최근 수천 종의 생명체의 유전체가 밝혀지면서, 종마다 확인된 상이한 반응 효소들로부터 생화학 반응과 생합성 및 분해 경로가 데이터베이스화·전산화되었다. 이는 여러 방법론으로 이에 접근하여 다양한 종의 신진대사의 구조와 기능을 전체적으로 이해하는 기회를 제공한다. 예를 들어 개별 반응들의 상이한 존재 빈도와 더불어 다양한 대사 경로들의 상호 연결 구조의 계통학적 분석이 가능해졌다.

그림 1. 반응 인기도 분포. 실증데이터(삼각형)와 시늉내기(동그라미).그림 1. 반응 인기도 분포. 실증데이터(삼각형)와 시늉내기(동그라미).

특정 반응이 얼마나 많은 종의 신진대사에 포함되는가를 반응 인기도(reaction popularity)라고 볼 수 있는데, 해당 반응이 종들의 신진대사에 얼마나 보편적으로 필요한지를 나타내는 척도이다. 어떤 반응은 대부분의 종에게 중요한 기능을 수행하지만, 어떤 반응은 특별한 서식지에 있는 일부 종에게만 필요할 수도 있으므로 반응 인기도가 제각기 다른 것은 이해할 만 하다. 하지만 수천 종의 신진대사 데이터베이스를 분석하여 얻은 반응 인기도가 지수가 1인, 두꺼운 꼬리를 갖는 거듭제곱법칙(power-law) 분포를 따른다는 사실은 흥미롭다(그림 1). 이는 반응들의 인기도가 서로 대단히 다르며, 그 근간에 지수 1의 분포로 이끄는 원리가 존재할 가능성을 시사한다. 그 원리는, 각 반응의 본질적인 생화학적 중요성에 의해 인기도가 결정되거나, 진화 과정에서 무작위로 인기도가 구축된다는 원리일 수도 있다. 본 연구에서는 후자의 가능성을 탐색하였고 이로부터 세포 대사의 진화와 조직의 원리를 이해하고자 했다.

본 연구에서는 개별 종들의 신진대사의 진화가 종 분화와 함께 발생하는 모형을 수립하고 분석하여 비균질적인(heterogeneous) 반응 인기도와 꼬리가 두꺼운 분포의 기원을 설명했다. 신진대사의 진화를 다룬 이전의 연구들은 추상화된 하나의 네트워크가 새로운 반응과 효소를 추가하여 진화하는 모형을 고려했다. 생태계 진화의 최근 연구에서 영감을 얻은 본 연구에서는 긴 시간에 걸쳐 나타나는 종 분화와 조상과 후손 종들의 신진대사의 유사성을 고려한다(그림 2). 부모 종과 그 자손 종은 거의 동일한 신진대사 네트워크를 보유하며 어떤 반응이 최초로 도입된 시점이 빠르면 많은 후손 종이 그 반응을 보유하여 인기도가 높고, 이로부터 인기도 분포의 형태도 이해해볼 수 있다.

그림 2. 네트워크 진화 모형. (a) 신진대사 네트워크 확장 규칙. (b) 시늉내기 결과 형성된 종 계통 나무와 최초 종의 신진대사 네트워크.
그림 2. 네트워크 진화 모형. (a) 신진대사 네트워크 확장 규칙. (b) 시늉내기 결과 형성된 종 계통 나무와 최초 종의 신진대사 네트워크.

제안된 대사 진화 모형에서는 BioCyc 데이터베이스를 사용하여 몇 가지 매개변수를 미리 결정해 두었으며, 유일한 조절 매개변수는 개별 종의 신진대사의 진화 속도와 종 분화 속도의 비율 μ이다. 매 시각 각 종마다 이용할 수 있는 자원(화합물)을 바탕으로 사용할 수 있는 화학반응 꾸러미가 있고, 그 중 하나를 무작위로 선택하여 (1) 확장(expansion), (2) 휴지(rest), (3) 종 분화(speciation) 중 하나의 과정을 시도한다. 고려하고 있는 종의 신진대사 네트워크에서, 이번에 선택된 신규 반응과 기능이 ‘유사한’ 반응이 없다면 (1), 있다면 확률 μ로 (3)이 일어난다.

이 모형을 전산 시늉 내기하여 얻은 비균질적인 인기도 분포는 실제 분포와 매우 잘 일치했다(그림 1). 시늉내기가 주는 이점은 시간 변화를 관찰할 수 있다는 점인데, 종의 수와 서로 다른 반응의 시간 의존성, 그리고 개별 반응의 인기도 등을 분석할 수 있었고, 이로부터 인기도 분포는 계통수에서 각 반응이 최초로 등장한 시점의 분포로 치환될 수 있으며 이용 가능한 전체 대사 반응의 수가 무한하다면 지수가 2, 유한하다면 지수가 1인 분포가 됨을 발견하고 설명하였다. 또한 본 모형에서 얻은 개별 종의 신진대사 네트워크 구조와 종들의 계통 발생 특성이 실제 데이터와 잘 일치하여, 본 연구에서 제안된 모형이 신진대사 진화의 기본적인 모형이 될 수 있음을 보였다.



  

Higher-Order Components Dictate Higher-Order Contagion Dynamics in Hypergraphs

김정호, 고광일(고려대), Phys. Rev. Lett. 132, 087401 (2024).

수많은 구성원들이 상호작용하는 복잡계의 뼈대를 분석하는 복잡계 네트워크 연구가 지난 25년간 활발하게 진행되었다. 네트워크에서는 두 개의 노드(node, 구성원) 간의 상호작용을 에지(edge)로 나타낸다. 그러나 최근 들어 복잡계 안에서 여러 구성원이 동시에 상호작용하는 고차 상호작용이 보편적이라는 것이 드러나고 있다. 또한, 고차 상호작용은 기존의 두 노드 사이의 상호작용인 에지로 환원할 수 없고, 고차 상호작용의 존재는 새로운 물리현상들을 만들어 낼 수 있다는 것이 다양한 연구들에 의해 밝혀졌다. 고차 상호작용을 기술할 수 있는 대표적인 구조는 하이퍼그래프(hypergraph)이다. 하이퍼그래프는 구성원을 나타내는 노드와, 여러 구성원 사이의 상호작용을 나타내는 하이퍼에지(hyperedge)로 구성된다.

기존 복잡계 네트워크 과학에서 가장 중요한 개념 중 하나는 거대 컴포넌트(giant component)이다. 시스템의 크기가 무한으로 가는 열역학적 극한에서, 전체 시스템의 유한한 비율의 노드가 연결된 가장 큰 컴포넌트를 거대 컴포넌트라 한다. 거대 컴포넌트의 존재는 네트워크에서 집단행동(collective behavior)이 나타나기 위한 최소한의 필요조건이다.

네트워크에서는 거대 컴포넌트가 한가지로 명확하게 정의되지만, 하이퍼그래프에서는 거대 컴포넌트에 차수(order)가 있다. 두 하이퍼에지는 여러 개의 노드를 공유할 수 있는데, 공유되는 노드의 숫자가 연결의 차수이다. 컴포넌트가 m차 또는 그 이상의 차수로 연결되어 있다면 m차 컴포넌트라고 한다. 그리고 m이 2 이상이면 고차 컴포넌트가 된다(그림 1). 네트워크에서 거대 컴포넌트의 존재가 집단행동이 일어날 수 있는 최소한의 필요조건이었다면, 하이퍼그래프에서 거대 고차 컴포넌트는 어떤 역할을 하는지를 규명하고자 한 것이 본 연구의 시발점이다.

그림 1. m차 연결과 m차 컴포넌트.
그림 1. m차 연결과 m차 컴포넌트.

본 연구에서는 첫 번째로 거대 고차 컴포넌트가 있는 현실 세계의 하이퍼그래프와, 이에 대응되는 거대 고차 컴포넌트가 없는 무작위 하이퍼그래프에 고차 SIR (susceptible-infected-recovered)과 SIS (susceptible-infected-susceptible) 감염동역학을 적용시켜 보았다. 고차 감염 과정은 하나의 하이퍼에지 안에 n개의 감염된 노드(I)들이 있으면 βn의 속도(rate)로 그 안의 다른 감염 가능한 노드(S)들을 감염시키고, 각각의 감염된 노드(I)들은 μ의 속도로 회복되거나(R), 다시 감염 가능한 상태(S)가 된다.

그림 2. 거대 고차 컴포넌트가 존재하는 공저자 하이퍼그래프(파랑)와 부재하는 무작위 하이퍼그래프(빨강)에서 고차 SIR 감염과정을 진행하였을 때 고차 전염력(λh)에 따른 감염을 경험한 노드(R)의 비율(발병 규모). 1차 감염력은 0으로 두었다. h는 모든 차수의 고차 감염을 뜻한다. λh=βh/μ이다. 그림 2. 거대 고차 컴포넌트가 존재하는 공저자 하이퍼그래프(파랑)와 부재하는 무작위 하이퍼그래프(빨강)에서 고차 SIR 감염과정을 진행하였을 때 고차 전염력(λh)에 따른 감염을 경험한 노드(R)의 비율(발병 규모). 1차 감염력은 0으로 두었다. h는 모든 차수의 고차 감염을 뜻한다. λh = βh/μ이다.

그 결과 하나의 하이퍼에지 감염원에서 시작된 고차 감염과정이 유행하기 위해서는 고차 거대 컴포넌트의 존재가 필수적임을 확인했다(그림 2). 이는 1차 컴포넌트만 있을 때에는 고차 감염과정이 이루어지기 위해서는 2개 이상의 감염경로들이 필요하지만, 고차 컴포넌트가 있을 때에는 1개의 고차 연결만으로도 감염이 퍼질 수 있기 때문이다.

다음으로 우리는 이 결과가 거대 고차 컴포넌트의 존재 때문인지, 아니면 현실세계 하이퍼그래프의 다른 특성들 때문인지를 명확히 하기 위하여 거대 고차 컴포넌트가 존재하는 무작위 하이퍼그래프 모형을 개발했다. 복잡계 네트워크 연구에서 무작위 네트워크 모형으로 많이 사용되는 에르되시-레니(Erdős-Rényi) 네트워크를 만드는 방식으로 하이퍼그래프를 생성하면 거대 고차 컴포넌트가 존재하지 않는다. 우리는 거대 고차 컴포넌트가 존재하는 무작위 하이퍼그래프 모형을 만들기 위해 하이퍼그래프 생성과정에서 노드들이 함께 행동하는 서브그룹(subgroup) 개념을 도입하였다. 본 모형은 거대 고차 컴포넌트의 크기를 해석적으로 계산할 수 있다.

거대 고차 컴포넌트가 있는 본 모형과, 이에 대응되는 거대 고차 컴포넌트가 없는 무작위 하이퍼그래프에 앞에서와 동일하게 고차 SIR과 SIS 감염동역학을 적용시켰다. 그 결과 현실 세계 하이퍼그래프에서처럼, 하나의 하이퍼에지 감염원에서 고차 감염이 퍼지기 위해서는 거대 고차 컴포넌트가 필요함을 재확인했다. 또한 거대 고차 컴포넌트의 존재에 따라 1차 감염력(λ1)과 고차 감염력(λh) 공간에서의 상그림(phase diagram)이 크게 변화하는 것을 확인하였다.

본 연구는 그동안 고차 상호작용 연구에서 비교적 주목받지 못했던 거대 고차 컴포넌트가 감염동역학에 중요한 영향을 미침을 확인하였다. 앞으로 거대 고차 컴포넌트가 다른 동역학들에 미치는 영향이 어떠한지에 대한 후속연구들이 활발히 일어날 것으로 기대한다.



취리히 인스트루먼트취리히 인스트루먼트
물리대회물리대회
사이언스타임즈사이언스타임즈


페이지 맨 위로 이동