Login    Mobile
Hint Food 맛과향 Diet Health 불량지식 사 례 바로보기 위 로 자연과학 원 료 제 품 Update Site

Link통찰력

멱함수 Powder law

- 작은 산불이 대형 산불의 참사를 막는다



코넬 대학의 스티븐 스트로가츠 교수에 따르면 매 10년마다 알파벳 C로 시작하는 중요한 이론들이 나타났다고 한다. 지난 1960년대에는 사이버네틱스(Cybernetics) 이론, 1970 년대에는 카타스트로피(Catastrophe) 이론, 1980년대에는 혼돈(Chaos) 이론, 그리고 1990년대에는 복잡계(Complex System) 이론이 그것이다.

디지털 네이티브는 정보를 일방적으로 수신하는 ‘다운로드 세대’에서 스스로 구하고 발신하는 ‘업로드 세대’로 변신했다. 하지만 개인이 생산하는 무수한 디지털 데이터는 큰 이야기와는 상관없는 사소한 이야기, 즉 정보의 노이즈에 불과한 것이 대부분이다. 우리가 언제 어디서 무엇을 구입했는가, 취향은 어떻고 지불 능력은 어떤가 하는 시시콜콜한 정보는 신용카드 회사에 의해 일일이 수집되고 있다. 이처럼 우리의 일상생활 모두는 기록되고, 방대한 데이터베이스에 구축된다.

21세기 신개념 과학인 복잡계 네트워크 이론의 창시자 앨버트 라슬로 바라바시는 ‘버스트’에서 인간의 행동은 이산적이고 독립적이고 무작위적으로 움직이는 것이 아니라 단순하고 재현 가능한 모종의 패턴에 따라 움직이며, 그 패턴은 모종의 폭넓은 법칙에 지배된다고 말한다.

나아가 저자는 이제 단순한 인적 관계의 네트워크를 분석하는 것을 뛰어넘어 인간의 행동 패턴을 분석하고 예측하는 일마저 가능하다고 말한다. 게다가 이것은 인간 행동 분석에 필요한 데이터가 저절로 수집되고 있기에 가능하다는 것이다. 그는 이 주장을 논증하기 위해 무슬림 이름 때문에 미국연방수사국(FBI)에 심문당하는 것이 지긋지긋해 자신의 현재 위치와 상황을 남기는 것을 프로젝트화한 중동인 예술가 하산 엘라히를 등장시키는가 하면, 1달러 지폐에 ‘조지는 어디에?’라는 표시를 한 뒤 그 화폐를 추적하는 사이트를 소개하는 등 다양한 사례를 제시한다.

저자는 e메일 발송과 웹브라우징 습관, 전화 통화, 도서관의 대출, 병원 방문, 위인들의 서신 교환 등 모든 인간 활동에는 긴 휴식기 뒤에 격렬히 폭발하는 짧은 기간이 오는 하나의 패턴이 나타난다는 것을 증명한다. 그런데 그 패턴은 모두 멱함수 법칙을 따른다. 세계대전 발발이나 갑부 등장, 월드와이드웹의 허브 출현처럼 큰 사건일수록 드물게 마련인데 그것이 멱함수 법칙의 핵심이다. 멱함수 법칙이 있는 곳에는 늘 ‘예욋값’이 존재한다.

인간 행동에 이렇게 폭발성이 드러나는 것은 ‘해리 포터’ 시리즈가 출간된 날이나 메이저 리그의 챔피언 시리즈가 열리는 날에는 병원에 가서 치료하는 일마저 미루는 것과 같은 인간의 ‘우선순위 설정’ 때문이다. 우리가 한정된 자원을 잘 활용하기 위해 늘 우선순위를 설정하기 때문에 행동 패턴이 멱함수 법칙을 따를 수밖에 없으며, 일단 우선순위가 정해지면 멱함수 법칙과 폭발성이 필연적으로 등장한다는 것이다.

폭발을 뜻하는 ‘버스트’란 책 제목은 ‘인간은 어떻게 행동하는가’에 대한 답변의 요지라 할 수 있다. 주식 가격의 연쇄 폭등과 폭락, 글로벌 경제 현상, 어느 날 갑자기 터지는 누리꾼들의 댓글 잔치, 그로 말미암아 각광을 받은 루저, 거리로 물밀듯 쏟아져 나온 촛불시위 군중 등 주변에서 일어나는 현상의 이면에 숨은 법칙이 있는데 그것이 바로 버스트다. 이런 폭발성은 인간의 의지나 의식보다 깊은 기원을 갖고 있다는 것이 저자의 판단이다.

불륜, 무능력, 도둑질, 질병, 고난, 우정, 미움 등 그 어떤 것도 숨길 수 없을 만큼 모든 사람의 삶이 유례없이 면밀하게 관찰돼 세세히 기록되면서 사람들의 모든 행동을 정량화하는 과학까지 태동하는 바람에 우리는 그동안 지극히 당연시했던 프라이버시마저 포기해야 할지 모른다고 경고한다. 어쩌면 이 점이 저자가 말하고자 하는 핵심이라 할 수 있다.

저자는 16세기 십자군을 이끌었던 비운의 헝가리 대장 죄르지 세케이의 인생행로와 인간 역학의 발전 과정을 교차시키면서 이야기를 이끌어나간다. 무명의 범죄자라는 밑바닥에서 출발해 우연한 하나의 폭발적 사건으로 두각을 드러내기 시작한 다음, 불과 3개월 만에 왕이라는 정상에 도달할 뻔했던 세케이야말로 역사의 무작위성과 예측 불가능성을 상징하는 ‘예욋값’ 같은 존재다.

세케이의 일생을 다룬 부분은 박진감이 넘치는 소설과 같다. 저자는 물리학, 천문학, 컴퓨터과학, 생물학 등 다양한 학문에 대한 지식을 총동원해 매우 평이하게 이야기를 전개한다. 이 책은 끔찍한 미래에 대해 불안에 떨게 만들기도 하지만 독특한 상상력과 뛰어난 통찰력으로 흥분시키기도 한다.

-------------

“뜻밖의 ‘멱함수’ ‘허브’ 발견…네트워크 이론 불지펴” (2)
BY 오철우   l  2010.08.27 ‘네트워크 세상과 네트워크 연구 동향’에 관해
정하웅 카이스트 교수와 인터뷰 하다 (8월19일 낮 서울역사 안 ‘서울역그릴’ 레스토랑에서)


# 1999년, 네트워크의 ’허브’와 ‘멱함수’를 처음 발견

사실 생각해보면 당연할 수 있거든요. 네트워크를 점과 선으로 연결되는 것으로 단순화하면 세상에 그렇지 않은 게 없을 정도니까요. 오히려 지금에서야 갑자기 주목을 받는 게 더 이상할 수도 있는데, 사실 지금이 적당히 시점이기 때문인 것도 같아요. 인터넷 시대에 와서 많은 정보가 축적되고 손쉽게 접근이 가능해지면서 발전할 수 있게 된 거거든요. 그런데 사실 네트워크의 기본 개념은 수학에서, 그래프이론에서 먼저 했죠. 점과 선으로 한 붓 그리기 문제 같은…


‘그래프’라는 건 뭘 말하나요?


수학에서는 네트워크 대신에 그래프라고 말합니다. 점과 선으로 이루어진 대상이죠. 점과 선을 연결한 거니까, 사람들이 다 친숙해하는 점 이어 그림 그리기 같은 것도 그래프죠. 그래프이론은 예전부터 있었고, 수학하는 사람들이 그걸 모델로도 여러 가지를 설명했고 기하학적인 문제로 풀기도 하고 했는데, 그걸 직접 갖다 쓰는 일은 많지 않았죠. 그걸 시작한 게 1998년, 1999년이지요. 그때 처음 (네트워크 과학이라는 게) 시작이 된 거죠.


당시에는 ’네트워크 과학(network science)’이라는 말조차 없었겠죠?


네, 사실 붐이 된 건, 조금 과장해서 얘기하면, 저희가 1999년에 월드와이드웹을 처음 분석해 (네트워크 과학의) 가능성을 보여준 건데요. 그런 다음에 거슬러 올라가보니까 1998년에 네트워크 관련해 유명한 스탠리 밀그람의 ’좁은 세상’ 논문(* ‘좁은 세상’ 네트워크란, 연결망이 커져도 연결망 안의 노드들은 몇 단계만 건너면 서로 연결된다는 의미로 요약된다)도 있었더라고요. 저희 논문은 처음으로 월드와이드웹이 어떻게 연결돼 있는지 분석한 논문이죠. 웹 페이지를 점으로 보고 클릭하면 다음 페이지로 넘어가잖아요. 그것들이 어떻게 연결됐는지 처음으로 본 거죠. 그게 항공망 허브처럼 생겼다고 밝힌 거고요. 재미있는 게 그 이전에는 수학 모델에서 항공망보다는 고속도로망처럼 골고루 잘 연결된, 균일하게 연결된 구조에 대한 모델만 있었거든요. 처음에는 우리도 그런 생각을 했어요. 웹페이지를 클릭해 넘어갈 수 있는 연결선의 크기가 대략 20-30개 정도일 거다, 그래서 만약에 통계를 내보면 대부분 ‘연결선 20개’이라는 숫자 근처에 모여 있을 것이다, 즉 대부분 20개 정도 연결돼 있을 것이다, 그렇게 추측했는데, 옛날의 그래프이론들은 그렇게 생각했는데, 그런데 실제로 해보니까 그렇지 않고 허브가 있었다는 거죠. 멱함수가 거기에서 나오는데요.

그런 그림은 많이 보시지 않았나요? (멱함수 네트워크의 그림을 보여주다. 아래 그림 오른쪽) 월드와이드웹의 네트워크에서 항공망 같은 구조가 나왔고요, 사실 멱함수가 나왔다는 게 중요한 거였는데, 통계물리에서는 멱함수라는 게 나오면 통계물리 하는 사람들은 좋아합니다. 왜냐하면 멱함수가 나온다는 것은 거기에 재미있는 현상이 있다고 얘기가 되거든요. 그래서 시작은 통계물리 하는 사람들이 관심을 갖고 달려든 겁니다.

네. 엑스 분의 1 같은 분수함수 같은 건데요. 네트워크를 두 종류로 나눌 수 있어요. 좋은 분류는 아닙니다만, 고속도로망을 생각하시면, 여기 점들마다 연결선의 갯수를 세어 엑셀파일에다 그려보면 대부분 이렇거든요(위 그림 왼쪽). 한족에 거의 다 모여 있거든요. [아 어디 한쪽에 수렴이 되는 거네요] 네. 여기에 다 모여 있는 거거든요. 그런데 항공망(그림 오른쪽)에서는 연결선을 보면, 대부분 조그만 공항들은 연결선이 적어서 대부분 이곳에 몰려 있고 이런 곡선으로 떨어지고 이게 분수함수처럼 생겼다는 거거든요. 그러니까 원래는 이렇게(왼쪽 그림처럼) 생겼을 거라고 생각했는데 실제 해보니까 이렇게(오른쪽 그림처럼) 나왔다는 게 특이한 연구결과였죠. 이런(오른쪽) 그림이 그려진다는 것은 허브가 존재한다는 걸 말해주죠.


오른쪽 그림의 곡선을 멱함수라고 합니까?  지수함수와 비슷하네요.


지수함수와 조금 달라서. 지수함수에서도 곡선이 떨어지기는 하는데, 훨씬 더 빨리 떨어집니다. 어느 정도 빨리 떨어지느냐 하면, 여기 그림을 보면 금방 0이 되어 버리는 거죠.

멱함수에서는 여기에 보시면 여기에 모여 있고 이것도 멀리 가면 결국에는 0이 되는데, 그런데 여기에서는 빠르게 0이 되는 건 아니죠. 지수함수가 ’지수함수적으로 감소한다’ 하면 그건 금방 0이 되는 거거든요. 그런데 멱함수 여기에서는 되게 천천히 0이 되는 겁니다. 예를 들어서 고속도로에서 연결선(가로축)이 10개인 곳에서도 사실 0(세로축)은 아니거든요. 500쯤 되는 데에서 숫자를 계산하면 10의 마이너스 99승 쯤 되거든요. 여기 지수함수에서 보면 그렇죠. 그런데 여기 멱함수에서는 500 되는 곳이 10의 마이너스 6승입니다. 그러니까 10의 90승배 차이가 나는 거니까 둘은 전혀 다른 것이죠. 월드와이드웹으로 말씀드리면, 500개 연결된 웹페이지가 있느냐 라는 문제가 되고, 고속도로에서는 500개로 연결된 도시가 있느냐 하는 문제인데 그건 계산해보면 고속도로에선 그게 10의 머이너스 99승이니까 그런 건 거의 없다, 거의 0인데, 그런데 웹페이지에서 계산해보면 10의 마이너스 6승이니까 있을 수 있다는 거에요. 그러니까 웹페이지가 1억개 쯤있으면 그런 게 100개쯤 있다는 거거든요.

# 척도 없는 네트워크란?
  ‘척도를 말하기 힘든’, ‘허브를 지닌’ 멱함수의 네트워크


지금 교수님도 그런 말을 쓰셨는데, 네트워크 이론에서 가장 이해하기 어려운 말 중 하나가 ‘스케일 프리(scale-free)’ 즉 ‘척도 없는’이라는 표현인데요… “척도 없는 네트워크”라는 말을 몇 번 취재할 기회가 있었는데 아직도 잘 이해가 되지 않더라고요. 중요한 단어인 것은 같은데…


네 중요한 용어죠. 그런데 번역이 참 어려워서, ‘척도 없는’ 이렇게 번역되잖아요. 먼저 스케일을 생각하시면 되는데, 스케일이라는 게, 예를 들면 어느 정도 스케일의 공사를 한다 이렇게 말하면 그건 스케일을 어느 정도 얘기할 수 있다 그런 의미이거든요. 또 예를 들면 사람의 키는 1-2m라는 스케일로 얘기할 수 있고, 그런 숫자라면 대표성이 있는 숫자가 되는 것이고요. 또 예를 들어 만일 고속도로에서 연결선을 말한다면 4개라는 숫자가 어느 정도 대표 숫자가 되거든요. 4라는 게 이 고속도로의 연결망 시스템의 성질을 얘기해주는 것인데, 그런데 척도 없는 네트워크에서는 그런 게 없다는 거거든요. 물론 여기에서도 월드와이드웹의 연결선은 1개가 가장 많지만, 1이 모든 것을 설명하지 못하고 게다가 500개짜리도 있거든요. 확률은 작지만 500개 짜리에도 확률이 있는 겁니다  그런 확률이 있고 무시할 수 없는 정도라는 거죠. 그래서 어떤 특정 스케일을 얘기할 수 없다는 겁니다. 그래서 스케일이 없다, 척도가 없다 이렇게 얘기하는 겁니다. 그런 척도 없는 네트워크에서는 대푯값이나 평균도 의미가 없다는 것이죠.


그러면 “척도를 말할 수 없는” 이렇게 뜻을 풀이해도, 물론 엄밀한 의미는 아니겠지만, 그렇게 얘기해도 의미가 된다는 거네요? [네, 척도를 말할 수 없다는 거죠] 척도의 대푯값을 얘기할 수 없는… 그런 의미네요. 그런 개념이 나왔다는 것은 바둑판 같은 평면적인 것과는 다른 속성을 지니는 네트워크가 존재한다는 것을 말해주는 거네요.


통계물리에서 멱함수가 나왔다는 것은 중요한 것입니다. 멱함수로 중요하게 여기는 것 중의 하나로 상전이 현상이라는 게 있거든요, 물에서 얼음 되고, 물에서 기체 되고 거기에서 변하는 지점이 중요한데요, 상전이 포인트라고 해서, 그 포인트가 되면 거기에서 멱함수가 나옵니다. 상전이 지점에서 특정 물리량을 재면 멱함수가 나오고, 그 포인트에서 뭔가 신비한 일이 많이 일어나는 곳이거든요. 그래서 통계물리 하는 사람들은 멱함수에 익숙하거든요. 이게 나오면 좋아하는, 뭔가 크리티컬 하다는, 임계적이라는, 임계현상이라고 하는 거에는 꼭 멱함수가 따라다니거든요. 지수법칙으로 나오는 것은 너무 단순한 것이고. 금방 0이 되는 것이기 때문에.

# ’멱함수 네트워크의 발견’이 통계물리학계의 관심을 사로잡다

그러면 1999년 논문에서 멱함수 성질이 처음 발견된 건가요? 아니면 앞서 발표된 ‘좁은 세상’에서 처음으로 그런 게 발견된 건가요?

좁은 세상 논문에서는 그냥 세상이 좁다는 것을 잰 거거든요, 네트워크를 분석했더니 생각보다 거리가 가깝다는 것이고. 그때 사람들이 만든 스몰 월드 모델이라는 게 어떻게 생겼느냐 하면.
(좁은 세상 네트워크의 개념 그림을 보여주다, 위 그림의 위쪽 중간) 이게 스몰 월드 네트워크라고 하는 건데요. 아까 말씀드린 그래프이론이라고 해서 수학자들이 한 게 오른쪽 랜덤 그래프입니다. 점들을 찍어놓고서 마구 연결하는 거죠. 사실 세상이 이렇게 생겼을 리는 없거든요. 사람이 아무나 사귀고 하는 건 아니고. 또 다른 그림인 이것은 바둑판처럼 생긴 건데 아주 규칙적인 거고 자기 옆집과 그 옆집만 아는 세상입니다. 이 사람이 저 사람을 알려면 하나둘셋 이렇게 많이 거쳐서 가야 하거든요. 이걸 무진장 크게 그려서 60억명이라 하면 두칸씩 건너도 30억명을 거쳐야만 아는 사람에 닿는 건데. 사실 세상은 그렇지 않고 중간쯤에 있다는 게 중간 그림의 스몰 월드 모델이거든요. 물론 대부분 사람은 주변 사람과 연결되어 있지만 사실 중간중간에 ‘먼 거리 친구’가 있다는 거죠. 여기에서 계산하면 친구의 친구의 친구에서 금방 갈 수 있다는 거거든요. 점프해서 갈 수 있으니까. 그래서 ‘긴 거리의 연결선’이라고 하는 것을 이 연구자들이 도입한 거거든요. 세상은 이런 것 때문에 좁을 수 있다 하는 거고요.
주변사람들끼리는 많이 알고 그런데도 먼 거리의 연결선이 있어서 사람들을 연결한다는 것인데. 결론적으로 보면 긴 거리는 맞기는 한데요 이것은 그다지 설득력 있는 게 아닌 것이 이것은 멱함수 구조를 따르지 않거든요. 실제로 구조를 보면 여기에는 허브가 없잖아요. 그런데 세상에는 허브가 있거든요. 허브가 있으면 설명이 더 쉽거든요. 그런 의미에서 스몰 월드를 만들 수 있고요. 저희가 사람들에 대해 연구한 건 아니지만 월드와이드웹을 조사해보니 허브가 있다 이런 게 나온 거거든요.
당시 논문의 제목은 “월드와이드웹의 지름”. 즉 “다이어미터 오브 더 월드와이드웹”이라고, 사실 좋은 표현은 아닌데, 그 때에 네이처에 논문을 내면서 문학 하는 친구가 지어준 겁니다. 뭐냐 하면 한 페이지에서 시작해서 네비게이션 하는데 19번 정도면 웬만한 데에는 다 갈 수 있다는 뜻이고요. 당시에 전체 웹페이지를 8억 개로 추정했는데 평균적으로 19번 정도면 갈 수 있다는 거죠. 원래 지름이란 것은 가장 먼 거리인데 저희가 한 것은 평균이고 그게 19이라는 것이었죠.


좁은 세상인 이유는 허브가 있기 때문이다, 이렇게도 말할 수 있겠네요.

그렇게 말할 수 있는 거지요. 그리고 통계물리 하는 사람들이 멱함수 보고서, 아 재미있겠다 해서 뛰어들었고. 월드와이드웹에서 멱함수가 나와 생각해보니까 사실 다른 네트워크에서도 많거든요. 그래서 다른 네트워크는 어떻게 생겼을까 보기 시작했고요, 그 다음부터는 여러 가지로 등장합니다. 멱함수인 것이 많거든요. 인터넷 같은 것도 그런데요. 인터넷은 월드와이드웹과는 조금 달라서…  (그림을 보여주다)  컴퓨터가 어떻게 연결되어 있느냐 하는 것이거든요. 이게 사실 인터넷의 지도인데요, 맵 오브 더 인터넷라고 다른 연구자들이 그린 건데요. 각 점은 아이피 어드레스이고요. 그게 어떤 컴퓨터에 어떻게 연결되어 있느냐를 보여주죠. 여기에서 색깔은 큰 의미가 없고요. 그냥 예쁘게 보이게 하려고 대륙별로 색깔을 구분하고 하는 식으로 만든 거고요. 여러 종류 그림이 있죠. 어째든 여기에서도 항공망처럼 보이거든요. 인터넷도 멱함수 법칙을 따르는 항공망이다 하는 거거든요.

네. 그 논문에서도 그렇게 설명했고. 그러고 나서는 좁은 세상 네트워크처럼 멱함수 네트워크를 만들 수 있는 모델이 나온 것이죠. 그게 스케일 프리 모델이니 비에이 모델이니 하는 것들이 그겁니다. 스케일 프리라는 건 사실 네트워크 이론에만 적용되는 것은 아니니까. [원래 있떤 개념을 네트워크 이론에다 갖다 쓴 거라는 뜻이네요] 네… 모델은 여러 가지입니다. 크게 나누면 척도 없는 네트워크, 좁은 세상 네트워크, 랜덤 네트워크 이렇게 나눌 수 있지요. 아, 아니죠! 그것도 있어야지요. 격자 무늬 같은, 아주 규칙적인 레귤러 네트워크도 있어야지요. 바둑판 같은. 레귤레 네트워크는 아주 질서정연한 것이고 바둑판을 상상하면 되고요. 랜덤 네트워크는 완전 맘대로 바둑판을 아무 선이나 연결한 것인데 그건 완전히 무질서한 상태이지요.

# 복잡계는 ‘혼돈의 가장자리’

그런데… 무질서도 네트워크의 일종이라고 할 수 있나요?


네. 한가지 네트워크인 거죠. 수학 하는 사람들이 처음 만든 게 그런 것이거든요. 거기에는 이유가 있습니다. (복잡도, 복잡계를 잘 모르니까) 일단은 랜덤 하게 해보자, 아무렇게나 해보자 한 것이고, 예를 들어 사람 열 명을 세워놓고 이사람 저사람이 아는 사이인지 결정할지를 주사위를 던져, 예를 들어 육이 나오면 연결하고, 안 나오면 연결 안 하고, 이렇게 아무렇게 연결해보는 거죠, 확률적으로. 그런데 그게 타당하냐 하면 뭐 어느 정도 설명을 하는 거니까요. 아무것도 모를 때에는 흔히 무작위적이라고 하니까. 그래서 래귤러와 랜덤 네트워크의 중간이 바로 우리가 연구하려는 대상인 복잡계인 거죠. 너무 무질서 한 것도 아니고 너무 규칙적인 것도 아니고. 복잡계에서 많이 쓰이는 개념이 중간이라는 거고, “혼돈의 가장자리”라는 개념도 거기에서 나오는 것이고요.


복잡계 하면 흔히 무질서계를 생각하는데 그것과는 조금 다르네요.


어느 정도는 무질서해야 하는데요. 너무 바둑판처럼 생겨도 아니고, 또 세상이 너무 엉터리로 생긴 건 아니거든요. 흔히 길 찾아가는 것으로 예를 드는데, 모든 세상길이 바둑판처럼 생겼으면 오히려 못 찾아갑니다. 바둑판에서 왔다갔다 하면 주변을 봐도 똑같잖아요. 집을 못 찾거든요. 그리고 완전히 엉망진창이면 거기도 똑같거든요. 구분할 수 있는 게 없거든요. 그래서 적당히 규칙적이고 적당히 복잡기 때문에… 그래서 세상이 복잡계라는 것이 그 중간 영역에 있다고 말하는 겁니다. 적당히 복잡해야 합니다. 그 중간의 영역에 있다고 하는 거죠. “혼돈의 가장자리”라는 게 혼돈스러워 보이기는 하지만 혼돈의 끝으로 간 것은 아니고, 혼돈이 될까말까 하는 경계선상에 있다는 거거든요.


정리하면 1990년대 말쯤에 지금과 유사한 관심사가 생겨났고, 멱함수의 발견이 상당히 중요한 영향을 끼쳤고, 그래서 이후에 다양한 분야들에서도 네트워크 연구가 이뤄져 거기에서 다 멱함수가 나왔고요. 지금 연구 대상, 그러니까 연구 소재는 굉장히 많이 늘어난 거죠.


엄청나게 많을 수밖에 없는게, 사실 다 네트워크이거든요. 예를 더 들면 생물학에서도 네트워크가 있고요. 분자들이 화학결합을 해서 다른 분자들을 만들고 또 다른 걸 만들고 그걸 다 연결하면 그게 네트워크가 되는 거고요. 또 유전자들이 단백질을 만들어서 단백질과 단백질이 결합해서 어떤 일을 하는 것도 단백질 반응망이라는 게 되고요. 물론 그것도 다 멱함수를 따르죠. 그 다음에 이메일을 누가 누구한테 보내느냐에 대한 분석도 있고요, 누가 누구한테 전화를 거느냐 분석도 있고요. 심지어 언어학에서는 단어를 놓고 비슷한 말을 연결해서 네트워크를 만듭니다. 그걸 좍 연결해놓으면 여기에서도 멱함수가 나온다는 게 알려져 있고요. 정말 생각할 수 있는 거의 대부분의 것들을 조사해보니까…


동의어라는 게… 연상되는 비슷한 말을 말하는 건가요?

네, 그런 식으로 연결하면. 그렇죠 비슷한 말을 연결하면 그렇고. 사실 언어학에서 그것 말고도 말도 안 되지만 영어책을 가지고 네트워크를 만들 수도 있는데, 소설책을 펼치고 영어 단어 순서에서 앞뒤로 나온 단어를 연결합니다. 예를 들어 ‘아이 엠 톰’이면 아이와 엠, 엠과 톰을 연결하고 그림을 그려요. 그러면 the나 of는 아주 많이 등장하고 많은 것과 연결돼 그게 허브가 되거든요. 그렇게 네트워크를 만들어도 거기에서 멱함수가 나옵니다. 벼라별 영역에서 멱함수가 나오는 거죠. 그래서 사람들이 어, 신기하고 재미있다고 하는 것이고. 생물학, 언어학에서도 그렇고 경제에서도 그렇고요. 국가 간, 아니면 기업간의 경제활동을 분석해도 거기에서도 나오고 계속 발견이 되니까

# 허브의 역설, 아킬레스의 건

그런 규칙을 발견하는 게 재미있고 신기하긴 한데, 그게 어떤 의미가 있는 겁니까?


초반에는 발견하는 것 자체가 이슈였거든요. 근데 사실은 설명을 해야죠. 왜 그런지, 또 뭐에 쓸모가 있는지. 사실 처음에는 저희가 월드와이드웹을 처음 분석했을 때에 멱함수가 있다 이런 걸로 논문이 된 거거요. 그 다음에 인터넷을 조사하면서 발표한 두 번째 네이처 논문이 인터넷에 관한 건데요, 네이처 표지 논문으로 나왔지요. 인터넷의 네트워크가 멱함수를 지니는데 그런데 멱함수가 됨으로써 ‘아킬레스의 건’이 생긴다는 게 논문의 요지입니다. 허브가 있으니까 인터넷이 취약할 수밖에 없다는 거죠. 허브가 고장 나면 끝장이거든요. 허브 공항도 마찬가지죠. 그래서 허브라는 게 인터넷의 아킬레스의 건이라고 말한 것이고, 그런 취약점이 있다고 말한 거고, 다만 장점도 있는데요. 누가 의도적인 공격을 할 때에는 허브를 공격할 거거든요. 그런데 공격이 아니라 고장의 차원에서 생각하면 고장이 어디에서 날지 모르거든요. 그러니까 고장은 어차피 우리가 컨트롤 못하고 어디에서건 일어나긴 일어날 텐데. 조그만 데서 일어나면 별 문제가 되지 않거든요. 그게 허브가 될 확률은 굉장히 낮거든요. 그래서 복잡계가 지닌 특징 중 하나가 ‘튼튼하다’는 거거든요. 강건성 말이죠. 생명체도 튼튼하다 하는 것이 우리 몸에서 많은 일들이 일어나는데, 100% 다 문제 없는 게 아니거든요. 반응이 잘못 일어나도 우리가 콘트롤 할 수 없는 건데, 그런 일들은 허브가 아닌 데서 일어나는 것이고. 물론 재수 없어서 허브에서 일어나면 죽겠지요. 다행히 허브 구조로 되어 있으면 그런 일은 허브가 아닌 곳에서 일어날 확률이 훨씬 더 높으니까 잘 지탱이 되는 것이고.



워낙 빨리 진행된 거라요. 1년 정도만에 이뤄진 거라. 물론 커질 거라는 생각은 했죠. 사실 건드리는 분야가 넓어지는 거니까요, 인터넷망에서도 그랬고 신진대사망도 그렇고… 사실 신진대사망 논문이 제가 참여한 논문 중에서 인용이 제일 많을 거거든요. 생물학 하는 사람들이 많기 때문에. 신진대사망 논문에서는 저희가 여러 개체들에 대해서, 여러 종류의 박테리아, 또 진핵세포 생물 등에 대해 여러 가지 43가지 정도의 생명체에 대해서 신진대사망을 분석해봤어요. 그랬더니 다 똑같이 멱함수 나오고, 공통적인 특징도 있고 다른 특징도 있고 그래서 그런 걸 생물학적으로 분석해서 논문을 쓴 것이고요.
진화적으로 봤더니 네트워크가 점점 서로 많이 연결이 되면서 어떤 일정한 다이어미터(연결망의 지름 개념)를 일정하게 유지하는 속성이 있다, 그걸 밝힌 것이거든요. 생물이 진화하면서 어떤 식으로 진화해서 사실 43가지 생명체가 하등에서 고등인 것까지라 어느 정도 경향성을 볼 수 있는데, 거기에는 유지되는 뭔가 있고 그 메카니즘에는 뭐가 있다는 걸 밝힌 거죠.


다이어미터(연결망의 지름)가 일정하다는 것은, 노드들은 점점 많아지는데도 건너뛰는 거리는 일정하다는 것?


네, 그겁니다. 노드는 많아지는데 거리는 일정하다는 건데, 사실 그게 생명체의 특징인 건데요, 인터넷과는 차이점입니다. 왜냐면 인터넷에서는 멱함수법칙을 따르면 인터넷이 커지면 지름이 조금씩 커집니다. 천천히라도 커지거든요. 예를 들어서 10배쯤 되면 2배 커진다거나… 좋은 숫자는 아닌데… 그런데 생명체는 열배가 되도 변함없이 그대로라는 거거든요. 왜냐 하고 생각해보면 생명체에서 신진대사 반응이라는 게 무엇을 먹었을 때에 어떤 물질과 어떤 물질이 만들어지고 그런 거거든요. 반응은 똑같이 빨리 나와야 하거든요. 덩치가 커졌다고 모기에 물렸는데 뭘 만드는 데 열 단계를 거쳐 뭘 만들어야 한다면 그동안 죽어버리니까. 저희가 그 때 본 거로는 세 단계든, 하등이든 고등이든 세 단계 정도면 웬만한 걸 다 만들 수 있는 아주 효율적인 네트워크를 만들었다는 거죠.

[세 단계라는 게 어떤 단계를 말하시는 건지?] 임의의 물질 A에서 B라는 물질을 만든다면 평균 3번의 반응을 거치면 그런 것들을 만들 수 있다는 거죠, 평균적으로. 그 숫자가 계속 유지된다는 거죠, 덩치가 커져도. 이것은 인터넷보다 더 나은 점이죠 사실은. 인터넷 같은 네트워크는 커지면 조금이라도 (다이아미터가) 커지거든요. 스몰 월드이기 때문에 많이 커질 수는 없습니다. 기본적으로 스몰 월드이니까 좁아야 하거든요. 많이 커질 수는 없어요. 그런데 그 속도가 커지기는 한데 생물체에는 안 커진다는 거죠.

단백질 연결망 논문은 또 다른 논문인데. 그건 2001년이죠. 단백질의 반응 연결망이죠. … 그건 생물학적으로도 허브가 중요하다는 걸 밝힌 논문입니다. 허브라는 게 훨씬 더… 그러니까 네트워크를 그려보면 연결선이 많은 단백질이 중요하다는… 제가 그 논문 좋아하는 게 생물학을 제가 못하는데, 생물학을 못해서 물리학과에 간 건데, 네트워크 그림만 보고 아 이게 중요하다, 안 중요하다 얘기하면 맞는다는 거죠. 그러니까 그 구조적인 위치만 봐도 생물학적인 중요도를 얘기할 수 있다라는 점에서 재미있는 컨셉인 거죠. 이것은 중요할 거다 보고서 문헌들을 찾아보면 실제로 중요하고 그런 걸 찾아냈다는 겁니다.


준비해온 질문을 드리면, 통계물리에서 제가 재미있는 게 본 게 주식시장 연구나 교통체증 연구 이런 것들이 있는데요. 이런 것들은 입자들의 무질서한 운동 속에서 어떤 규칙을 찾아내는 그런 건데 그것과 네트워크 연구와는 관련이 없습니까. 이런 연구는 90년대 초에도 나와서 보도도 많이 된 건데.


관련이 없다고는 할 수는 없는데요. 사실 이렇게 생각을… 네트워크 입장에서 거꾸로 바라보면 예전의 그런 연구들은 바둑판 위에서 한 거라고 생각하시면 됩니다. 왜냐면 교통흐름도 잘 보시면 고속도로에서 차가 한칸 앞으로 가고 그런 식으로 되어 있었던 거거든요. 주식시장은 시계열 분석이라 좀 다른 얘기인데…. 물론 규칙적으로 연결된 것도 있지만 규칙적이지 않게 연결된 것도 많기 때문에 확장이 된 거라고 보시면 됩니다. 교통흐름 문제도 사실은 바둑판 위에서 풀다가 실제로 더 복잡한 데서 풀게 되고 그런 일들이 일어나게 된거죠.


도대체 항공망 구조이고 멱함수가 있다는 게 무슨 인사이트를 주느냐 하는 문제로도 보이는데, 그런 좋은 예를 보여주는 게 구글인데요. 구글이 처음에 성공한 게 웹페이지를 검색결과에서 좋은 웹페이지를 앞쪽에 잘 보여주잖아요. 그래서 성공한 것인데요 사실. 그게 페이지 링크라는 방법인 건데. 사실 구글이 처음에 나왔을 때 먼저 성공한 건 야후였고, 야후는 어떻게 했느냐 하면 사람이 내용을 읽고 카테고리로 분류를 해서 넣어놓았어요. 이건 역사, 이건 관광, 이건 기후… 근데 실패한 거죠. 그런데 웹페이지가 엄청나게 많아지고 사람이 손으로 할 수 있는 게 아니니까.

구글은 그걸 안 쓰고 알고리즘을 쓴 거잖아요.구글의 페이지링크 알고리즘은 아주 엉터리로 설명 드리면 연결선이 대부분 적은데 군데군데 허브 웹페이지라고 하는 게 있거든요. 웹 페이지 구조를 알고 있으면 이곳이 얼마나 연결됐는지 연결선이 얼마인지가 나옵니다. 연결선이 많은 것은 좋으니까 사람들이 많이 연결한 거거든요. 그것들을 앞에 놓은 거죠. 그렇게 했더니 사람들이 좋아한다는 거죠. 그리고 더 좋은 점은 뭐냐 하면 사실 거기에서는 들어오는 링크만 세야 하는 건데, 더 좋은 점은 가끔 1번이 나쁜 답일 수 있거든요. 클릭했더니 좋은 답이 아니에요, 그래서 사람들이 두 번째 답이 좋을 때에 두 번째에다 더 링크를 걸어요. 그러면 결과적으로 얘가 1등이 되요. 가만히 둬도 좋은 답이 알아서… 구글이 하는 게 아니라 사용자들이 알아서 좋은 답을 다 만들어주는 거거든요. 그게 가능한 이유가 월드와이드웹이 고속도로망처럼 생겼으면 이런 등수놀이가 안 돼거든요. 웹이 뭔가 멱함수처럼 등수놀이를 할 때에 허브라는 것의 가치가 높다는 것을 구글이 파악을 한 것이고 그걸 이용한 거죠. 물론 구글의 페이지링크 방식은 제가 말씀드린 것보다 훨씬 더 복잡한 것인데 기본적으로는 링크의 가치를 알아채고 링크에 가치를 부여한 것입니다.


통계물리인 경우에는 노드의 존재 자체의 확률분포라면, 네트워크 연구라는 것은 노드가 아니고 링크의 확률분포다, 이렇게 보면 되나요?


아… 글쎄요, 노드보다는 링크에 초점이 많이 있기는 한데요, 그래도 노드도 중요하지요. 네트워크에서 제일 먼저 하는 게 ‘등수놀이’이거든요. 허브 찾고 누가 중요하고 찾는 것이기 때문에 노드를 무시할 수 없지요. [링크 확률분포를 통해서 누구 중요한 노드인지 아는 거니까요] 그렇지요, 링크를 통해서 정의가 되는거죠. 네트워크에서 링크를 다 떼내면 개별 입자들만 있는 거니까.


네트워크 연구에서 아까 좁은 세상 개념도 있었는데, 이것들처럼 재밌고 자주 얘기되는 개념들이 뭐가 있을까요?


글쎄요. 좁은 세상, 커뮤니티… 그 다음에 뭐, 싱크로나이제이션이라고, 뭐지 [동기화?] 네. 동기화 문제를 푸는 거죠. 예전부터 있었던 문제인데요. 사실 잘못 풀었다고 할 수도 있거든요, 바둑판 위에서 풀었으니까. 사실은 바둑판처럼 안 생기고 항공망에서 안 생기나. 예전에는 바둑판에서 풀거나 아니면 완전 엉망진창에서 풀었는데 지금은 세상이 가운데쯤 있다라고 하니까 여기서 풀면 뭐가 달라지나, 조금 과장해서 말하면, 예전에 풀었던 문제를 다 멱함수 네트워크에 갖다 놓고서 푸는 스테이지에도 있는 거거든요. 그렇기 때문에 예전에 있던 것이 다 다시 나온다고 생각해도 되는 거거든요.

그 다음에 또 게임이론도 다 다시 풀고. 사람들 사이라고 하는 것이… 게임이론에서 죄수의 딜레마나 마이너리티 게임이니 그런 것들도 다 기본적으로 네트워크 위에서 풀면 어떻게 달라지는가를 봐야 하는 거거든요. 세상이 규칙적이지 않기 때문에. 차이점이 뭔지는 다시 풀게 되는 거죠. 물론 모든 것에서 독특한 것들이 나오는 게 아니고 비슷한 결과가 나오는 게 대부분이긴 한데 어쨌든 다시 확인해보는 과정이 필요한 거죠.


그러면 예전에는 규칙성에 대한 믿음이 더 강했다면, 네트워크 이론에서는 불규칙한 가운데에 어떤 패턴…

네, 그 중간쯤에서 어떤 일이 일어나는가 하는 거고. 그걸 연속선상에서 볼 수 있는 거죠. 예날에는 아주 규칙적인 것과 아주 불규칙적인 것… 물론 이쪽도 생각은 하긴 했거든요. 왜냐하면 규칙적인 게 이상하다는 것은 사람들이 생각은 했거든요. 이게 사람들이 바둑팜 위에서 사는 것도 아닌데, 쉽게 푸는 모델이니까 바둑판 위에서 한 거지만. 그러면 규칙적이지 않으면 뭘 해야 되는가 하면 되나 본게. 아주 맘대로 연결돼 있는, 어떻게 연결돼 있는지 모르니까 그때에는 그것밖에 없었으니까 그걸 쓸 수밖에 없었고, 또는 아니면 전부 다 연결돼 잇다고 가정하는 거죠. 모든 사람이 모두 안다고 가정하고 풀었거나. 근데 그렇게 보면 다시 규칙적인 게 되거든요. 그런데 사실 세상은 중간쯤에 있으니까 여기에서는 어떻게 되는지를 다 봐야 하는 거고 그걸 풀게 되는 거죠.


이런 일들이 컴퓨터의 성능이 좋아져서 가능해진 건가요?

컴퓨터 성능  때문은 아니고요. 사실 네트워크가 이렇게 생겼다는 게 밝혀지면서 그렇게 된 거죠. 멱함수처럼 생겼다는 게 나오면서 그걸 설명할 수 있는 모델이 나오면서 네트워크를 마음대로 만들 수 있게 되면서.

# “생물학적 네트워크에 특히 관심 높아”


교수님이 요즘 관심을 갖고 있는 주제나 뭐 개념이나 키워드나 그런 게 있다면, 다시 말하면 네트워크 연구 분야에서 주요하게 도전 과제가 되는 게 어떤 건지?


네트워크 과학이라고 하는 게 물리학 내부에서는 꽤 많이 발전이 이뤄졌고요, 정말 많은 문제를 풀었고 지금 10년이 넘었으니까요. 물론 어려운 문제는 좀 남아 있지만. 그것보다 제가 생각하는 중요한 것은 다른 분야로 넘어갔을 때의 할 일이거든요. 특히나 바이올로지 같은. 생물학에서 네트워크 바이올로지라는 말이 생길 정도로, 시스템 생물학과 비슷한 얘기인데 생물을 복잡계 시각에서 보자, 전체적으로 보자는 거고, 전체적으로 보려면 거기에는 네트워크가 당연히 들어가는 거고요. 개별적으로 세포 하나 떼어서 보는 것은 도움을 못 주고 전체적으로 봐야 한다는 그런 그림을 그리자는 것이고요. 생물학 쪽에 되게 재미있는 문제가 많을 거라고 생각하고, 아직 생명에 대해서는 아는 게 별로 없으니까요. 그게 한 가지 분야이고요. 그 다음에 뇌가 당연히 뉴런들이 시냅스로 연결되어 있는데 이게 가장 관심 있는, 궁금한 네트워크이거든요.


* 복잡계와 생명현상에 관해서는 최무영 서울대 교수가 자세히 정리한 글이 있다.

▶ 생명현상의 물리학: 복잡계와 정보


신경 자체는 예전부터 ‘신경망’이라고 해서…

네. 통계물리에서 했던 거거든요. 모델 만들고 했었는데 그런데 지금처럼 되어 있는지는 몰랐으니까 그때에는 연결 구조가 어떻게 되어 있는지 몰랐으니까 단순하게 연결됐다고 생각했는데…


뇌 관련한 연구에서도 나온 게 뭐 있나요?

어느 정도 해보면 여기에도 멱함수 같은 게 있다는 건 알려져 있고요. 기능적으로.. 그렇게 많지는 않습니다. 데이터 자체가 별로 없거든요.

예전에 수리과학연구소에서 뇌 신경 연결망 지도를 작성하는 ‘커넥톰(connectome) 프로젝트를 하자’ 그런 얘기가 있었는데, 거기에도 관여하세요?

지금 하고 있죠. 수리과학연구소에서 하는 일과 관련은 되어 있습니다. 뇌가 어떻게 연결되어 있는지 현재는 모르니까요… [그 프로젝트는 물리적인 뇌 연결망을 찾는 그런 거죠?] 네, 네트워크 찾아내기죠. 정말로 물리적으로 연결이 어떻게 됐는지 보는 매핑하는 프로젝트이거든요. 아주 하등한 생물에서는 알려진 게 있는데 궁극적으로는 고등생물의 뇌가 어떻게 연결돼 있는지 일단 알아내야 거기에서 출발할 수 있는 거죠. 그리고 직접 연결 말고 그냥 여러가지 fMRI(뇌기능 자기공명영상)를 써서 뇌의 이 영역과 저 영역이 관련이 있느냐 없느냐 보는 그런 연구도 있지요. 물체를 잡을 때에 어디 영역과 어디 영역이 활성화하는지, 그것이 어떻게든 통신을 하는지 보여주는 거니까 간접적인 연결선을 찾는 거죠. 이곳과 저곳이 같이 반짝인다면 뭔가 뉴런을 통해 상관관계가 있다는 거고 그렇게 분석을 하고 있지요. 그건 ‘기능적인 네트워크’ 연구가 되는 거죠. ‘구조적인 네트워크’ 연구는 아니고. 구조보다는 그게 훨씬 더 쉬워서 그쪽에서 더 많이 연구가 되어 있고요. 뇌 사진을 워낙 잘 찍으니까 어디와 어디가 같이 반응하는지 보면 간접적으로 연결 상태를 알게 돼 그런 데에서 연구가 많이 이뤄지고 있지요.


실제 이 분야에서 하고 있는 것은?

제가 지금 당장 하는 건 없고 fMRI에서 부분부분이 어떻게 연결되는지에는 관심은 있어서 학생들이 보고는 있는데, 저희가 주로 하는 것은 신진대사 반응망 그쪽을 보는 거고요, 저희가 처음에 컴퓨터로 가상세포 하는데 사실 재미있는 게 여기를 건드리면 어떻게 될지를 부작용이 어덯게 될지를 미리 알 수 있는 거라서. 그걸 예측했었고 그걸 이상엽 교수님 랩에 실험으로 검증을 해주십시오 부탁을 드린 거죠.  이런이런 걸 해보면 이렇게 나올 것 같은데 실험을 좀 해주십시오 하고서.


지금 중요한 개념들은 다 나와 있는 건가요? 아니면 네트워크 과학에서도 뭔가 풀리지 않는 중요한 장벽이 있는 건지.

있을 거라고는 생각하는데 그게 뭐가 될지는 모르지요. 뭔가 조금 더 재미있는 컨셉이라는든지 또는 안 풀리는 문제… 예를 들면 ‘네트워크를 분류하는 문제’도 사실 지금 잘 안 돼 있거든요. 비교하는 것도 어렵기 때문에. 아주 기초적인 것도 안 돼 있기 때문에 이 네트워크와 저 네트워크가 비슷하냐 분석하는 게 되게 어려운 질문이 되는 거거든요. 그런 거라든지…

그러니까 말씀을 들어보면 아직까지는 네트워크 전체를 일반화할 개념들이 아직은 부족하다는…

네, 하나의 틀에 아우를 수 있는 정도는 안 되어 있다는 생각이 들고요… 그리고 현실적으로 진행하는 프로젝트 하는 중에는 미래 인터넷 디자인 같은 것도 있고요.

# ‘미래인터넷’과 네트워크 연구



그것도 여쭈어보려고 했는데 잘 됐네요, 미래 인터넷과 네트워크 연구는 어떻게 연관되나요?

당연히 연관이 있지요. 아까 ‘아킬레스 건’ 얘기를 말씀 드린 것처럼 인터넷이 어떤 특징을 지니는지 이제는 아니까요. 그러면 어떻게 디자인을 해야 하는지, 예를 들어 라우터를 어디에 두고 어떻게 연결하는 게 가장 튼튼할 것이냐, 공격이나 이런 것에 어떻게 대응하는 것이 근본적으로 좋으냐는 이런 문제들인데. 미래 인터넷에서 연구하는 데에서 크게 두 흐름이 있는데, 현재 네트워크를 조금씩 고쳐 나가자는 것이고, 다른 하나는 완전히 싹 밀고 백지부터 다시 디자인하자는 게 있거든요. ‘클린 슬레이트’(clean slate)라고 하는데. 그때에는 어떤 요소들을 어떻게 고려해야 하는지 그런 프로젝트들이 진행이 되고 있고요. 또다른 관심은 소설 네트워크고요. 그건 정보의 확산, 소통의 문제이기 때문에 트위터나 사이월드 그런 거 분석하는 게 그런 이유에서 하는 거고요.






소셜네트워크, 그쪽도 하시나요?
# 네트워크 분야에서 두각을 나타내는 한국인 연구그룹



사이언스온에 네트워크 관련 기사를 쓰면서 ’한국인이 네트워크 연구 분야에서 좋은 논문들을 잇달아 발표해 한국인이 이 분야에서 강점을 지니고 있는 듯하다’, 그렇게 썼는데 실제 어떻습니까?


그룹은 꽤 큽니다. 그림이 하나 있는데, ’네트워크 연구자들의 네트워크’를 그린 그림이 있거든요. 그런 걸 분석한 논문이 있어요. 저희가 한 건 아니고 외국에서 한 건데요. 몇 번 그려진 적이 있는데, 같이 논문 쓴 공동저자 네트워크도 있고, 또 누가 영향력 있나 하는 랭킹을 매기는 네트워크 연구도 있었고요. (바로 아래 그림을 보여주며) 이게 2003년에 뉴먼이라는 분과 박주영 박사 지금 경희대 교수가 한 건데, 보시면 네트워크 연구자들이 누가 누구랑 논문을 썼느냐를 보여주는 거거든요. 여기에 보시면 한국인들이 꽤 많은데… 여기에 정, 제가 있고요… 김, 오, 강… [이 색깔 그룹이 한국인 그룹인가요?] 색깔로 구분되는 건 아니고요. 최근에 더 재미있는 것으로 ’등수놀이’를 한 게 있어서, 그걸 보면 우리가 차지하는 위치를 알 수 있어요. (더 아래 다른 그림을 보여주며) 이게 네트워크 연구자들의 영향력 나타내는 네트워크인데요. 바라바시가 여기에 있고요, 제가 이쪽에 있고. 김범준, 고광일, 김두철… 그런 식으로 한국인 연구자들이 한 덩어리를 차지할 정도로 큰 그룹이라고, 메이저 그룹에 속한다고 할 정도로 크거든요. 굳이 따지자면 시작을 저희 쪽에서 하기도 했고, 그 다음에 통계물리 그룹이 협동연구를 잘 하기도 하고요. 제가 보기에는 통계물리 자체가 우리나라가 꽤 강한 편이어서, 그래서 2013년에 국제통계물리학회가 서울에서 열리기로 결정됐거든요. 3년마다 열리는데 이번에 호주에서 대회가 열렸는데 거기에서 경합을 벌여 다음 대회를 서울에서 열기로 했어요. 그런 것처럼….


통계물리에 속해 있나 보군요, 네트워크 연구자들이.

대부분 그렇습니다. 시작이 그쪽이었기 때문에. 물론 다른 쪽에서 갖다 쓰기도 하지만, 거기에서 한 축을 차지하고 있는 거죠.

최근 안용열 박사가 참여한 미국 대학 박사후연구원 3명의 논문이 네이처에 실렸죠. 사이언스온에도 뉴스(“복잡 연결망, 역시 ‘관계’가 중요해”)로 보도했는데 그 논문은 어떤 의미를 지니는지…

네트워크 연구에서 중요한 토픽 중 하나거든요. 그룹, 커뮤니티를 찾는 게 어려운 문제이기도 하고요. 커뮤니티를 찾아보면 사실은 끼리끼리 연결돼 있고 그룹인 게 보이는 건데, 그런데 그것을 손으로 찾을 수 있는 건 아니고 컴퓨터가 알고리즘으로 찾아야 하는데 어떻게 찾게 해야 하는지가 어려운 문제에요. 그걸 찾아놓으면 여러 가지 도움이 되는 게 많거든요. 추천 시스템 개발하는 데에도, 마케팅에서도 도움이 되는 중요한 문제라서. 커뮤니티를 찾는 데에는 여러 가지가 있는데, 안용열 박사가 한 것은… 네이처에 실릴 수 있었던 게… 그동안에는 다들 커뮤니티를 분류할 때에 노드에만 주로 관심을 갖고 있었는데, 안 박사 아이디어는 생각을 바꿔 링크를 가지고 하면 어떻게 될까 시도한 것이죠. 노드로 편 나누기를 하면 무슨 문제가 있냐 하면 예를 들어 한국 연구자 그룹, 미국 연구자 그룹 이렇게 나눌 수 있는데 저 같은 경우에는 이쪽저쪽에서 한 게 있으니까 반씩 속해야 하거든요. 노드로 보면 동시에 속할 수 없거든요. 그런데 노드가 아니라 링크(관계)를 기준으로 삼으면 이런 문제가 아주 자연스럽게 해결됩니다. 동시에 속할 수 있기 때문에. 사실 간단하지만 빛나는 아이디어인 거죠.


# “복잡계를 푸는 중요한 도구로서”



네트워크 연구하는 사람들의 ‘연구문화’에서 어떤 특징이 있나요? 몇 분 뵌 저의 경험으로는, 재치 있고 그런 분들이 많은 것 같은데.

네, 여러 가지에 관심이 많아요. 네트워크를 여러 곳에 응용하고 끌어나가려면 정말 다양한 분야를 알아야 하고 다양한 사람을 만나야 해서 그게 도움이 되죠.  순수한 네트워크 문제를 푸는 사람들도 있고요, 그거 말고 저는 어플리케이션이나 다양한 분야에 쓰는 것에 관심이 많기 때문에. 당양한 사람 만나야 하고 다양한 학회에서도 발표를 해야 하고.

이 분야를 전망해 보시면? 지금은 한창 확장세인 것은 같은데.


네트워크 과학에서는 확장이 맞는 것 같고요. 통계물리학 안에서는 굉장히 무르익었다(mature)고 볼 수 있는 것 같고요. 꽤 많이 발전했다고 할 수 있는 것 같고요. 그러니까 지금은 예전에 하던 물리 문제로서의 네트워크가 아니라 주변 확장하는 것으로서의 네트워크 과학이 더 빨리 발전하고 있는 것이라 그쪽에 더 전망이 있는 거죠.


그런데 네트워크 과학과 관련된 언론 보도들을 보면, 여기 네트워크가 어떻고 저쪽 네트워크가 어떻고, 이런 식으로 계속 이런저런 영역에서 연구가 이뤄지고 있는데 연구자 측면에서 볼 때에는 이런 게 한계를 지닌다고 보지는 않나요? 무한정 그런 식의 연구들만 주로 할 수는 없잖아요.


그렇죠… 그런데 저는 그게 과정이라고 생각하는데요, 아까 말했듯이 큰 틀에서 아우르는 게 못 밝혀졌기 때문에 결국에는 다양한 사례 연구를 하면서 조금씩 배워나가면서 그러면서 뭔가 통일된, 뭔가 보편적인 법칙을 찾아야 한다고 생각하고요. 그건 정말 큰 물음(big question)이지요. 중요한 문제인 거고, 그런 것을 연구하는 여러 가지의 일환이라 생각합니다. 조금씩 진전이 있고요. 뭐 네트워크 과학이라고 하는 것이 다양한 분야에서 쓸모가 많기 때문에 전망은 당연히 좋을 것 같고요. 물리학 자체로도 성공적이라고 보는 게… 통계물리에 한해 얘기하면 통계물리에서는 유행하는 테마가 있거든요. 프랙탈이 그랬고 카오스가 그렇고. 프랙탈이 90년대에 뜨는 주제였는데 지금도 여전히 중요하지만 상대적으로 적거든요. 네트워크 과학도 붐이 불고는 있는데 이것은 프랙탈처럼 쉽게 가라앉지는 않을 것이고 가라앉더라도 천천히 가라않을 것이라고 생각해요. 파급력이 훨씬 더 광범위하기 때문에. 특히나 앞으로 데이터 사이언스라는 입장에서, 데이터가 무진장 많아지는데 그것을 어떻게 분석하느냐 하는 측면에서 그것과 네트워크 과학이 묶이게 되면 또 한번의 점프가 있을 것이라고 보거든요.


제가 말씀드리는 건 고만고만하게 이 분야 저 분야에 적용되면, 네트워크 과학이 도구(tool)로만 사용되는 게… [패러다임 시프트죠], 그러니까 제 말씀은 별로 더 발전할 연구 주제 없이 이 정도 수준에서 허브나 좁은 세상 성질 같은 것들을 여기저기에서 찾아내는 도구로만 쓰이는 게 아닐까 그런 생각이 들어서요. 일반인의 관심사로 본면, 네트워크라는 게 뭔가 모를 신비한 힘을 그 안에 지니는 것 같고, 또 인간이 거기에서 참여자이기도 하고 거기에서 살고 있으면서도 우리가 의도하지 않은, 우리가 모르는 뭔가가 작동한다는 데에 더 큰 관심을 갖고 그것의 더 깊은 근원적인 모습을 보고 싶은 것인데…


네, 그게 맞는 얘기일 텐데요. 그러면 결국에는 복잡계로 넘어가야 하거든요. 우리가 복잡계를 이해하지 못하고 있는 거고요, 그런 복잡계를 보는 가장 좋은 도구 중의 하나가 네트워크라고 저는 생각하는 거고요. 복잡계가 결국에는 구성 입자들이 상호작용을 했을 때에 뭔가 새로운 현상, 창발 현상이 일어난다고 하는 건데, 거기에는 등장인물과 연결선이라는 링크가 나타나는 거거든요. 복잡계가 안 풀린 미스터리이고 거기에서 재미있고 중요한 게 나올 텐데요, (네트워크 과학이) 그런 연구에 기여할 거라고 저는 생각해요. 그런 계단(step)로서 네트워크 과학의 발전은 무궁무진한 거죠.


그러면 네트워크 과학의 큰 물음은 복잡계의 물음이고 그 안에서 중요한 인식을 주는 게 네트워크 이론이라는 거고, 또 아까 말씀하신 데이터 사이언스가 이것과 겹쳐지고 있는 거고요. 복잡계를 어떻게 이해해야 하나 하는 측면에서 보면, 네트워크 과학은 세상이 그리 규칙적이지도 그리 무질서하지도 않고 그런 어느 정도 조직돼 있다는 것을, 불규칙에서 규칙을 설명해주는 측면도 있는 거네요.


중간 정도의 언어로 설명하려는 거죠. 복잡계 연구가 그런 것인데요, 무질서해 보이지만 거기에서 규칙을 찾고 그걸 설명하려고 하는 거거든요. 복잡계는 복잡하지만 나름대로 그 안에 숨어 있는 질서가 있고 그런 건데, 그걸 볼 수 있게 해주는 중요한 툴로서 네트워크 과학이 작용할 거라고 생각하고요.




페이스북       방명록      수정 2011-02-01 / 등록 2011-01-30 / 조회 : 15454 (457)



우리의 건강을 해치는 불량지식이 없는 아름다운 세상을 꿈꾸며 ...  2009.12  최낙언