종욱의 위키

 

복잡계

Page history last edited by Anonymous 3 yrs ago

소개: 복잡계란 쉽게 말해서, '여섯 사람만 건너면 세상에 모를 사람이 없다' 따위의 말을 증명하는 거라고 보면 됩니다. 응용분야는 대충 복작복작한 자연과학, 사회과학, 인공구조물 등으로 무궁무진합니다.

 

재미있는 링크가 몇 개 있습니다.

  • GUESS : 자바로 만들어진 그래프 프로그램입니다. 이런 저런 오픈소스 프로그램을 섞어서 만들었는데, 죽입니다. HSQLDB, JUNG, JMF 등의 걸출한 라이브러리로 꽤 쓸만한 프로그램을 만들었습니다. 아쉬운 건, 한글 폰트가 깨진다는 것. 이걸로도 이런저런 간단한 분석이 가능하지 않을까 생각합니다.
  • 한글 위키백과 덤프 : 분석에 쓸만한 한글로 된 샘플 자료입니다. 공짜로 얻을 수 있는 정제된 한글 정보 중에서는 꽤나 괜찮은 놈이죠. 페이지 링크(pagelink), 공기 관계(cociting), 사용자들의 수정 기록(editlog) 등을 통해서 각각 재미있는 정보를 얻어낼 수 있을 것만 같습니다.
  1. 페이지 링크로 : 가장 간단한 겁니다. 한 페이지를 하나의 노드로 보고, 각각의 링크를 링크로 보는 네트워크입니다.
  2. 공기관계로 : 좀 돌려서 생각하는 겁니다. '8.15행사'에 '노무현'과 '대통령'이 함께 나온다면 노무현-대통령 사이에 링크를 하나 긋는 식입니다. Discovering Missing Links in Wikipedia(LinkKDD 2005)라는 논문에 자세한 내용이 나와있군요.
  3. 수정기록으로 : 사용자들이 알고있는 영역이 구분되어 있고, 수정기록은 그 영역을 반영한다고 가정합니다. 그렇다면 수정기록을 통해서 각 페이지들의 영역을 구분할 수 있지 않을까요? 각 사람들의 수정기록을 하나의 긴 줄로 엮어서 네트워크를 구성하고, 이를 클러스터링하면 재미있는 결과가 나올 것만 같습니다.

Comments (0)

You don't have permission to comment on this page.