종욱의 위키

 

위키지도생성기

Page history last edited by pudidic@... 3 yrs ago

위키의 링크 정보를 활용해서 자동으로 지도를 만들 수도 있겠다 싶습니다. 김창준씨가 몇년 전에 이야기 한 것과 비슷하죠.

 

우리는 현재 사용 중인 위키의 요소 하나 하나를 일일이 재평가하고 있습니다 -- 심지어는 링크를 거는 방법까지도. 획기적인 위키가 나올 것이라고 기대합니다.

 

주목할만한 특징은:

  • 분류패턴이 필요없습니다. 분류패턴을 쓰지 않으면서도 편리합니다.
  • 지도패턴을 많이 사용할 어포던스가 있습니다 -- 더욱 잘 짜인 위키사이트가 될 것입니다.
  • "똑똑한 캐싱"을 통해 속도가 10x 이상 빠릅니다.
  • 윈도우즈 기반의 개인용 컴퓨터에 웹서버를 돌리지 않고 독자적으로 실행시킬 수 있습니다.
  • 링크거는 방법에 인지적, 인체공학적 요소를 고려했습니다.
  • 링크 온도 개념이 있습니다.
  • 개인별로 CSS화일처럼 위키페이지를 커스터마이징할 수 있습니다.
  • 액세스 컨트롤을 쉽게 할 수 있습니다. (role-based access control 지원)

http://no-smok.net/nsmk/YoriJorihttp://www.archive.org 에서 찾아서 볼 것

 

예전에 한 번 만들었던 적이 있죠. 한 페이지를 보면 오른쪽에 관련된 페이지 목록을 한 10개 가량 보여주는 것입니다. 실시간으로 계산하여(1초 안에 계산하여) 보여줬죠. 2~3단계의 링크, 역링크에 가산점을 부여하여 정렬하는 식이었습니다. 제법 쓸만한 결과가 나왔습니다. '진화론'을 보면 '자연과학분류', '창조론' 같은 페이지가 같이 떴으니까요.

 

속도 문제가 처음에는 있었지만, 캐쉬로 대충 해결했습니다. 여기서 좀 프로그램 본체를 건드리느라 표준 플러그인으로는 못 만들어서 배포를 하지 못했죠. 이 점이 많이 안타깝습니다.

 

하지만 큰 문제가 있었습니다. 매우 일반적인 링크들은 거의 모든 페이지에서 나타나더군요. '홈페이지분류' 등의 페이지 말이죠. 이런 개성이 없는 페이지는 쓰레기 정보입니다 - 최소한 저는 그렇게 생각합니다. 어떻게 이 정보를 찾아내서 없앨 수 있을까? 몇 달을 고민했죠. 하지만 답을 찾지 못하고 군대에 들어왔습니다.

 

군대에 1년 넘게 있으면서 답이 생각났습니다. 인기인은 저한테는 관심이 없습니다. 반면, 저의 연인은 저를 가장 생각해줄 겁니다. 이게 가장 큰 차이입니다. 인기인은 너무 많은 사람을 관리하느라 저한테 관심을 코빼기도 쏟지 못하니까요. 하하, 너무 주관적인 생각인가요? 어쨌든 재미있는 가설이잖아요. 실험해보는 것도 나쁘지 않을겁니다. 특히 제가 부딪힌 문제를 풀 수 있는 좋은 방법이지요.

 

여기서 관심도는 공기관계(CoCited)로 측정합니다. 쉽게 말해, 갑돌이와 갑순이가 같이 있는게 많은 사람들의 눈에 보인다면, 둘은 연인이겠거니 하겠죠.

 

물론 링크와 역링크, 같은 관심사(CoCiting)의 경우에도 좋은 결과를 얻을 수 있으며, 그 결과는 대체로 비슷합니다. 하지만 같은 관심사는 자료량이 너무 적어서 믿기 힘들고(기껏해야 6개 정도), 링크와 역링크는 반대로 자료량이 너무 많고(깊이가 깊어질수록 기하급수적으로 많아집니다) 엉뚱한 정보도 많습니다. 제가 보기에는 공기관계가 그나마 정확해 보입니다.

 

어쨌거나 이 생각들을 가장 간단한 공식으로 만들면 다음과 같습니다. 정말 멍청한 방법이긴 합니다만, 컴퓨터가 이 정도라도 눈치채면 좋겠죠.

 

갑돌이->갑순이의 관심도 = 갑돌이와 갑순이가 같이 보인 회수 / 갑돌이가 보인 회수

 

갑돌이->갑순이의 관심도 x 갑순이->갑돌이의 관심도 = 갑돌이<->갑순이의 관심도

 

서로의 관심도를 통해서 계산을 하면 금방 답이 나올 겁니다. 음, 지금은 웹 계정도 없고, 시간도 없어서 구현을 못하고 있지만, 휴가라도 나가면 금방 만들어 볼 생각입니다. 그리고 구현한다면 모니위키모인모인, 미디어위키 등의 몇몇 메이저 위키에 적용시켜 볼 생각입니다.


 

지금까지의 각종 정리 알고리즘들을 보았지만, 그다지 손에 맞지 않았고, 시간도 오래 걸렸습니다. 구현 또한 그렇게 쉽지만은 않았습니다. 그래서 그나마 쉬운 알고리즘을 구현해보려 합니다. 몇몇 지인들이 관심을 가져주면 큰 힘이 될 것 같습니다 :-)

 

-최종욱


Waiting for Feedback

Comments (0)

You don't have permission to comment on this page.