| 검색, 사전을 삼키다 - 정철 지음/사계절 |
네이버, 다음 카카오에서 웹 사전을 만들고 있는 정철씨가 쓴 사전과 검색에 대한 책입니다. 사전에 대한 개괄 및 간략한 사전의 역사, 사전 역사에 있어 활약했던 유명 편집인과 저자들이 소개된 후 사전과 검색의 차이와 검색을 어떻게 구현하는지에 대한 간략한 이론과 저자의 경험, 그리고 검색의 문제와 미래에 대한 고찰로 이어지는 구성입니다.
사전의 역사는 분량상 큰 변곡점만 짚어주지만, 개요를 이해하기에는 괜찮은 수준입니다. 무엇보다도 검색 전문가로서 사전을 만드는 방법을 디테일하게 서술하고 있다는 장점은 큽니다. 실체를 감잡기 어려웠던 '말뭉치(코퍼스)'를 활용하여 어떻게 사전을 만드는데 응용하는지가 대표적인 예입니다. 말뭉치는 빈도와 분포를 확인할 수 있는 중요한 자료로서 예문을 뽑기도 좋고, 저빈도 사용례를 찾아 사전에서 제시하는게 가능해졌다는군요. 그러면서 서울대학교의 꼬꼬마 세종 말뭉치 활용 시스템과 같은 사이트도 알려주는 식으로 제공되는 정보도 풍성해서 마음에 듭니다.
과거 '백과전서'와 현대의 '위키 백과' 모두 마찬가지로 토론과 논쟁이 사전 편찬의 가장 중요한 항목이라는 것도 새겨 봄직 합니다. 실시간성, 정보의 진위 여부, 언론 통제 등을 극복하기 위해 당연한 방법이고, 앞으로의 사전은 이러한 방향으로 나아가는게 당연해 보이네요.
검색 엔진의 검색 방법론인 '색인'에 대한 설명은 이런 저런 컨텐츠에서 많이 접해보기는 했지만 '넘나드며 읽기' 방식을 극대화했다는 이론은 독특했습니다. 책은 원래 처음부터 끝까지 읽을 필요가 없고, 무의미한 부분은 그냥 넘어가도 되는 매체이다. 검색 역시 지식을 효과적으로 소비할 수 있도록 지식과 지식 사이를 점프하며 둘러볼 수 있게 해 주는 도구라는 발상이 신선했던 덕분입니다. 이게 정답이다라고 이야기하기는 어렵겠지만요.
이후 검색이 진화하면서 랭킹 시스템이 도입되고, 야후에서 다단계 트리를 만들어 수작업 랭킹 시스템을 만든 후, 구글이 페이지랭크로 천하 통일을 이루었다는 내용도 재미있었습니다. 많이 인용된 논문이 좋은 논문이듯이 많이 링크된 페이지가 좋은 페이지라는 아이디어였다는데 참 그럴듯해요. 물론 지금은 단순 링크는 많이 사라졌고 다른 복잡한 방법론이 도입되었으나, 누구나 알 수 있고 그럴듯하며 아날로그 시대로부터 증명된 것이야말로 진실 그 자체라는건 변함없는 사실인 듯 합니다.
아울러 검색과 큐레이션 서비스의 비교는 제 현업에서의 고민거리와 조금 유사한 부분이라서 더 흥미롭게 읽었습니다. 큐레이션은 검색보다는 우연, 세렌디피티와 인스퍼레이션을 위한 것이라는 의견은 공감이 갑니다. 실제 개발을 위한 알고리즘, 서비스 방식에 있어 단순히 이렇게만 구분할 수는 없겠지만요.
그리고 네이버, 다음카카오 모두에서 검색 서비스를 기획 개발한 개발자로서의 경험담도 재미있었습니다. 저는 주로 네이버 사전을 쓰지만 다음에는 다음 사전도 한번 써 봐야겠다는 생각이 드네요. 사전의 미래와 좋은 검색이 무엇인지에 대한 내용도 생각할 거리가 많았고요.
이렇듯 재미있는 부분도 많고, 또 개인적으로 '백과사전'과 같은 형태의 책을 좋아하며(사전, 시대를 엮다와 같은 책을 찾아 읽을 정도로), 예전에 전자사전 제조사에서 근무한 적도 있어서 더 좋았습니다.
그러나 단점도 명확합니다. 한 권의 책으로서의 완성도가 부족한 탓입니다. 저자의 개인 블로그, 개인 글을 두서없이 편집한 느낌이 강하기 때문입니다. 저자 스스로 아카이브를 만들고 DB화하는 작업의 중요성을 이야기하고 있는데도 불구하고 목차, 순서는 그닥 정리되어 있지 못합니다. 사전의 역사에 대해 이야기하다가 검색 방법에 대해 이야기하고, 그러다가 유명 사전 편집자를 소개하는 식입니다.
수록된 내용도 검색 방법론에 대한 내용을 제외하고는 비전문가가 쓴 티가 난다는 것도 역력합니다. 특히 사전의 역사에 대한 부분이 심한 편이에요. 전문 사학자가 아닌 만큼 한계는 명확했겠지만, 이럴 바에야 잘 아는 분야에 집중해서 책을 쓰는 게 더 낫지 않았을까 싶네요.
덧붙이자면 저자가 제기한 문제점, 국내에서 종이 사전이 사라지고 업데이트가 되지 않는 것에 대해 문제만 제기할 뿐 해결책을 제시하지 못한다는 것도 아쉽습니다. 개인으로서 한계야 있었다 하더라도 이 정도 책을 출간할 만한 위치와 경력의 소유자가 현실적인 문제만 이야기하는 것은 좀 부족했다 생각되네요. 특히 이 문제는 제가 전자사전 업체에서 근무했던 거의 10여 년 전부터 불거진 문제인데 해결책이 전혀 없이 현재까지 흘러왔다는 점에서는 심각해 보이는데 말이지요.
결론내리자면 재미도 있고 건질 거리도 있지만, 아무래도 보다 심도 깊은 지식을 얻기 위한 시작점, 진입점 역할에 가까운 책입니다. 별점은 2.5점입니다.
댓글 없음:
댓글 쓰기