대량살상수학무기 - 캐시 오닐 지음, 김정혜 옮김/흐름출판 |
수학박사이자 펀드회사 퀀트, 데이터 과학자 등으로 일하던 저자가 빅데이터 경제가 불평등을 확산하고, 민주주의를 위협한다는 사실을 깨닫고 그 내용을 대중에게 알리기 위해 쓴 수학, 과학, 인문학 교양서.
빅데이터를 기반한 수학 모형 프로그램이 대량살상수학무기 (이하 WMD)로 불릴만큼 위험한지에 대해 다양한 사례를 들어 설명해 주고 있습니다.
위험한 이유는, 인간의 편견과 오해, 편향성을 코드화했으며 유해한 결론이 나오더라도 개인이 반박하거나 수정하기가 극히 어렵기 때문이라고 합니다. 게다가 대체로 직접적인 데이터가 아니라 직접적 관계가 없는 대체 혹은 대리 데이터로 억지로 연관성을 도출하고요. 한 마디로, 가난한 동네에 살고, 신용이 낮고, 좋은 학교를 나오지 못했다고 모두 범죄자가 되는건 아닌데 이런 식으로 평가되는 경우가 많다는 뜻이지요. 이 책에 따르면 이건 뭔가 있어보이지만 실상 '인종차별'과 다르지 않은 논리에요. 특정 피부색은 행실이 나쁘고, 그들과 같은 피부색을 가진 사람이라면 누구나 그들과 똑같은 방식으로 행동할 거라는 이분법적 사고방식과 다르지 않으니까요. 굉장히 공감이 많이 됩니다.
또 이러한 WMD가 널리 사용됨으로 인해서, 사회적 약자와 가난한 사람들은 차별받고, 부자는 더욱 부자가 되는데, 대표적인 예가 신용을 측정하는 '신용평가점수'입니다. 신용평가점수는 대부분의 경우 업무 능력과는 하등의 관계가 없습니다. 그러나 신용평가점수가 낮은 사람들은 일자리를 구하기가 더욱 어려워졌죠. 말 그대로 하향식 악순환인 것입니다.
우리나라도 다르지 않아요. 얼마전 대통령께서 신용도 낮은 사람들에게 대출을 더 많이 해줘야 하지 않느냐? 라는 말을 해서 엄청나게 욕을 먹었었습니다. 물론 원칙에 따르면 말도 안되는 이야기지요. 하지만 이렇게 신용도로 대출을 하게 되면, 당연히 부자나 안정적인 직장인에게 더 유리할 수 밖에 없어요. 정작 대출이 필요한 사람들은 고금리 사금융에 손을 벌릴 수 밖에 없게 됩니다. 어렵겠지만, 뭔가 대책은 필요한건 분명해요.
인간의 편견이 양형에 미치는 영향력을 줄여 범죄자들을 더욱 공정하게 대하자는 재범위험성모형 recidivism models 의 문제점도 명확하게 알려줍니다. 양형의 일관성을 높이고, 판사의 기분이나 편견이 판결에 미치는 영향력을 줄이며, 평균 수감 기간도 줄여서 예산을 절약해 주는 획기적인 모델이라는데, 아쉽게도 이 역시 전형적인 WMD에 불과합니다. 앞서 말씀드린대로 대리 데이터가 기준이 되기 때문입니다. 사실 ‘고위험군’으로 분류된 사람은 일정한 직업이 없을 뿐만 아니라 법적으로 문제가 있는 가족과 친구가 많은 환경에서 성장했을 가능성이 높죠. 그러면 이들은 재범 위험성 평가에서 받은 높은 점수가 더해져, 더욱 무거운 형을 선고받고 범죄자들에게 둘러싸인 감옥에서 사회와 격리된 채 수년을 보내게 됩니다. 그리고 오랜 수감 생활은 그가 다시 감옥으로 돌아갈 가능성을, 즉 재범 위험성을 확실히 증가시키고요. 형기를 마치고 출소하더라도 예전에 살던 가난한 동네로 돌아가야 하는데, 이번에는 전과자라는 별까지 단 상태라 일자리를 구하기가 훨씬 어려워집니다. 결국 그는 또 다시 범죄를 저지르게 됩니다. 이걸 재범위험성모형이 정확한 예측을 한 것이라고 말할 수 있을까요? 그냥 하향식 악순환의 또다른 형태일 뿐입니다. 단지 '현재의 범죄'만 놓고 판단을 해야지, 사건과 관계없는 주변 데이터들을 판단에 집어넣는건 잘못된 알고리즘이죠.
그 외, 취업 시장, 대학 입시 시장 등 다양한 곳에서 WMD가 사용되는 사례를 열거하고 있습니다. 일정 관리 소프트웨어의 가혹한 일정 관리는 끔찍할 정도에요. 게다가 거의 신과 같은 역할을 수행하고 있는 셈인데, 사실상 일반 개인이 반항할 수 있는 방법이 거의 없다는게 무섭네요. 거대하고 불투명하며, 무책임하다는 측면에서 최근 화두가 되는 마이크로 타기팅 광고의 문제점도 지적하고 있습니다.
하지만 WMD의 위험성을 강조하기 위한 무리수도 몇 가지 있습니다. 경찰이 사용하는 범죄 예측 모형 프레드폴이 대표적입니다. 경범죄를 중시하도록 설계되어, 빈민가 중심의 순찰을 통해 검거율이 대폭 상승했지만 저자는 진짜 중범죄는 잡지 못한다고 역설하지요. 하지만 순찰 경관이 저자가 이야기하는 경제사범을 체포할 수는 없습니다. 애초에 순찰이라는 행위가 거리에서의 범죄 단속이니까요. 저는 순찰 경관이 필요한 범죄 카테고리 중심으로 설계된 지금 모델은 충분히 신뢰할 만 하다고 생각합니다.
또 이력서 서류 심사에서, 깔끔한 것과 지저분한 것의 차이로 평가하는건 옳지 않다고 주장하는데 이 역시 동의하기 어려웠어요. 이력서를 내는데 최소한의 노력을 기울인 사람을 선발하는게 마땅하니까요. 아무리 능력이 출중해도 배려심, 상대에 대한 존중이 없는 사람은 회사에서 문제를 일으킬 가능성도 높고요. 아, 이런 것도 대리 데이터에 따른 개인적 편견일까요?
비만인에게 건강 보험료를 많이 걷겠다는 것도 마찬가지에요. 비만이 병의 원인임이 분명하면, 그다지 잘못된 정책으로 보이지는 않습니다.
또 비슷한 사례가 계속 이어지니 좀 식상한 측면도 있고, 목차 구성에서 'WMD가 무엇인지'를 좀 더 명확하 한 뒤, 뒤의 사례들을 소개했더라면 훨씬 좋았을 것 같네요. 각 사례 소개 때 마다 '이건 이러해서 WMD이다' 에 대한 설명이 동일한데도 불구하고 계속 등장하는데, 목차 구성을 통해 이런 부분은 최소화할 수 있었을걸로 보이거든요.
아울러 이런 프로그램을 통한 개인 평가가 과연 잘못된 것인가?에 대한 근본 고민이 부족하다는 것도 좀 아쉬웠습니다. 지난 수백년간 모든 모델, 즉 대출이나 재판, 고용, 입시 등 거의 모든 경우에서 '평가'라는게 이루어져 왔습니다. 이 평가는 그동안은 해당 상황을 통제하는 '사람'에 의해 진행되었고요. 과연 사람이 이런 프로그램보다 더 나을까? 라는 측면에서는 고개를 갸웃하게 만듭니다. 책에서는 대체, 대리 데이터가 문제가 있다고 계속 주장하지만, 사실 경험적으로 어느정도 성립하는 대체, 대리 데이터가 존재하는 것도 현실이고요. 예를 들면 예전 <<신입사원>>이라는 만화에서 보았던, '학력필터' 이론이 그러합니다. 부모님 노력이 아니라 순수하게 학생들끼리 '학력' 으로만 평가해서 순위가 높은 대학에 들어간거라면, 저라도 명문대생을 우선 뽑을 것 같네요.
그래도 오랫만에 굉장히 유익하고 좋은 독서를 한 것 같아서 뿌듯합니다. 인공지능의 문제점을 잘 이해할 수 있었던 계기가 되었기 때문입니다. 제 별점은 3점입니다. 인공지능과 알고리즘이 가질 수 있는 문제에 대해 관심있으신 모든 분들께 권해드립니다.
댓글 없음:
댓글 쓰기