일: 2021 11월 20

수학의 쓸모

수학의 쓸모,

닉 폴슨제임스 스콧 저/노태복 역

이 책은 수학이 어떻게 IT 분야의 첨단에서 적용되는가에 대한 설명을 하고 있다. 그렇다고 해도, 수학적인 복잡한 수식을 나열하지 않고, 그런 설명은 하지 않은채 일반적인 설명 톤으로 수학이 어떻게 적용되고 사용되는지에 대해서 설명한다.

그리고, 좋은 점은

설명하기 위한 주제를 질문으로 던지고 그 질문에 대한 답을 찾아가는 것을 설명한다.

그러다보니 알아야할 주제가 무엇이고, 그것을 어떻게 풀어가는지를 쉽게 읽어가면서 이해할 수 있다.

책은

  1. 넷플릭스가 취향을 읽는 법
  2. 수식 한 줄로 미래를 계산하기
  3. 데이터의 홍수에서 살아남기
  4. 디지털 비서와 대화하는 방법
  5. 행운과 스캔들사이 “이상”을 탐지하라
  6. 일상에서 틀리지 않는 법
  7. 다음 혁신이 일어날 곳은 ?

넷플릭스 이야기에는 취향을 읽기 위해서 확률을 어떻게 사용하는지 설명하고 있다. 추천 시스템이 확률적으로 어떻게 움직이는지 그리고 넷플릭스가 사용한 추천시스템은 어떤 원리에 의해서 움직이는 지를 설명한다.

P49
이런 과정의 가장 멋진 점들은 그 축을 정의하는 잠재 특성들이 미리 결정되어 있지 않다는 점이다. 여기서 그 잠재 특성들을 파악하는 역활은 AI의 역활이다. 이용자가 매긴 수천만건의 평가 등급을 바탕으로 AI 시스템이 상관 관계 패턴을 읽어내서 잠재 특성을 찾아내는 것이다.

데이터의 홍수에서 살아남기는 수많은 데이터에서 유효한 데이터를 찾거나 데이터 속에서 길을 찾아가는 과정을 설명한다. 망망대해에서 잠수함이 사라졌던 사건에서 잠수함이 어디에 있는지 찾기 위해서 바다를 샅샅이 뒤지는 과정을 진행했으나 결국 못 찾았다. 이를 해결하기 위해서 “조 크레이븐” 이라는 수석 과학자의 지휘아래 다시 찾기를 시작하는데 이번에는 베이지언 검색 방식을 이용하여 찾기 시작하고 단기간에 찾아내게 된다.

사전 믿음 + 데이터 = 사후 믿음

이라는 규칙에서 베이지언 검색을 통해서 계속해서 수정해 가면서 찾아가는 것을 반복한다. 이러한 방법은 전역을 세밀하게 탐색하는 것 보다 훨씬 효과적으로 작동하여 결국 쉽게 (?) 찾아 내게 된다.

행운과 스캐들 사이는 변동성이라는 것을 주목하고 있다. 뉴튼이 조폐공사에 들어가서 일을 할때 뉴튼도 미처 확인하지 못했던 작은 변동성이 영국의 경제를 파탄으로 몰고가는 것을 불과 0.1g의 은의 변동성으로 설명하고 있다.

드무아브르의 정리 라고도 불리는 제곱근의 규칙에 따르면 표본 평군의 변동성은 표본 크기의 제곱근이 커짐에 따라 더 작아진다고 이야기한다. 즉 평균이 많이 모이면, 평균의 평균치가 유지 되어야 하지만, 변동성은 더욱 작아서 제곱근 형태로. 유지되어야 변동성을 일정하게 유지한다는 의미이다.

다음 혁신이 일어날 곳은 ?

의료 분야에서 수많은 데이터가 쌓여도 찾아낼 수 있는 것은 의료 데이터의 변화에서 찾아내지 못하고 현재의 값에서만 찾아내는 체크 쉬트를 통해서 의료 데이터를 활용한다. 이러한 것은 150여년전의 나이팅게일 이후 실질적인 발전이 이루어지지 않은 의료계의 데이터 활용을 지적하고 있다.

이의 한계를 돌파하기 위해서, AI기반으로 의료 데이터를 활용하는 시스템을 구축하는 것을 설명하고 있다.

P335

체크 리스트의 본질은 현재 상황을 세부적으로 파악하는데 초첨을 맞추고 있다. 하지만 여러 해에 걸쳐 진행되는 만성 질환이 사람의 생명을 갉아 먹고 있는 것을 파악하는데 도움은 주지 못한다. 이런 특징은 버그나 마찬가지이다.