본문 바로가기
좋아하는 것들에 대하여/책을 읽고 남기는 글

[책] 수학의 쓸모 - 닉폴슨, 제임스 스콧

by 글쓰는 홍차 2020. 11. 19.

이 책은 인공지능에 사용하고 있는 수학에 대해서 이야기하고 있다.
7장까지 있는데, 다양한 분야에서 사용하고 있는 수학의 원리(확률과 통계)에 대해서 적용한 이야기를 한다.

1장은 넷플릭스가 취향을 읽는 법: 확률이라는 언어


처음 인용한 이야기는 틀리지 않는 법에서 읽어서 알고 있는 유명한 이야기로,
왈드가 격투되지 않고 돌아온 전투기를 분석하여 전투기를 보완해야 하는데, 일반 사람들은 돌아온 전투기를 분석한 반면, 돌아오지 않은 전투기는 어디가 맞아서 격침되었는지를 모두 분석하여, 돌아온 격투기와 돌아오지 않은 전투기가 어디에 맞았을지를 추측해서 표를 만들어서. 어디가 취약한지를 알 수 있도록 한 것.
→ 특정한 부위에 총격을 받았을 때 추락할 조건부 확률
→ 어느 영화를 좋아할 조건부 확률(넷플릭스)

조건부 확률


2장. 수식 한 줄로 미래를 계산하기: 패턴과 예측 규칙


2017년 중국에서 공중 화장실에서 화장지를 훔쳐가는 도둑들에 대한 것을 방지하기 위해서
1) 자동화된 화장지 뽑기(한 사 람마다 60센티만 사용할 수 있도록 함) - 그러나 도둑들은 6칸씩 계속 뽑아 훔쳐감
2) AI( 심층학습 알고리즘 탑재) 도입 - 모자, 안경, 가이 포크스 마스크 등을 벗어 인간으로 판별할 수 있도록(얼굴인식)할 수 있도록 해야 자동으로 화장지가 나옴 -> 프라이버시 침해 문제 및 고장 나서 줄을 서게 되는 사태가 생김 결국은 방지할 수 없었음


패턴 인식 시스템이 어떻게 작동하는지에 관한 핵심 개념 2가지

  1. AI에서 '패턴'이란 입력을 예상되는 출력에 대응시키는 예측 규칙이다
  2. '패턴 학습'이란 훌륭한 예측 규칙을 한 데이터 집합에 맞추는 것이다.


미래를 계산하고 예측하고 계산하는 시대가 도래함.

요인 1. 대용량 모형

  • 매개 변수 - 방정식의 한 수로, 데이터에 가장 잘 맞는 패턴을 얻기 위해 자유롭게 선택할 수 있는 것.
  • 작은 모형 - 매개변수를 몇 가지만 사용하는 반면 대용량 모형은 많은 매개변수를 가지는 것

신경망 - 인셉션이라는 별칭으로 불린 이 신경망 모형은 영상을 자동으로 인식하고 식별함. 물체가 개인지 아닌지, 그 개가 시베리안 허스키인지 알래스칸 말란뮤트인지를 구분함. 그 모형에는 38만 8,736개의 매개변수가 관여함. 15억 번의 산술 연산이 필요함

요인 2. 대용량 모형에는 대용량 데이터 집합이 필요하다

대용량 모형의 한계 -> 과적합(어떤 모형이 학습하지 못할 때 생기는 것, 과거를 매우 정확하게 기술할지 모르나 미래를 예측하는 데는 서툴다)
과적합을 피하는 방법 - 1) 복잡한 설명을 거부하는 것 2) 방대한 양의 데이터를 모으는 것 3)

요인 3. 초당 100만 번 가능한 시행착오


헨리에타 레빗의 연필과 종이를 이용해 예측 규칙을 만듦 -> 1805년 르장드르가 내놓은 최적 직선에 관한 수학 공식


요인 4. 심층 학습

3장. 데이터의 홍수에서 살아남기: 베이즈 규칙


의료 진단과 펀드 매니저 고르기


4장. 디지털 비서와 대화하는 법: 통계와 알고리즘


통계 : 컴퓨터 코딩의 여왕 그레이스 호퍼의 이야기가 너무 인상적이었다. 사람이 알아볼 수 있는 언어로 변경하는 것에 대해 적극적이었던 그레이스 호퍼는 프로그래밍 언어에 대한 문을 연 여성 컴퓨터 과학자였던 것.

NLP(자연어 처리)에서 단어를 어떻게 숫자 화하여 바꾸게 되는지 (워드 투 벡터)를 말하는 장이다

5장. 행운과 스캔들 사이, '이상'을 탐지하라: 변동성


변동성에 대한 이야기로, 영국 경제 위기 시대에 동전 깎기로 변동성에 대해 대비를 하지 못했던 것에 대한 이야기.

제곱근 규칙, 드무아브르 방정식



6장. 일상에서 틀리지 않는 법: '잘 세운 가정'의 힘


모형은 녹슬기 마련이다. 환경과 변수가 계속 변하기 때문에, 모형도 계속적을 업그레이드가 되어야 하며, 이것은 인간이 할 수밖에 없는 일이다라는 말.
(과연 그럴까, 이 또한 인공지능이 해버리는 날이 오지 않을까?)라는 생각.

7장. 다음 혁신이 일어날 곳은? 공중보건과 데이터 과학


크림반도의 천사
데이터 과학을 의료 분야에 전면 도입하려면, 헬스케어 관련된 내용으로 지금은 이 분야가 확실히 뜨고 있다는 생각이 들고 있다.
회사에서도 갑자기 신생팀처럼 되어 있었던 이 팀이 관심을 받기 시작하고 사업을 시작한다는 이야기를 하기 시작했다. 세상이 변하고 있는게 확실하군

이 책을 읽고 나니 뭔가 더 열심히 공부해야겠다는 생각이 들었다. 물론 정보 통계학 관련해서 조금씩 공부하고 있다. 3년 정도 쌓고, 다시 분야를 개척하고 싶구나..

댓글