알고리즘 책

알고리즘이 지배한다는 착각 2018, 2022
알고리즘이 당신에게 이것을 추천합니다 2016, 2018
알고리즘, 인생을 계산하다 2016, 2018

알고리즘이 지배한다는 착각 ^{2018, 2022}

★★☆☆☆
책의 부제처럼 수학으로 밝혀낸 빅데이터의 진실을 기대했으나 구체적인 알고리즘 얘기는 하지 않는, 인공지능의 윤리에 관한 책이다.

p87.편향 없음은 불가능하다.
- 알고리즘의 편향을 제거해야 한다는 주장은 경험과 가치관에 기초한 것인데, 이것이 도덕적으로는 옳을지 몰라도 수학적으로 따지면 옳지 않았다. 수학이 나에게 보여준 것은 공정을 위한 공식은 존재하지 않는다는 것이 전부였다.
- p105. 우리는 최선을 다할 수는 있지만, 우리가 옳은 행동을 하는지 여부를 정말로 확실히 알 길은 결코 없다.
p161.
컨볼루션 신경망을 곱말기 신경망으로 번역. 합성곱으로 보통 번역하는데, 그걸 더 우리말로 표현하고 싶었던지, 역자의 마음은 이해하나 곱말기 신경망은 지나치게 생소하다.
p343. 에쁜꼬마선충은 가장 단순한 생물들 중 하나다. (아마 생물 실험 분야에서는 가장 유명한 생물일 것이다) 완전히 발달한 성체가 세포 959개로 이루어졌으며, 그중에 약 300개가 뉴런이다. 우리 몸의 세포는 37조 2000억 개, 뉴런은 860억 개다. (실제로 확인해보니 뉴런은 1000억개, 시냅스의 갯수는 320조 개)
p350. 구글이 딥마인드를 인수할 당시 하사비스는 자신의 회사가 “지능을 해결한다”고 강조했지만, 지금은 어조를 낮췄다. 최근 인터뷰에서 그는 수학적 최적화 문제들의 해결을 더 많이 강조한다.

알고리즘이 당신에게 이것을 추천합니다 _{2016, 2018}

계산
1985년에서 2005년까지 20년 동안 컴퓨터 프로세서는 4000배 더 빨라졌다. 이는 56시간이었던 어떤 알고리즘을 새 컴퓨터에서는 겨우 50초 만에 실행할 수 있다는 뜻이다. 그러나 2005년에는 그 과거의 알고리즘을 입수할 길이 없었다. 당시 사람들은 20년 전 보다 2만 배 빠른 새로운 알고리즘을 사용하고 있었고, 이것은 옛 하드웨어에서 실행해도 겨우 10초라는 뜻이다. 새 알고리즘을 새 하드웨어에서 실행했을때는 겨우 0.1초였다. 결론적으로 20년 만에 컴퓨터의 작동속도가 200만 배 더 빨라진 셈이었다. p.32
검색
페이지랭크 이야기
내비게이션
p.79 모두 방문하는 최단 경로 검색 소개, 총 2234 킬로미터 이다.
스탠포드 연구소의 세 연구자가 개발한 알고리즘의 이름은 A*이다. 닐손은 직선 경로에 관한 아이디어를 떠올렸고, 래피얼은 알고리즘의 원리적인 단계들을 고안했으며, 하트는 그 알고리즘이 확실히 최단 경로를 찾아낸다는 것을 증명했다.
음수에는 다익스트라 알고리즘 또는 A* 알고리즘을 적용할 수 없다. 다익스트라가 1956년에 겨우 20분 동안 궁리하여 고안한 알고리즘은 지금도 쓰인다. 당시에 그는 경로 계획 알고리즘이 미래에 얼마나 많은 분야에서 활용될지 상상조차 하지 못했을 것이 틀림없다.
추천
연결
sixdegrees.com의 회원은 몇 백만명에 달했지만 다들 그 웹사이트를 어디에 써먹어야 할지 막막했다. 2000년에 폐쇄됐다. 그 후 수많은 SNS들이 나타나고 사라졌다. 클레이 셔키는 YASNS라는 약자까지 고안했다. Yet Another Social Networking Service. p.120
예측
상관성(correlation)을 근거로 예측하기. 10대 소녀에게 임산부 쿠폰을 보낸 사례를 소개한다. 나중에 이 소녀는 실제로 임신했음이 밝혀진다. p.137
구글은 공개하지 않은 45개 피처로 독감 트렌드를 분석했다. 처음에는 매우 성공적으로 예측했다. 그러나 시간이 지나자 심각한 오류가 몇 번 발생했다. 2009년 돼지독감의 대유행을 전혀 예측하지 못했으며 2013년에는 나중에 실제로 확인된 독감환자 수 보다 두 배 많은 환자가 발생하리라고 예측했다.
실패 이유:
- 초기에는 성공적이었다. 보외법 ^{extrapolation}이 아직 유효했기 때문이다. 과거의 상관성에 기초해 미래를 예측했다. 그러나 해가 거듭될수록 조건들은 늘 동일하지 않았다.
- ‘잡음이 섞인’ 데이터에서 정확한 결론들을 도출하려 했다. 일반인이 스스로 독감에 걸렸다고 생각하는 경우의 대다수에서 그는 실제로 독감에 걸리지 않았다.
  p.152
투자
나이트캐피털은 잘못된 거래액이 70억 달러에 달했고, 45분만에 문제를 발견했지만 이미 회사는 4억 4천만 달러를 잃은 뒤였다. … 오늘날 한 주식이 한 소유자의 손에 머무는 시간은 평균 5일에 불과하다. 50년 전에는 8년이었다. p.164
암호화
밥과 앨리스의 혼합 페인트로 사례를 소개한다. 『미래를 바꾼 아홉 가지 알고리즘』에서 설명했던 동일한 방식이다.
압축
사랑
여성은 본인이 나이를 먹으면 이상적인 파트너의 나이도 높이는 반면 남성은 나이와 상관없이 20대 여성을 선호한다. 오케이큐피드의 창업자 크리스천 러더가 쓴 책 『데이터클리슴 Dataclysm』에 따르면 그렇다. p.222
학습
팀 오라일리는 알고리즘 규제 ^{Algorithmic regulation}를 이야기 한다. 정부의 일은 다음 네 단계로 요약된다.
- 성과에 대한 깊은 이해
- 성과가 달성되었는지 알아내기 위한 실시간 측정
- 새 데이터에 적응하는 알고리즘
- 알고리즘이 올바른지, 바라는 대로 작동하는지에 대한 정기적이며 심층적인 분석

왜냐면 알고리즘은 편견을 강화하기 때문이다. 예컨대 집과 직장 사이 거리가 더 짧은 직원이 직장에 더 충실하다는 것이 밝혀졌다면 그 규칙을 직원 채용 알고리즘에 내장할 수 있을 것이다. 그러나 회사가 부자 동네에 위치해 있다면 그 규칙은 그 동네에서 살 형편이 안 되는 사회적 집단 전체를 차별하는 효과를 낸다. p.254

예전 『대량살상 수학무기』에서 언급됐던 알고리즘 규제 방안과 유사해 보인다.

히포크라테스 선서와 같은 도덕적 선언이 필요하다.
알고리즘 모델은 완벽하지 않으므로 오남용해선 안된다.
공정성에 논란을 일으킬 수 있는 데이터는 폐기해야 한다.
정기적으로 감사해야 한다.
모델은 가능한 투명하고, 누구나 쉽게 접근할 수 있어야 한다.

(대량살상 수학무기, 2018)

나가는 말
구글의 코드는 20억행, 윈도우는 5000만 행이라고 언급 p.263

알고리즘, 인생을 계산하다 _{2016, 2018}

주요 내용 요약
PPT 요약
p102 우리는 새 비서를 뽑을 때엔 너무 일찍 멈추는 경향이 있는 반면, 새 항공사의 비행기를 타볼 때에는 너무 늦게 멈추는 경향이 있다.
- p109 탐색/이용 트레이드오프는 노인들의 조언을 어떻게 생각해야 할지도 알려준다. 할아버지가 어느 식당이 좋다고 알려줄 때, 당신은 귀를 기울여야 한다.
- 37%를 최적 멈춤(Optimal Stopping)이라고 합니다.
p117 우리는 구글을 검색 엔진이라고 부르지만, 사실 정렬 엔진이 맞다.
탐색과 이용(Explore/Exploit)의 균형은 선택 시간에 따라 달라집니다. 탐색의 가치는 시간이 지남에 따라 감소하는 반면, 이용의 가치는 시간이 지남에 따라 증가합니다. 이 가치를 신뢰 상한(UCB, Upper Confidence Bound)이라고 하며 이 값에 따라 선택합니다. 젊은이와 노인 모두 알고리즘이 기대하는 바에 따라 행동합니다. 젊은이는 탐색을 선호하고 노인은 활용을 선호합니다. 둘 다 각자에게 시간이 얼마나 남아 있는지 잘 알고 있기 때문입니다.
일정계획(Scheduling)에는 여러 알고리즘이 등장합니다.
- 최소 납기 우선(Earliest Due Date): 만기일이 가장 가까운 작업부터 시작하여 만기일이 가장 나중인 작업 순으로 진행
- 무어 알고리즘(Moore’s Algorithm): 최소 납기 우선과 동일. 제시간에 처리하지 못한다면 가장 오래 걸리는 항목 제거
- 최단 처리 시간(Shortest Processing Time): 가장 빨리 끝낼 수 있는 작업 먼저 처리
- 인터럽트 병합(Interrupt Coalescing): 신용카드 청구서가 올 때 바로 입금하지 말 것. 마지막 청구서가 오면 다 모아서 한 번에 처리
라플라스의 법칙: n번 뽑아서 당첨 복권이 w장 나온다고 할때, 기댓값은 (w+1)/(n+2)입니다.

Last Modified: 2025/04/15 19:23:35

알고리즘 책

알고리즘이 지배한다는 착각 2018, 2022

알고리즘이 당신에게 이것을 추천합니다 2016, 2018

알고리즘, 인생을 계산하다 2016, 2018

알고리즘이 지배한다는 착각 ^{2018, 2022}

알고리즘이 당신에게 이것을 추천합니다 _{2016, 2018}

알고리즘, 인생을 계산하다 _{2016, 2018}