통계학 책

Books

통계학을 떠받치는 일곱기둥 이야기 2016

  • Information: Its Measurement and Rate of Change
    정보 측정: 정보 측정과 변화율
    • The Trial of the Pyx 주화 표본 검정
      검정용으로 쓸 주화를 몇 개씩 골라 픽스Pyx라 부르는 상자에 넣었다.
    • Abraham de Moivre 아브라함 드 무아브르
      드 무아브르는 오늘날 이항 분포에 대한 정규 근사라 부르는 유명한 결과를 1733년에 도출하지만, 벌써 1730년에 분포의 결정적 측면이 n의 제곱근 편차와 엮여 있다는 것을 알았다. 드 무아브르는 개별 관측이나 관측 오차가 오떤 분포를 따르든 주화 표본의 무게 측정 같은 관측의 합계나 평균이 정규 분포를 따르리라는 같은 결론에 이르렀다. 증명이 철저하지 못한 데다, 1824년에는 푸아송이 오늘날 코시 분포라 부르는 예외 사례를 찾아냈다.
  • Likelihood: Calibration on a Probability Scale
    가능도: 확률 척도의 보정
    • Intercomparison: Within-Sample Variation as a Standard
      상호 비교: 표본 내 변동을 표준으로
      통계적으로 비교할 때 외부 기준을 참조하거나 믿지 말고 철저히 자료 내부에 있는 변동만으로 비교해야 한다는 발상이다.
  • Regression: Multivariate Analysis, Bayesian Inference, and Causal Inference
    회귀: 다변량 분석, 베이즈 추론, 인과 관계 추론

  • Design: Experimental Planning and the Role of Randomization
    설계: 실험 계획과 랜덤화의 역할
    • Randomization 랜덤화
  • Residual: Scientific Logic, Model Comparison, and Diagnostic Display
    잔차: 과학 논리, 모형 비교, 진단 표시

좋은 선택, 나쁜 선택 2019

  • 데이터에 기반한 선택이 좋은 선택이다
    선택의 방법에는 경험, 개연성, 영도에 따른, 다수의 선택 등 다양한 방법이 있지만 데이터에 기반한 선택이 최선이다.
  • 우리의 수치에 대한 직관은 믿을 만하지 않다
    생일이 겹치는 문제, 몬티 홀 문제와 같은 대표적인 확률을 잘못 계산하는 문제가 나온다. 교양 통계 서적을 자주 봤다면 한번쯤 봤을 내용.
  • 확률과 통계의 함정
    독립 사건: 9번 모두 동전 앞면이 나와도 10번째에 앞면이 나올 확률은 1/2이다. 큰 수의 법칙과 이항 분포로 동전이 몇 번이나 나올지에 대한 확률을 계산할 수 있다. 1733년에 드 무아브르는 이항 분포의 시행 횟수를 크게 하면 종 모양의 분포로 근사시킬 수 있다고 주장했다. 이 분포는 지금의 정규 분포인 종 모양을 가진다. p.65 18세기 말 프랑스의 수학자 라플라스는 전체 사건이 어떤 확률 분포를 따르든 간에 표본을 뽑은 후 그 본의 평균을 구하면, 표본의 개수 n이 적당히 크기만 하다면 이 표본의 평균이 전체 사건의 집합인 모집단의 평균값을 중심으로 하는 정규 분포를 이룬다는 중심극한정리를 발표했다. p.66
  • 데이터 수치가 말하지 않는 것
    정확도와 재현율에 대해 언급하는데, 이 보다는 표본집단 sample에 대한 확률의 함정에 대해 다룬다. 모집단 population을 대표하는 표본 추출이 편향되게 bias 추출되지 않는게 중요하다. 생존 편향의 얘기도 나온다.
  • 거짓말은 아닙니다
    윤리, 데이터를 부풀려 표현하는 문제, 5% p-value의 함정, 재현 불가에 대해 얘기한다.
  • 숫자로 쌓아 올린 신기루
    화물숭배 Cargo Cult
    현대 사회에서 누군가에게 주술을 믿느냐고 물으면 대부분 얼굴을 붉히며 자신을 모욕하지 말라고 항의할 것이다. 그런데 아이러니한 것은 주술을 사용하여 자기 계발을 전파하는 책에 대해서는 극찬하면서 자신의 삶을 바꾸는 지표로 삼는다는 사람을 쉽게 찾아볼 수 있다는 점이다. p.132
  • 선택을 해봅시다
    ‘엘리베이터에서 배우자 고르기’는 『알고리즘, 인생을 계산하다』에 나온 37% 문제와 유사.
  • 합리적인 선택을 위해 해야 할 일
    데이터 시각화가 중요하다고 강조.

차를 맛보는 여인 2001, 2019

좋은 책이지만 2001년에 출간된 책이고, 이 책에 등장하는 내용 대부분은 이후 다른 책에서도 많이 언급한다. 스티븐 스티글러 교수의 『통계학의 역사』와 유사하다. 좀 더 정확히는 통계학자들의 역사라고 할 수 있다.

Links

Last Modified: 2020/06/19 18:47:37


수식  ·  Markov Decision Process  ·  2020 Book Reports  ·  통계학  ·  통계학 책  ·  Front-End  ·  통계학 기술  ·  머신러닝  ·  Activation, Cost Functions  ·  Python  ·  알고리즘  ·  자료구조  ·  비지니스  ·  Docker  ·  AWS  ·  NLP 링크  ·  알고리즘 링크  ·  머신러닝 링크  ·  사회심리학  ·  Information Retrieval  ·  통계학 응용  ·  OOP  ·  2019 Book Reports  ·  Android Development  ·  데이터 사이언스  ·  인공지능  ·  진화생물학  ·  이산수학  ·  수학  ·  미래학  ·  Project Management  ·  LifeHacks  ·  C++  ·  2017 Book Reports  ·  Decision Tree  ·  LeetCode  ·  TensorRT  ·  NLP  ·  Hadoop, Spark  ·  데이터 마이닝  ·  CNN, RNN  ·  2018 Book Reports  ·  운영체제  ·  머신러닝 분류기  ·  거리  ·  Support Vector Machine  ·  OAuth 2.0  ·  Naive Bayes  ·  Jupyter Notebooks  ·  RSA  ·  컴파일러  ·  딥러닝  ·  Word Embedding  ·  컴퓨터시스템구조  ·  영어  ·  Go  ·  Scikit Learn  ·  XGBoost  ·  Software Deployment  ·  NLP 실험  ·  MySQL  ·  Keras  ·  Java
is a collection of Papers I have written.
© 2000 - Sang-Kil Park Except where otherwise noted, content on this site is licensed under a CC BY 4.0.
This site design was brought from Distill.