-
빅데이터 시대의 통계학 : 책 예고편 : '빅데이터를 지배하는 통계의 힘'수학-과학-IT 2022. 1. 12. 16:52
책 소개합니다.
'빅데이터를 지배하는 통계의 힘'(니시우치 히로무 지음, 신현호 옮김, 비전코리아, 2013)
빅데이터 시대의 통계학
여기에 책 소개 글 올렸던 '신호와 소음'(네이트 실버 지음, 이경식 옮김, 더퀘스트, 2021)을 읽다가 베이즈 정리에 대한 언급이 이해되질 않아 찾아서 읽게 된 책입니다. '베이즈파와 빈도론파의 확률을 둘러싼 대립'(빅데이터를 지배하는 통계의 힘, 니시우치 히로무 지음, 신현호 옮김, 비전코리아, 2013, 259쪽)이라는 꼭지를 읽으면서 드디어 '사전확률'이 무엇인지 알게 되었습니다. 그리고 사후확률을 조금씩 수정해 나간다는 의미도 알게 되었습니다. 베이즈 정리, 공식으로 문제만 풀었지, 그 의미를 제대로 모르고 있었습니다.
베이즈 정리 부분을 먼저 본 다음에 처음부터 읽기 시작했는데, 일반적인 통계학책은 아니었습니다. 통계 기법이 자세히 설명되어 있지는 않습니다. 그보다는 어떤 상황에 어떤 기법이라는 대략적인 맥락을 다루고 있습니다.
"'집계'만으로 괜찮았던 시대는 19세기 말까지"(앞의 책, 76쪽)라고 말하면서 저자는 인과관계를 생각하지 않는 통계해석은 의미가 없다며 다음과 같은 얘기를 합니다.
"통계해석은 다음 세 가지 질문에 모두 대답할 수 있어야 한다.
[질문 1] 어떤 요인을 변화시켜야 이익이 향상될까?
[질문 2] 그런 변화를 일으키는 행동이 실제로 가능한가?
[질문 3] 그에 따르는 비용이 이익을 상회할까?"
(앞의 책, 78쪽)이에 대한 얘기를 풀어가면서 임의화 비교실험, 비교 대조분석, 회귀분석, 로지스틱 회귀, 요인분석 등을 간략하게 설명합니다. 전체적인 흐름을 보고 어떤 것을 공부하면 되는가를 알 수 있게 해주는 책입니다.
책 후반부에는 다음 여섯 가지의 통계학 활용 분야에 대해서 설명합니다.
"① 실태를 파악하는 사회조사법
② 원인을 규명하는 역학·생물통계학
③ 추상적인 것을 측정하는 심리통계학
④ 기계적 분류를 위한 데이터마이닝
⑤ 자연언어 처리를 위한 텍스트마이닝
⑥ 연역에 관심을 두는 계량경제학"
(앞의 책, 201쪽)이 책의 후속판으로 나온 (빅데이터를 지배하는 통계의 힘) 실무활용편과 데이터활용편도 읽으려고 구해두었습니다.
저는 여러 통계학적 기법을 '광의의 회귀분석'으로 이해하는 '일반화 선형모델'이라는 개념도 이 책을 통해서 처음 접했습니다. 여기에 관심 있으신 분들도 이 책 한번 읽어보시기 바랍니다.
'수학-과학-IT' 카테고리의 다른 글
정성 가득 인공지능 입문 : 책 예고편 : '비전공자도 이해할 수 있는 AI 지식' (0) 2022.07.20 '진화론' 발달에 관한 이야기 : 책 예고편 : '진화의 오리진' (2) 2022.02.28 AI 빅데이터 공부법 : 책 예고편 : '1년 안에 AI 빅데이터 전문가가 되는 법 : 심화편' (0) 2021.12.29 자료구조와 알고리즘 입문 : 책 예고편 : '누구나 자료구조와 알고리즘'(개정2판) (0) 2021.12.16 예측의 질을 높이는 법 : 책 예고편 : 신호와 소음 (0) 2021.12.07