본문 바로가기
철학 _인문_사회_정치 (冊)

왜 통계를 사용하는가? - 통계학 초입문

by Khori(高麗) 2020. 1. 10.
728x90
반응형

 어떨결에 받아 든 통계학 초입문 책이 처음에 부담스러웠다. 고등학교 시절 수학은 자신 있었다. 인문계에서 국어점수보다 수학점수가 더 안정적이고 높은 편이었다. 가장 어려운 문제는 의외로 집합이고, 미적분은 오히려 쉽다. 시간이 지나고 아쉬운 점은 이것을 배워서 어디에 사용하는가?의 문제다. 대학시절 후배를 보니 건축설계에서는 많이 사용하는 것으로 보인다. AI에서는 행렬을 사용한다고 한다. 그렇다면 내가 배운 기계적인 수학과 개념을 일상생활에서 원활하게 사용하는 것은 덧셈, 뺄셈, 곱하기, 나누기정도다.

 

 이 책에서 말하는 통계는 아쉬 기초적인 개념이다. 고등학교 수학을 넘는다고 보기 어렵다. 기초 통계의 개념, 정규분포의 개념을 잘 설명하고 있다. 아직도 고등학교 수업시간에 배운 1시그마(68%), 2시그마(95%), 3시그마(99%)는 잘 기억하고 있다. 대학 통계학 수업시간에는 계산기 밧데리가 죽어서 음청 고생을 했다. 대학원에서 가설검증을 위해서 돌리는 SPSS, Minitab을 이젠 엑셀이면 충분하다. Power BI에서는 훨씬 더 시각적으로 볼 수 있다. 이렇게 보면 통계는 나와 상관이 없지만 우리 접하는 매체, 직무자료의 분류와 정리, 분석은 통계를 기초로 한다. 

 

 데이터를 분류하고, 축적하고, 정리하는 일에는 반드시 목적과 보려는 항목을 명확하게 해야 한다. 물론 아무 데이터나 다 모아서 추출하는 빅데이터의 무작위방식이 있다하더라도 즉시 활용할 수 없는 범위라면 무의미하다. 따라서 어떤 목적으로 어떤 항목을 계량화할 것인가와 그 데이터의 공정성, 처리 방식의 공정성은 대단히 중요하다. 문제는 조작정 정의의 수작업을 어느 수준까지 허용할 것인가? 사람이 하는 일에는 의도가 있다. 나는 통계를 사용하는 것이 상황을 파악하고 개선을 하는 목적이라고 생각한다. 하지만 그렇지 않은 목적으로도 많이 사용되는 사회적 현상을 믿기전에 확인 하는 용도도 사용이 가능하다고 생각한다.

 

책을 읽으면 본 신박한 문구

1) 무작위 

책 : 완벽하게 마구잡이로 하는 것은 어려운 것이다

내 생각 : 그 어려운 걸 해내는 사람들이 있다. 

 

2) 실력측정

책 : 평균값과 표준편차를 계산해서 자신의 학력패턴과 추이를 정확하게 판단해야 한다

내 생각 : 누적 데이터가 주는 실력검증은 중요하다. 그러나 세상은 한 번 시험붙으면 자격을 준다. CCR주기를 정해서 정기적으로 자격유지 상태를 검증하는 방식으로 변화가 필요하다.

 

3) 정규화

책 : 정규분포임을 알고 데이터를 정규화하는 것은 통계학의 기초

내 생각 : 극한은 가정이다. 어떤 면에서 거짓말수학이다. =와 =표시 위 아래에 점이 있는 것은 같은 것이 아니다. 얼추 10과 10은 다를 확율이 훨씬 높다. 통계는 오차를 말한다. 그런 점에서 진실한 방식이다. 그런 오차만큼 실행 과정에서 다양한 오류가 복잡하게 발생한다.

 

4) 수학적 재능

책 : 복잡한 공식을 외워야 문제를 풀 수 있다. 그 공식을 잊어버리면 답을 낼 수 없다. 이런 착각이 이 세상에 수학을 싫어하는 사람들을 양산하는 듯하다. 그런데 수학은 재능이 있어야 한다. 못하는 사람은 못한다.

 

내 생각 : 특정 과정의 수학을 어디에 활용할 수 있고, 산식이 외우는 것이 아니라 왜/어떻게 사용하는지를 알려주는 것이 중요하다. 수학이 어려운 것이 아니라 이걸 왜 하고 있는지에 대한 이해가 없기 때문이다. 산수부터 수학까지 지옥급행열차와 승천행열차를 셔틀해본 경험에서 그렇다. 그렇기 때문에 산수가 아닌 개념을 산수로 증명하는 과정이 그저 신기할 뿐 아닌가?

 

일상 생활에서는 표를 잘 만드는 것이 중요하다. 표는 작성자의 관점을 명확하게 알려준다. Template로 표를 만드는 것을 하다보면, 내 관점에 따라서 데이터를 분류하고, 그래프를 만들고, 평균 또는 확율, 퍼센티지를 계산하다. 미디어의 측정처럼 통계수준은 아니지만 이런 반복훈련이 논리적인 사고, 분석에 큰 도움이 된다. 의미를 이해하는 것, 그 의미를 내 생활에 활용하는 것이 중요하다.

 

#통계학 #내가_이런_책을_읽어냈다니 #지상사 #khori 어떨결에 받아 든 통계학 초입문 책이 처음에 부담스러웠다. 고등학교 시절 수학은 자신 있었다. 인문계에서 국어 점수보다 수학 점수가 더 안정적이고 높은 편이었다. 가장 어려운 문제는 의외로 집합이고, 미적분은 오히려 쉽다. 시간이 지나고 아쉬운 점은 이것을 배워서 어디에 사용하는가? 의 문제다. 대학시절 후배를 보니 건축설계에서는 많이 사용하는 것으로 보인다. AI에서는 행렬을 사용한다고 한다. 그렇다면 내가 배운 기계적인 수학과 개념을 일상생활에서 원활하게 사용하는 것은 덧셈, 뺄셈, 곱하기, 나누기 정도다.

 

 이 책에서 말하는 통계는 아쉬 기초적인 개념이다. 고등학교 수학을 넘는다고 보기 어렵다. 기초 통계의 개념, 정규분포의 개념을 잘 설명하고 있다. 아직도 고등학교 수업시간에 배운 1 시그마(68%), 2 시그마(95%), 3 시그마(99%)는 잘 기억하고 있다. 대학 통계학 수업시간에는 계산기 배터리가 죽어서 음청 고생을 했다. 대학원에서 가설 검증을 위해서 돌리는 SPSS, Minitab을 이젠 엑셀이면 충분하다. Power BI에서는 훨씬 더 시각적으로 볼 수 있다. 이렇게 보면 통계는 나와 상관이 없지만 우리 접하는 매체, 직무 자료의 분류와 정리, 분석은 통계를 기초로 한다. 

 

 데이터를 분류하고, 축적하고, 정리하는 일에는 반드시 목적과 보려는 항목을 명확하게 해야 한다. 물론 아무 데이터나 다 모아서 추출하는 빅데이터의 무작위 방식이 있다 하더라도 즉시 활용할 수 없는 범위라면 무의미하다. 따라서 어떤 목적으로 어떤 항목을 계량화할 것인가와 그 데이터의 공정성, 처리 방식의 공정성은 대단히 중요하다. 문제는 조작적 정의의 수작업을 어느 수준까지 허용할 것인가? 사람이 하는 일에는 의도가 있다. 나는 통계를 사용하는 것이 상황을 파악하고 개선을 하는 목적이라고 생각한다. 하지만 그렇지 않은 목적으로도 많이 사용되는 사회적 현상이 있다. 믿기 전에 확인하는 습관이 크게 망하지 않는 길이다.

 

책을 읽으면 본 신박한 문구

1) 무작위 

책 : 완벽하게 마구잡이로 하는 것은 어려운 것이다

내 생각 : 그 어려운 걸 해내는 사람들이 있다. 

 

2) 실력 측정

책 : 평균값과 표준편차를 계산해서 자신의 학력 패턴과 추이를 정확하게 판단해야 한다

내 생각 : 누적 데이터가 주는 실력 검증은 중요하다. 그러나 세상은 한 번 시험 붙으면 자격을 준다. CCR주기를 정해서 정기적으로 자격유지 상태를 검증하는 방식으로 변화가 필요하다.

 

3) 정규화

책 : 정규분포임을 알고 데이터를 정규화하는 것은 통계학의 기초

내 생각 : 극한은 가정이다. 어떤 면에서 거짓말 수학이다. =와 =표시 위아래에 점이 있는 것은 같은 것이 아니다. 얼추 10과 10은 다를 확률이 훨씬 높다. 통계는 오차를 말한다. 그런 점에서 진실한 방식이다. 그 오차만큼 실행 과정에서 다양한 오류가 복잡하게 발생한다.

 

4) 수학적 재능

책 : 복잡한 공식을 외워야 문제를 풀 수 있다. 그 공식을 잊어버리면 답을 낼 수 없다. 이런 착각이 이 세상에 수학을 싫어하는 사람들을 양산하는 듯하다. 그런데 수학은 재능이 있어야 한다. 못하는 사람은 못한다.

 

내 생각 : 특정 과정의 수학을 어디에 활용할 수 있고, 산식이 외우는 것이 아니라 왜/어떻게 사용하는지를 알려주는 것이 중요하다. 수학이 어려운 것이 아니라 이걸 왜 하고 있는지에 대한 이해가 없기 때문이다. 산수부터 수학까지 지옥 급행열차와 승천행 열차를 셔틀 해본 경험에서 그렇다. 그렇기 때문에 산수가 아닌 개념을 산수로 증명하는 과정이 그저 신기할 뿐 아닌가?

 

일상생활에서는 표를 잘 만드는 것이 중요하다. 표는 작성자의 관점을 명확하게 알려준다. Template로 표를 만드는 것을 하다 보면, 내 관점에 따라서 데이터를 분류하고, 그래프를 만들고, 평균 또는 확률, 퍼센티지를 계산하다. 미디어의 측정처럼 통계 수준은 아니지만 이런 반복 훈련이 논리적인 사고, 분석에 큰 도움이 된다. 의미를 이해하는 것, 그 의미를 내 생활에 활용하는 것이 중요하다.

 

#통계학 #내가_이런_책을_읽어냈다니 #지상사 #khori

통계학 초 입문
국내도서
저자 : 다카하시 요이치 / 오시연역
출판 : 지상사 2020.01.03
상세보기

 

728x90
반응형