1 minute read

서론

회사에서 회의하다가 깜짝 놀란 일이 있었다. 팀 내에서 딥러닝 스터디에 참가했었는데, 팀장님이 딥러닝 스터디를 위한 기본 수학 용어 및 컨셉 설명하던 도중 던졌던 질문이었다.

확률 변수의 정의가 무엇인지 아시나요?

부끄럽게도 나는 답을 할 수 없었다. 나는 고등학교와 대학교에서도 확률과 통계 과목을 공부했었다. 하지만 확통 과목에서 가장 초반에 배우는, 그리고 회사 내에서 기본적으로 알고 있다고 가정하며 사용하는 용어 중 하나인 확률 변수의 정의조차 쉽게 답을 할 수 없었던 것이다. 팀장님이 어떤 마음이 들었었는진 알 수 없다. 잠시간의 우물쭈물을 겪으시고, 팀장님은 입을 열었다.

확률 변수는, 함수에요.

??? 확률 변수가 함수라니. 나는 무언가의 거창한 정의가 있을 것이라고 생각했었는데. 내 예상을 뛰어넘는 간결한 대답에 이런 간단한 답 조차 할 수 없었던 내가 아직 부족하다고 밖에 생각할 수 없었다. 블로그에 하나하나 정리하면서 앞으로는 헷갈리지 않도록 머리속에 잘 정리 해놓아야 겠다. 이번 포스트에서는 확률변수, 확률분포, 확률분포함수에 대해 정리를 할 것이다!

용어정리

확률변수 : 특정 실험으로부터 발생 가능한 모든 결과에 실수값을 할당하는 함수 X를 말한다.

  • 예를 들어, 동전을 던져서 앞면 뒷면을 확인하는 실험에서, 그림이 나올 확률은 1/2, 숫자가 나올 확률은 1/2이다. 이 결과값에 실수값을 부여(그림=1, 숫자=0)를 부여하는 변수를 뜻한다.

확률분포 : 할당된 모든 값과 그에 대응하는 확률들에 대한 분포.

확률분포함수 : 할당된 모든 값에 대해 일어날 확률을 대응시키는 함수

확률질량함수 / 확률밀도함수

이산확률변수 X에 대한 확률분포함수는 확률질량함수로 표현한다. 확률질량함수는 이산확률변수 X에 대해 X=x일 사건이 일어날 확률을 대응하는 함수로 정의한다. 가장 쉬운 예시로 주사위를 들 수 있다. 주사위의 눈이 1이 나오게 될 확률은 P(X=1) = 1/6이 되게 된다. 여기서 확률질량함수 f(x)는 사건 X가 발생할 확률을 뜻한다.

반면, 연속확률변수는 누적분포함수의 도함수로 정의한다. 누적분포함수의 도함수로 설정한 이유는 연속확률변수가 이산확률변수화는 다르게 특정한 점에서의 확률을 정의할 수 없기 때문이다. 예를 들어, 어떤 사람이 하루에 마시는 커피의 양을 연속확률변수 X로 하였을 때 사람이 커피를 정확하게 100ml를 마시게 되는 확률은 얼마일까? 조금 생각해본 후 우리는 그 확률이(X=100일 확률이) 0이라는 것을 말할 수 있을 것이다. 이러한 확률 변수는 특정한 점에서의 확률을 구했을 때, 그 점에서의 확률을 정의할 수 없기 때문에 확률밀도함수를 누적분포함수의 도함수로 정의한다. 즉, 확률밀도함수 f(x)는 확률이 아니다. 이 함수는 특정 점이 아니라 특정 구간에서 확률의 의미를 가진다. 사람이 하루에 커피를 100~150ml 마시게 되는 확률은 0이 아니다.

확률 밀도 함수의 정의는 수식적으로 다음과 같이 나타난다.

\[F(x) = \int_0^x f(y) dy\]

따라서, 다음이 항상 성립한다.

\[\int_0^\infty f(x) dx = 1\]

왜 확률변수와 확률함수가 통계에서 필요할까?

우리가 확률 변수의 확률 함수를 알고 있다면, 특정 사건이 일어날 확률을 계산할 수 있기 때문이다. 이 과정은 모든 통계적인 과정의 시초가 되기 때문에 필요한 과정이다.


참고문헌

The posts is for personal study.
If you find some mismatches or errors, please give comments or email to me.
Thank you. :)