특정 사건(Event)에 대해 확률을 구하는 방법에 대해 지금까지(확률 계산 ) 배웠다. 이제 한단계 더 나아가 확률 변수(Random Variable, RV)에 대해 배워보자. 유사한 내용이 이 블로그의 다른 글인 이산 확률 분포 에도 있다.
예를 들어, 3개의 동전 던지기를 생각해 보자. 우리는 확률 변수 Y를 앞면이 나온 개수로 정의할 수 있다. Y는 0, 1, 2, 3까지 총 4개의 값을 가질 수 있다.
다양한 종류의 확률 변수가 있지만, 여기서는 우선 이산(Discrete) 확률 변수를 다룬다.
확률 질량 함수(PMF)는 이산 확률 변수에서 특정 값에 대한 확률을 나타내는 함수이다. 연속 확률 변수에서의 확률 밀도 함수(Probability Density Function)과 같다. PDF는 많이 들어 봤을 것이다.
주사위 1개를 굴릴 때 나오는 숫자값에 대한 확률 질량 함수를 구해 보자. 너무 간단하긴 하지만 의미가 있다. 우선 식으로 나타내면 다음과 같다.
확률 변수 X(대문자)의 원소를 x(소문자)라고 할 때, x는 정수(볼드체 Z)에 속하고, x가 0보다 크고 6보다작거나 같을 때 각각 1/6이라는 확률값을 갖는다는 뜻이다.
그래프로 그리면 다음과 같다.
두개의 주사위를 굴릴 때 그 나온 값의 합을 생각해 보자. 확률 변수를 X라고 하면 X는 2, 3, ..., 12일 때를 제외하고는 0인 값을 갖는다. 수식으로 나타내면 아래와 같다.
그래프로 그리면 아래와 같다.
확률 변수에 대한 함수를 정의하였기 때문에, 좀 더 쉽게 관심 있는 값을 구할 수 있다. 그 중에 하나가 기대값이다.
이산 확률 변수 X에 대한 기대값은 다음과 같이 정의 된다.
기대값은 여러가지 이름으로 불린다. 평균, 기대치, 가중 평균, 무게 중심 등등. Mean, Expectation, Weighted Average, Center of Mass, 1st Moment.
기대값은 다음과 같은 선형성을 갖는다.
이 성질은 서로 다른 확률 변수들 간에도 성립한다.
Law of the Unconcious Statistician (LOTUS)
위 법칙은 g(X)를 모르더라도 X에 대한 확률 질량함수만 알면 된다는 것이다. 예를 들어 확률 변수에 대한 이차 모멘트 , 즉 제곱의 기대치는 다음과 같이 계산할 수 있다.
[CS109] 8 - Poisson Distribution (0) | 2019.07.14 |
---|---|
[CS109] 7 - Variance, Bernoulli, Binomials (0) | 2019.07.14 |
[CS109] 5 - Independence (0) | 2019.06.30 |
[CS109] 4 - Conditional Probability (0) | 2019.06.22 |
[CS109] 3 - Probability (0) | 2019.06.01 |