확률 변수(Random Variable)와 확률 질량 함수(Probability Mass Function), 기대값(Expected Value)에 대해 앞장 에서 배웠다. 이제 분산 (Variance)에 대해 다뤄보자. 이 블로그의 다른 글인 이산 확률 분포 도 참고하시길 바란다.
위의 그림에서 3개의 그래프는 x축의 변수를 x라고 하고 그 값들을 1, 2, 3, 4, 5라고 하면, E(X) = 3으로 모두 같다. 하지만 퍼짐(Spread)은 꽤 다르다. 분산은 이 퍼짐 정도를 나타내는 수학 용어이다. 분산의 수학적 정의는 다음과 같다.
즉 평균과의 차이의 제곱의 기대값이다. 위 수식을 정리하면 다음과 같은 식을 얻을 수 있다.
분산은 다음과 같은 성질을 갖는다.
표준편차(Standard Deviation)은 분산의 제곱근이므로 하기와 같다.
확률 변수에 대한 기본은 모두 배웠으므로, 가장 많이 알려진 확률 변수에 대해 배워보자.
베르누이 확률변수란 확률이 p인 사건이 발생할지 말지에 대한 확류률 변수로 발생하는 것을 1, 미발생하는 것을 0으로 한다. 수식으로 나타내면 다음과 같다.
정의에 의해 아래와 같은 기대값과 분산을 가짐을 쉽게 알 수 있다.
이항 확률 변수는 베르누이 시행(Experiment)를 독립적으로 n회 시행할 때 성공하는 회수를 나타내는 확률 변수이다. 예를 들어 n개의 동전을 던셔서 앞이 나오는 개수의 확률을 구할 때 사용한다.
위에서 n은 시행회수, p는 1회 시행시의 성공 확률이다. 앞으로 계속 보게 되겠지만, 확률 변수가 정의되면 항상 다음 3가지를 계산한다. 각확률 변수에 대한 확률값, 기대값, 분산.
위의 식에 대한 상세 설명 및 유도는 이산 확률 분포 를 참고하시기 바랍니다.
루트 2 값 구하기 (1) | 2019.07.20 |
---|---|
[CS109] 8 - Poisson Distribution (0) | 2019.07.14 |
[CS109] 6 - Random Variables (0) | 2019.07.07 |
[CS109] 5 - Independence (0) | 2019.06.30 |
[CS109] 4 - Conditional Probability (0) | 2019.06.22 |