지금까지 배운 것을 요약해보면, 확률 변수(Random Variable)를 정의하고 확률 질량 함수(Probability Mass Function)를 구한 후 기대값(Expected Value)과 분산(Variance)을 계산하였다. 그리고 가장 기본이 되는 베르누이 시행과 이항분포에 대해서 배웠다. 이제 포아송 확률 분포에 대해 알아보자.
당신이 카카오 택시 기사라고 하자. 서울 강남에서 카카오택시의 콜 수가 분당 평균 5건일 때, 1분동안 2건의 콜을 받을 확률은 얼마일까?
X를 1분 동안 받을 콜 수라고 하면, 우리가 구하고자 하는 것은 다음과 같다.
위의 경우는 1분이 60초이므로 초당 콜이 오는지 안오는지로 생각해 볼 수 있다. 즉 콜이 오는 것을 성공 안오는 것을 실패라고 하면, 성공확률이 5/60인 베르누이 시행을 60번하는 이항 분포와 같다.
이것을 충분한가? 초가 아니라 밀리초(1000분의 1초) 단위로 생각해 볼 수도 있지 않는가?
이것을 일반화 하면 다음과 같다. (아래 수식에서 람다는 특정시간동안 평균적으로 발생할 사건 수)
이항분포 수식을 활용하여 정리를 잘하면 다음 수식을 얻을 수 있다. 자세한 내용은 이산확률 분포 #2의 포아송분포 유도 를 참고하기 바람.
포아송 확률 변수는 어떤 사건이 일어날 비율(Historical Rate)이 알려진 상황에서 특정 시간 동안에 그 사건이 일어날 회수를 계산하는 데 사용한다.
평균과 분산에 대한 유도는 이산확률 분포 #2의 포아송분포 유도 를 참고하면 된다.
시행 회수(n)이 클 때 이항 확률을 계산하는 것은 매우 어렵다. n이 매우 크고 p가 작아서 람다(발생 비율, np)가 적당할 때 포아송 확률 변수를 이항 확률을 근사할 때 사용할 수 있다.
적당한(Moderate) 이란 것은 사람들 마다 다를 수 있는데, 일반적으로 받아들여지는 것은 아래와 같다.
만개의 비트로 이뤄진 문자열을 전송할 때, 각 비트는 독립적으로 잘못될 확률이 백만분의 일이다. 이 문자열이 제대로 전송될 확률은 얼마인가?
위의 계산을 이항 분포의 확률로 계산하려면 컴퓨터는 계산을 할 수 없을 것이다.
제곱근 구하기 (바빌로니아 방법) (1) | 2019.07.23 |
---|---|
루트 2 값 구하기 (1) | 2019.07.20 |
[CS109] 7 - Variance, Bernoulli, Binomials (0) | 2019.07.14 |
[CS109] 6 - Random Variables (0) | 2019.07.07 |
[CS109] 5 - Independence (0) | 2019.06.30 |