상세 컨텐츠

본문 제목

[CS109] 8 - Poisson Distribution

수학

by Simple Runner 2019. 7. 14. 23:33

본문

지금까지 배운 것을 요약해보면, 확률 변수(Random Variable)를 정의하고 확률 질량 함수(Probability Mass Function)를 구한 후 기대값(Expected Value)과 분산(Variance)을 계산하였다. 그리고 가장 기본이 되는 베르누이 시행과 이항분포에 대해서 배웠다. 이제 포아송 확률 분포에 대해 알아보자.

 

1. 이항분포의 극한 (Binomial in the Limit)

 

당신이 카카오 택시 기사라고 하자. 서울 강남에서 카카오택시의 콜 수가 분당 평균 5건일 때, 1분동안 2건의 콜을 받을 확률은 얼마일까?

 

X를 1분 동안 받을 콜 수라고 하면, 우리가 구하고자 하는 것은 다음과 같다.

 

 

위의 경우는 1분이 60초이므로 초당 콜이 오는지 안오는지로 생각해 볼 수 있다. 즉 콜이 오는 것을 성공 안오는 것을 실패라고 하면, 성공확률이 5/60인 베르누이 시행을 60번하는 이항 분포와 같다.

 

 

 

이것을 충분한가? 초가 아니라 밀리초(1000분의 1초) 단위로 생각해 볼 수도 있지 않는가?

 

 

이것을 일반화 하면 다음과 같다. (아래 수식에서 람다는 특정시간동안 평균적으로 발생할 사건 수)

 

 

이항분포 수식을 활용하여 정리를 잘하면 다음 수식을 얻을 수 있다. 자세한 내용은 이산확률 분포 #2의 포아송분포 유도 를 참고하기 바람.

 

 

2. 포아송 확률 변수 (Poisson Random Variable)

 

포아송 확률 변수는 어떤 사건이 일어날 비율(Historical Rate)이 알려진 상황에서 특정 시간 동안에 그 사건이 일어날 회수를 계산하는 데 사용한다.

 

 

 

 

 

평균과 분산에 대한 유도는 이산확률 분포 #2의 포아송분포 유도 를 참고하면 된다.

 

3. 이항분포 근사하기 (Approximating Binomial)

 

시행 회수(n)이 클 때 이항 확률을 계산하는 것은 매우 어렵다. n이 매우 크고 p가 작아서 람다(발생 비율, np)가 적당할 때 포아송 확률 변수를 이항 확률을 근사할 때 사용할 수 있다.

 

적당한(Moderate) 이란 것은 사람들 마다 다를 수 있는데, 일반적으로 받아들여지는 것은 아래와 같다.

 

 

Example

 

만개의 비트로 이뤄진 문자열을 전송할 때, 각 비트는 독립적으로 잘못될 확률이 백만분의 일이다. 이 문자열이 제대로 전송될 확률은 얼마인가?

 

 

 

 

위의 계산을 이항 분포의 확률로 계산하려면 컴퓨터는 계산을 할 수 없을 것이다.

 

'수학' 카테고리의 다른 글

제곱근 구하기 (바빌로니아 방법)  (1) 2019.07.23
루트 2 값 구하기  (1) 2019.07.20
[CS109] 7 - Variance, Bernoulli, Binomials  (0) 2019.07.14
[CS109] 6 - Random Variables  (0) 2019.07.07
[CS109] 5 - Independence  (0) 2019.06.30

관련글 더보기