1. 베르누이 분포(Bernoulli Distribution)
- 오직 두 가지의 결과만을 갖는 시행을 베르누이 시행이라고 한다.
- 베르누이 시행에서 각각의 결과에 대한 확률변수 $X$를 $1$과 $0$으로 대치한다.
ex. 어떠한 일이 성공하면 $X=1$이고 실패하면 $X=0$, 동전을 던졌을 때 앞면일 경우 $X=1$이고 뒷면일 경우 $X=1$ .... - 이때, $X$를 베르누이 확률변수라 하고, $X$의 분포를 베르누이 분포라고 한다.
- $P(X=1)=p$라고 하면 베르누이 분포의 확률밀도함수는 다음과 같다.
$P(X=x)= \begin{cases} p, & \mbox{if }x\mbox{ is 1} \\ 1-p, & \mbox{if }x\mbox{ is 0} \end{cases}$
- 기댓값과 분산은 다음과 같다.
$E(X)=1 \times p + 0 \times (1-p)=p$
$Var(X)=E\left[(X-p)^2\right] = (0-p)^2 \times (1-p) + (1-p)^2 \times p=p(1-p)$
2. 이항 분포(Binomial Distribution)
- 성공확률이 $p$인 $n$회의 독립 시행을 하는 경우, 각각의 시행은 베르누이 시행이다.
- $n$회의 베르누이 시행 각각을 확률변수 $X_1 , \cdots , X_n$이라 할 때, $X=\sum\limits_{i=1}^n X_i$를 이항 확률변수라고 하고, $X$의 분포를 이항 분포라고 한다.
- 이항 분포의 확률밀도함수는 다음과 같다.
$P(X=x)=\begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p)^{n-x}$ - 각 베르누이 시행은 서로 독립이므로, 이항 확률변수의 기댓값과 분산은 다음과 같다.
$E(X)=E\left ( \sum\limits_{i=1}^n X_i \right ) = \sum\limits_{i=1}^n E(X_i) = np$
$Var(X)=Var\left (\sum\limits_{i=1}^n X_i \right ) =\sum\limits_{i=1}^n Var(X_i) = np(1-p)$
3. 초기하 분포(Hypergeometric Distribution)
- 크기가 $N$개인 유한모집단에서 공통된 특별한 속성을 갖는 것들이 $k$개 있다고 하자. 이 모집단에서 $n$회 비복원 임의추출할 때, 특별한 속성을 갖는 것들의 개수를 확률변수 $X$라 하면 $X$는 초기하 분포를 따른다.
- 초기하 확률변수 $X$의 확률분포는 다음과 같다.
$P(X=x)= \cfrac{ \ _{k} \mathrm{C}_{x} \times_{N-k} \mathrm{C}_{n-x}}{\ _{N}\mathrm{C}_{n}}$
(이는 크기가 $N$인 모집단에서 $n$개를 비복원 임의추출할 때, $k$개로부터 $x$개를 뽑고, 나머지 $N-k$개로부터 $n-x$개를 뽑을 확률을 뜻한다.) - 기댓값과 분산은 다음과 같다.
$E(X)= \cfrac{nk}{N}$
$Var(X)= \cfrac{N-n}{N-1} \cdot \cfrac{nk}{N} \cdot \cfrac{N-k}{N}$
4. 포아송 분포(Poisson Distribution)
- 단위 시간 및 단위 영역에서 확률변수가 이항분포를 따르며, 매우 많은 횟수의 시행이 이루어질 때 적용되는 분포
ex. 주어진 시간 내에 전화가 걸려오는 횟수, 어떤 지역에서 하루의 교통사고 사망자 수 ... → 평균이 $\mu$로 정해져 있음 - $np=\mu$라는 조건에서 시행횟수 $n$이 한없이 커지면 발생확률 $p$는 극히 작게 되는 경우의 확률분포
- 포아송 분포의 확률밀도함수는 다음과 같다.
$P(X=x) = f(x;\mu)=\cfrac{{e}^{-\mu} {\mu}^{x}}{x!}$ - 기댓값과 분산은 다음과 같다.
$E(X)=Var(X)=\mu$ - 확률변수 $X$에 대하여 $X\sim B(n, p)$일 때, $n$이 충분히 크고 $p$가 충분히 작다면 확률변수 $X$는 포아송 분포로 근사할 수 있다.