이항분포의 평균과 분산

확률변수 K의 확률분포함수가 f_{K}(k)=\binom{n}{k}p^{k}q^{n-k} 로 주어지는 경우 평균과 분산을 구해본다. 평균을 E[K] = \bar{K}라 하면 \bar{K}는 다음과 같다. \bar{K} = \sum_{k=0}^{n}kf_{K}(k). 여기서는 미분을 이용해 이 값을 구해보도록 한다. (x+q)^{n} = \sum_{k=0}^{n}\binom{n}{k}x^{k}q^{n-k} 의 양변을 x에 대해 미분하고 x를 곱하면 \begin{align}nx(x+q)^{n-1} = \sum_{k=0}^{n}k\binom{n}{k}x^{k}q^{n-k} \tag{1} \end{align}이다. 여기서 x = p를 대입하면 p+q = 1이고 (1)의 우변은 \bar{K}이므로 \bar{K} = np이다. 한편 분산은 다음과 관계를 만족함이 알려져 있다. \sigma_{K}^{2} = E[K^{2}]-\bar{K}^{2}.여기서 \bar{K}는 이미 구했으므로 E[K^{2}]를 구하도록 한다. E[K^{2}] = \sum_{k=0}^{n}k^{2}f_{K}(k). 이고 이를 찾기 위해 (1)의 양변을 x에 대해 한 번 더 미분하고 다시 x를 곱하면 다음과 같다. nx(x+q)^{n-1} + n(n-1)x^{2}(x+q)^{n-2} = \sum_{k=0}^{n}k^{2}\binom{n}{k}x^{k}q^{n-k}. 이제 x = p를 대입하면 p+q = 1이므로 이를 정리하면 다음과 같다. E[K^{2}] = \sum_{k=0}^{n}k^{2}\binom{n}{k}p^{k}q^{n-k} = np+n^{2}p^{2}-np^{2}. 따라서 분산은 다음과 같다. \sigma_{K}^{2} = E[K^{2}]-\bar{K}^{2} = (np+n^{2}p^{2}-np^{2})-(np)^{2} = np(1-p) = npq.