안녕하세요. 본수학 저자입니다.
오늘은 확률변수의 변환과 표준화에 대해 알아보도록 하겠습니다.
지난신간에 배운 확률변수는 일종의 함수라고 배웠습니다.
우리는 \(f(x)=x\)라고 했을 때 \(f(2x)=2f(x)\)가 되는 것은 쉽게 알 수 있습니다.
이처럼 확률변수도 함수의 특징인 실수배와 실수를 더했을 때 어떤 변화가 있는지 알아보도록 하겠습니다.
그리고 표준화란 무엇인지에 대해 알아보도록 하겠습니다.
목차
1. 확률변수의 변환
1.1 확률변수에 실수를 곱하면?
확률변수의 변환에 따라 기댓값, 분산, 표준편차가 어떻게 변하는지 알아보겠습니다.
【증명】
\(P(X=x_{1})=p_{1}, P(X=x_{1})=p_{1}, \cdots, P(X=x_{n})=p_{n}\)이라 할 때 다음을 알 수 있다.
\( \begin{align}
\displaystyle E(Y) & = \sum\limits_{k=1}^{n}y_{k}p_{k} \\
& =\sum\limits_{k=1}^{n}(ax_{k}+b)p_{k} \\
& =a\sum\limits_{k=1}^{n}ax_{k}p_{k}+b\sum\limits_{k=1}^{n}p_{k}\\
& = aE(X)+b
\end{align} \)
분산과 표준편차에 대해서도 증명하여라.
2. 확률변수의 표준화
2.1 확률변수의 표준화란?
확률변수의 표준화란 무엇인지 알아보기 전에 위에서 배운 개념을 바로 적용시킨 문제를 보도록 하겠습니다.확률변수 \(X\)에 대해 기댓값 \(E(X)=m\), 표준편차 \(\sigma(X)=\sigma\)라 하자. 확률변수 \(Z=\cfrac{X-m}{\sigma}\)에 대해 \(E(Z)=0, \sigma(Z)=1\)인 것을 보여라.
- \(Z=\cfrac{X-m}{\sigma}=\cfrac{1}{\sigma}X-\cfrac{m}{\sigma}\) 따라서 다음을 알 수 있다. \(E(Z)=E\left(\cfrac{1}{\sigma}X-\cfrac{m}{\sigma}\right)=\cfrac{1}{\sigma}E(X)-\cfrac{m}{\sigma}=\cfrac{1}{\sigma}\cdot m-\cfrac{m}{\sigma}=0\) \(\sigma(Z)=\sigma\left(\cfrac{1}{\sigma}X-\cfrac{m}{\sigma}\right)=\left|\cfrac{1}{\sigma}\right|\sigma(X)=\cfrac{1}{\sigma}\cdot \sigma =1\)
확률변수 \(X\)에 대해 기댓값 \(E(X)=m\), 표준편차 \(\sigma(X)=\sigma\)라 하자. 이 때 변환 \(Z=\cfrac{X-m}{\sigma}\)를 확률변수 \(X\)의 표준화라 한다.
3. 연습문제
3.1 확률의 변환 연습문제
예제를 통해 오늘 학습내용을 복습하도록 하겠습니다.
확률변수 \(X\)의 기댓값이 600, 분산이 2500이다. \(Y=aX+b (a>0)\)으로 정해지는 확률변수 \(Y\)의 기댓값이 80, 표준편차가 10일 때 상수 \(a, b\)의 값을 구하여라.
- \(E(Y)=aE(X)+b\)로부터 \(80=a\cdot 600+b\)
- \(V(Y)=a^{2}V(X)\)로부터 \(10^{2}=a^{2}\cdot 2500\)
- \(a>0\)이므로 \(a=\cfrac{1}{5}, b=-40\)
한 번하는데 100원을 내고 주사위를 한 번 던져 나온 눈이 \(X\)일 때 \(mX+n\)를 받는 게임이 있다고 하자. 단 \(m, n\)는 자연수다. 게임을 한 번 할 때 얻는 수익을 \(Y\)라 하고 \(E(Y)=0\)일 때 \(V(Y)\)의 최솟값과 그 때의 \(m, n\)의 값을 구하여라.
- \(E(X)=1 \cdot \cfrac{1}{6}+2\cdot{1}{6}+\cdots+6\cdot \cfrac{1}{6}=\cfrac{7}{2}\)
- \(Y=mX+n-100\)로부터 \(E(Y)=mE(X)+n-100=\cfrac{7}{2}m+n-100=0\)
- \(n=100-\cfrac{7}{2}m>0\)로부터 \(0 < m < \cfrac{200}{7}\)
- \(E(X^{2})=1^{2} \cdot \cfrac{1}{6}+2^{2}\cdot{1}{6}+\cdots+6^{2}\cdot \cfrac{1}{6}=\cfrac{91}{6}\)
- \(V(X)=E(X^{2})-E(X)^{2}=\cfrac{91}{6}-\left(\cfrac{7}{2}\right)^{2}=\cfrac{35}{12}\)
- 따라서 \(V(Y)=m^{2}V(X)=\cfrac{35}{12}m^{2}\)
- \(\therefore m=2, n=93\)일 때 \(V(Y)\)의 최솟값 \(\cfrac{35}{3}\)
오늘의 학습 정리
【확률의 변환】
확률변수 \(X\)와 임의의 실수 \(a, b\)에 대해 확률변수 \(Y\)를 \(Y=aX+b\)라 하자.
기댓값 \(E(Y)=E(aX+b)=aE(X)+b\)
분산 \(V(Y)=V(aX+b)=a^{2}V(X)\)
표준편차 \(\sigma(Y)=\sigma(aX+b)=|a|\sigma(X)\)
【확률변수의 표준화】
확률변수 \(X\)에 대해 기댓값 \(E(X)=m\), 표준편차 \(\sigma(X)=\sigma\)라 하자.
이 때 변환 \(Z=\cfrac{X-m}{\sigma}\)를 확률변수 \(X\)의 표준화라 한다.
표준화는 뒤이어 나오는 개념에 중요한 기초가 되니 꼭 알아 두시기를 바라겠습니다.
확률변수 \(X\)와 임의의 실수 \(a, b\)에 대해 확률변수 \(Y\)를 \(Y=aX+b\)라 하자. 이 때 다음을 알 수 있다.
기댓값 \(E(Y)=E(aX+b)=aE(X)+b\)
분산 \(V(Y)=V(aX+b)=a^{2}V(X)\)
표준편차 \(\sigma(Y)=\sigma(aX+b)=|a|\sigma(X)\)