안녕하세요. 본수학 저자입니다.
확률과 통계 마지칵 단원인 통계부분입니다.
통계의 기초가 되는 확률분포, 확률변수의 기댓값,분산,표준편차에 대해 알아보도록 하겠습니다.
통계단원은 어려운 문제가 출제되지 않으므로 개념정리만 확실히 하면 쉽게 문제를 해결 하실 수 있습니다.
목차
1. 확률변수
1.1 확률변수란?
확률변수 또한 함수입니다.
어떤 시행을 했을 때의 결과로부터 값이 정해지는 변수를 확률변수라 한다.
우리는 이미 자연스레 확률변수를 사용하고 있습니다.
로또에 당첨될 기댓값을 구하는 예시에서 확률변수는 무엇일까요?
2. 확률분포
2.1 확률분포란?
우리는 앞서 확률변수에 대해 알아봤습니다.
확률변수가 값을 취할 때 그 값을 취할 확률이 얼마인지 나타내는 것이 확률분포입니다.
로또를 예를 들면 1등부터 5등 그리고 꽝 당첨될 확률이 각각 분포되어 있는데 이것을 확률분포라 합니다.
그런데 키를 예로 들면 키는 1등, 5등, 꽝 같이 딱딱 나누어 떨어지지는 않잖아요?
물론 174cm, 159cm와 같이 일의 자리 숫자까지만 따지면 나누어떨어집니다만 정확히 따지면 이 세상에 똑같은 키를 가진 사람은 없다고 할 수 있습니다.
로또 처럼 결과값을 셀 수 있으면 이산확률분포라 하고 키처럼 결과값을 셀 수 없으면 연속확률분포라 합니다.
우선 이산확률분포에 대해 알아보도록 하겠습니다.
확률변수 \(X\)가 가질 수 있는 값 \(x_{k}\)와 \(x_{k}\)가 되는 확률 \(p_{k}\)의 대응관계를 확률분포라 한다. 이 때 다음을 만족한다. (1) \(p_{k}\geq 0 (k=1,2, \cdots, n\) (2) \(p_{1}+p_{2}+\cdots+p_{n}=1\)
3. 기댓값, 분산, 표준편차
3.1 확률변수의 기댓값, 분산, 표준편차
기댓값, 분산, 표준편차는 중학교때 배운적이 있으니 빠르게 정의로 넘어가도록 하겠습니다.
위와 같은 확률분포를 갖는 확률변수 \(X\)에 대해 다음과 같이 정의한다.
기댓값(평균) \(E(X)=x_{1}p_{1}+x_{2}p_{2}+\cdots+x_{n}p_{n}=\sum\limits_{k=1}^{n}x_{k}p_{k}\)
\(E(X)=m\)이라 하면 \(X-m\)를 \(X\)의 평균으로의 편차라 한다.
분산 \(V(X)=E((X-m)^{2})\)
표준편차 \(\sigma(X)=\sqrt{V(X)}\)
【증명】
\( \begin{align}
\displaystyle V(X) & = E((X-m)^{2}) \\
& = \sum\limits_{k=1}^{n}(x_{k}-m)^{2}p_{k} \\
& = (x_{1}-m)^{2}p_{1}+(x_{2}-m)^{2}p_{2}+\cdots+(x_{n}-m)^{2}p_{n}\\
& = E(X^{2})-\left\{E(X)\right\}^{2}
\end{align} \)
오늘의 학습 정리
【확률변수】
어떤 시행을 했을 때의 결과로부터 값이 정해지는 변수
【확률분포】
확률변수 \(X\)가 가질 수 있는 값 \(x_{k}\)와 \(x_{k}\)가 되는 확률 \(p_{k}\)의 대응관계
【확률분포 기댓값, 분산, 표준편차】
기댓값(평균) \(E(X)=x_{1}p_{1}+x_{2}p_{2}+\cdots+x_{n}p_{n}=\sum\limits_{k=1}^{n}x_{k}p_{k}\)
\(E(X)=m\)이라 하면 \(X-m\)를 \(X\)의 평균으로의 편차라 한다.
분산 \(V(X)=E((X-m)^{2})\)
표준편차 \(\sigma(X)=\sqrt{V(X)}\)
통계 단원의 기초가 되는 용어와 정의에 대해 알아봤습니다. 통계는 AI시대에 필수적인 분야라 통계쪽에 대학을 진학하고 싶은 학생들은 기초를 탄탄히 해두시면 좋을 것 같습니다.
분산 \(V(X)\)는 다음과 같이 나타낼 수 있다. \(V(X)=E(X^{2})-\left\{E(X)\right\}^{2}\)