고등수학 개념/확률과 통계

[확률과 통계]정규분포, 정규분포의 표준화 심화개념

본수학 2024. 6. 27. 09:56
반응형
반응형

 

 

정규분포, 정규분포의 표준화

안녕하세요. 본수학 저자입니다.

오늘은 정규분포에 대해 알아보도록 하겠습니다.

확률분포는 여러가지있지만 대중적으로 사용되는 확률분포는 정규분포입니다.

정규분포에는 어떠한 특징이 있는지 알아보도록 하겠습니다.

목차

1. 정규분포

1.1 정규분포란?

정규분포는 보편적인 확률분포를 뜻합니다.

정규분포의 정의

연속확률변수 \(X\)의 확률밀도함수 \(f(x)\)가 \(f(x)=\cfrac{1}{\sqrt{2\pi}\sigma}e^{-\cfrac{(x-m)^{2}}{2\sigma^{2}}}\) \((\sigma>0)\)일 때 \(X\)는 정규분포 \(N(m,\sigma^{2})\)에 따른다고 하고 \(y=f(x)\)의 그래프를 정규분포곡선이라 한다.

학교에서 시험을 봤다고 생각해봅시다. 문제들이 모두 난이도가 고르게 되어 있을 때 공부잘하는 학생은 시험점수가 높고 그렇지 못한 학생은 시험점수가 낮겠죠? 이것을 분포로 나타내었을 때 평균에서 가장 많은 학생들이 모여있을 겁니다. 이처럼 일반적인 생활에서 확률변수에 대해 평균을 내면 모집단의 원소들이 평균에 많이 몰리게 되어 있습니다. 위대한 수학자 가우스는 이런 분포를 수식으로 나타내기 위해 위와 같은 확률분포, 즉 정규분포를 고안하게 되었습니다. 하지만 확률분포는 수없이 많겠죠? 이항분포, 베르누이분포, 포아송분포, 기하분포 등등 확률분포는 얼마든지 만들 수 있습니다. 하지만 앞서 말한 것 처럼 실생활처럼 평균에 몰려있고 평균으로부터 떨어지면 분포가 작아지는 확률분포는 보편적으로 정규분포를 따른다고 가정합니다.

2. 정규분포곡선의 성질

2.1 정규분포곡선

앞서 정규분포에 대해 알아봤는데 이 분포를 그래프로 나타내었을 때 어떤 특징이 있는지 살펴보도록 하겠습니다!

정규분포의 성질

확률변수 \(X\)의 확률밀도함수를 \(f(x)\)라 할 때 다음을 알 수 있다.

 

(1) 확률밀도함수는 항상 \(f(x)\geq0\)이고 확률밀도함수와 \(x\)축이 이루는 면적은 1이다. 즉 다음이 성립한다.

 

\(\displaystyle{\int_{-\infty}^{\infty}\cfrac{1}{\sqrt{2\pi}\sigma}e^{-\cfrac{(x-m)^{2}}{2\sigma^{2}}}dx=1}\)

 

(2) 직선 \(x=m\) (평균)에 관해 대칭이며 \(x=m\)에서 최댓값을 갖는다.

 

(3) \(x=m\)로부터 멀어질수록 0에 가까워진다(0이 되지는 않는다). 즉 \(x\)축이 점근선이다.

 

(4) \(\sigma\)가 커질수록 그래프 개형이 전반적으로 평평해지며 \(\sigma\)가 작을수록 \(x=m\)주변에 볼록 튀어나온다.

 

정규분포를 나타내는 \(N\)은 정규분포의 영어인 Normal distribution의 앞글자에서 따왔습니다.
\(\sigma\)가 커질수록 평균으로부터의 멀리 분포해있다는 것을 뜻하므로 살짝 짓눌린 형태를 하고 있습니다.

 

3. 표준정규분포

3.1 표준정규분포란?

확률변수의 표준화처럼 정규분포도 평균0, 표준편차1로 변화시켜 얻은 정규분포를 표준정규분포라 합니다.

표준정규분포

확률변수 \(X\)가 정규분포\(N(m,\sigma^{2})\)를 따를 때 \(Z=\cfrac{X-m}{\sigma}\)라 하면 확률변수 \(Z\)는 표준정규분포 \(N(0, 1)\)를 따른다. (평균0, 표준편차1이 된다.)

【증명】

\( \begin{align}
\displaystyle E(Z) & = E\left(\cfrac{X}{\sigma}-\cfrac{m}{\sigma}\right) \\
& = \cfrac{1}{\sigma}E(X)-\cfrac{m}{\sigma} \\
& = \frac{1}{\sigma}\cdot m -\cfrac{m}{\sigma}\\
& = 0
\end{align} \)

\( \begin{align}
\displaystyle V(Z) & = V\left(\cfrac{X}{\sigma}-\cfrac{m}{\sigma}\right) \\
& = \cfrac{1}{\sigma^{2}}V(X)\\
& = \frac{1}{\sigma^{2}}\cdot \sigma^{2}\\
& = 1
\end{align} \)

표준화

정규분포를 표준정규분포로 변환하는 것을 표준화라고 한다.\(N0,1)\)를 따르는 확률변수 \(Z\)의 확률밀도함수는 \(f(z)=\cfrac{1}{\sqrt{2\pi}\cdot1}e^{-\cfrac{(x-0)^{2}}{2\cdot 1^{2}}}=\cfrac{1}{\sqrt{2\pi}}e^{-\cfrac{x^{2}}{2}}\)가 된다.\(N(0,1)\)에 대해 확률 \(P(0\leq Z \leq u)=\displaystyle{\int_{0}^{u}f(z)dz}\)를 \(p(u)\)라 나타내자.

정규분포표

\(N(0,1)\)에 대해 확률 \(P(0\leq Z \leq u)=\displaystyle{\int_{0}^{u}f(z)dz}\)를 \(p(u)\)라 나타내자. 여러 \(u\)의 값에 대해 \(p(u)\)의 근사값을 표로 나타낸 것을 정규분포표라 한다.

 

 

 

예제1

확률변수 \(X\)가 정규분포 \(N(10,4^{2})\)에 다를 때 다음의 확률을 구하여라.

 

(1) \(P(12 \leq X \leq 18)\)

(2)\(P(X\leq6)\)

【해설】
        \(Z=\cfrac{X-10}{4}\)라 하면 \(Z\)는 표준정규분포 \(N(0,1)\)을 따른다.
      (1)

\( \begin{align}
\displaystyle P(12\leq X\leq 18) & = P\left(\cfrac{12-10}{4}\leq Z \leq \cfrac{18-10}{4}\right) \\
& = P(0.5\leq Z \leq2) \\
& = P(0\leq Z \leq 2)-P(0 \leq Z \leq 0.5)\\
& = 0.4772-0.1915\\&
= 0.2857
\end{align} \)

      (2)

\( \begin{align}
\displaystyle P( X\leq 6) & = P\left(Z \leq \cfrac{6-10}{4}\right) \\
& = P(Z\leq-1) \\
& = P(Z \geq 0)-P(0 \leq Z \leq 1)\\
& = 0.5-0.3413\\&
= 0.2857
\end{align} \)



오늘의 학습 정리

정규분포 정리

【정규분포】

연속확률변수 \(X\)의 확률밀도함수 \(f(x)\)가 \(f(x)=\cfrac{1}{\sqrt{2\pi}\sigma}e^{-\cfrac{(x-m)^{2}}{2\sigma^{2}}}\) \((\sigma>0)\)일 때 \(X\)는 정규분포 \(N(m,\sigma^{2})\)에 따른다고 하고 \(y=f(x)\)의 그래프를 정규분포곡선이라 한다.

 

【표준정규분포】

확률변수 \(X\)가 정규분포\(N(m,\sigma^{2})\)를 따를 때 \(Z=\cfrac{X-m}{\sigma}\)라 하면 확률변수 \(Z\)는 표준정규분포 \(N(0, 1)\)를 따른다.

 

정규분포의 확률밀도함수는 참 특이한 함수입니다. 통계뿐만아니라 다른 해석학분야에서도 등장하죠. 이처럼 관련없어 보이지만 서로 연결되어 있는 것이 수학의 매력이 아닌가 싶습니다.

 

 

 

반응형