고등수학 개념/확률과 통계

[확률과 통계]모집단, 표본추출, 모평균 심화개념

본수학 2024. 6. 28. 08:51
반응형
반응형

 

 

 

모집단, 표본추출, 모평균

안녕하세요. 본수학 저자입니다.

오늘은 모집단과 표본에 대해 알아보도록 하겠습니다.

통계추정의 가장 기본적인 개념으로 크게 어렵지는 않은 내용이나 꼭 외워두시기를 바라겠습니다.

목차

1. 모집단과 표본

1.1 전수조사, 표본조사란?

확률을 구하기 위해 조사를 실행합니다.

전수조사와 표본조사

전수조사란 대상 전체를 빠짐없이 조사하는 것이다. 표본조사란 전체의 대상에서 일부를 조사하는 것이다.

드라마에서 공장에 생산된 제품이 이상이 있을 경우 관계자가 말합니다. "죄송합니다. 전수조사해서 차질없이 진행하겠습니다." 여기서도 알 수 있듯이 전수조사란 모두 빠짐없이 조사하는 것입니다. 예를 들어 어느 공장에서 하루에 만 개의 물건이 생산되는데 불량품이 있나 없나를 확인하기 위해 전수조사하면 만 개 모두 보는 것을 뜻합니다. 하지만 표본조사란 일부만을 조사하는 것입니다. 예를 들어 100개를 조사했을 때 1개의 불량품이 나왔으면 비례식을 이용하여 만개일 때 100개 정도의 불량품이 나온다는 것을 알 수 있습니다.

1.2 모집단, 표본이란?

모집단과 표본

표본조사에서 조사의 전체 대상을 모집단, 모집단에서 일부 추려낸 요소의 전체를 표본이라 한다. 모집단, 표본에 보함되는 요소의 개수를 각각 모집단의 크기, 표본의 크기라 한다.

위의 공장에 대한 예시를 보겠습니다. 하루에 만 개의 물건이 생상되면 모집단은 만 개의 물건이 되겠죠. 그리고 표본조사를 위해 100개를 추려내었기 때문에 표본은 100개의 물건이 됩니다. 따라서 모집단의 크기는 만 개, 표본의 크기는 100개인 것을 알 수 있습니다.

 

2. 추출

2.1 무작위 추출이란?

무작위란 영어로 Random을 뜻합니다.

무작위 추출과 무작위 표본

표본을 뽑는 것을 추출이라 한다. 추출조사에서는 확률적으로 치우치지 않도록 추출해야 한다. 그러기 위해서는 난수표나 컴퓨터로 생성된 난수를 이용한다. 이러한 추출법을 무작위추출이라 하고 무작위추출에서 추출한 표본을 무작위표본이라 한다.

자 앞서 모집단에서 일부만 추려내는 것을 표본이라 했습니다. 그런데 이 표본을 뽑는 것도 되게 중요합니다. 우리는 이것을 무의식적으로 알고 있어요! 바로 로또라는 것이죠. 로또는 45개중에 6개를 뽑아서 맞춰야 합니다. 그런데 6개를 뽑을 때 1, 2, 3, 4, 5, 6 이렇게 연속으로 뽑는 사람이 있을까요? 있기는 하지만 매우 드뭅니다. 모두 듬성듬성으로 뽑는 것을 선호하죠. 실제 이렇게 뽑는 것보다 무작위로 뽑을 때 당첨될 확률이 올라가죠. 이렇게 확률적으로 치우치지 않고 듬성듬성하게 골고루 뽑는 것을 무작위추출이라고 합니다.

 

2.2 복원추출과 비복원추출이란?

추출하는 방법도 종류가 있습니다..

복원추출과 비복원추출

한 번 뽑은 것을 원래 돌려놓고 뽑는 것을 복원추출, 돌려놓지 않고 뽑는 것을 비복원추출이라 한다.

복원추출과 비복원추출은 그렇게 어렵지 않습니다. 뽑은 표본을 다시 모집단에 넣냐 안 넣냐에 따라 바뀌는 추출방법입니다.

3. 모집단분포

3.1 모집단분포란?

모집단도 전체집합입니다.

모집단 분포

모집단에 대한 상대도수분포를 모집단분포라 한다. 모집단의 기댓값, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라 한다.

당연히 모집단에 대해 어느 확률변수가 있을 때 이 확률변수의 확률분포, 기댓값, 분산, 표준편차가 있겠죠? 예를들어 대한민국 국민이 모집단이라고 합시다. 확률변수는 대한민국 인구수라고 할게요. 그러면 다음과 같은 표를 알 수 있습니다.
출처 https://lifeandwork.tistory.com/47
위에 그래프가 모집단분포가 되겠죠. 여기서 기댓값, 분산, 표준편차를 구하면 각각 모평균, 모분산, 모표준편차라 합니다.

오늘의 학습 정리

모집단과 표본 정리

【모집단과표본】

표본조사에서 조사의 전체 대상을 모집단, 모집단에서 일부 추려낸 요소의 전체를 표본이라 한다.

 

【추출】

모집단에서 표본을 채취하는 행위를 추출이라 한다.

 

【모집단분포】

모집단에 대한 상대도수분포를 모집단분포라 한다. 모집단의 기댓값, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라 한다.

 

오늘은 여러 개념이 나왔지만 예시를 통해 생각해보면 크게 어려운 개념이 아닙니다. 통계추정의 기본적인 개념이므로 꼭 외워두시기를 바라겠습니다.

 

 

 

 

 

 

반응형