👩‍💻_Data Science/통계

[통계] 복원 추출 / 비복원 추출

쩡지 2022. 3. 22. 16:41

모집단에서 추출한 표본을 이용해 모집단의 정보를 추측하는 것을 추측 통계라고 한다.

다양한 표본 추출 방법이 있으나, 그 중 "단순임의추출법(simple random sampling)"을 많이 사용한다.

*단순임의추출법 -> 모집단의 모든 원소가 표본으로 뽑힐 확률이 같도록 표본을 추출하는 방법

 

(1) 복원 추출 (Sampling with replacement)

추출 된 표본을 다시 모집단에 되돌려놓음으로써 다시 추출될 수 있게 하는 샘플링 방법

같은 표본이 중복으로 추출될 수 있다.

 

(2) 비복원 추출 (Sampling without replacement)

표본 추출 시, 기본적으로 많이 사용하는 방법

추출된 표본을 모집단에 다시 돌려놓지 않고 다른 표본을 추출하는 방법 

따라서, 한번 추출 된 표본은 다시 추출되지 않는다.

 

 

간단한 예시로 이해해보자!

 

어떤 주머니에 1~10까지 숫자가 적힌 공이 하나씩 담겨있다고 가정하자.

여기서, 크기가 3인 표본 2개를 추출한다.

 

(1) 복원 추출

  • 표본 1 :  1개를 뽑고 돌려 놓는 방법으로 연달아 3개를 뽑는다.
    ex) 1번 공 꺼냄 -> 다시 넣기 -> 2번 공 꺼냄 -> 다시 넣기 -> 3번 공 꺼냄 -> 다시 넣기
  • 표본 2 :  표본 1과 동일한 방법으로 추출

=> 하나의 표본 내 원소(각각의 공)들은 중복될 수 없다.

=> 표본의 원소를 뽑는 사건들은 '독립'이다.

 

(2) 비복원 추출

  • 표본 1 : 1개씩 뽑으면서 공은 돌려 놓지 않는다. 또는 한번에 3개를 뽑는다.
  • 표본 2 : 표본 1에서 뽑힌 공들을 돌려놓고 (주머니 공 10개) 1개를 뽑고 돌려 놓지 않은 채 연달아 3개를 뽑는다.

=> 하나의 표본 내 원소들은 중복 될 수 있다.

=> 표본의 원소를 뽑는 사건들은 '종속'이다.

 

 

#참고 자료

https://hsm-edu.tistory.com/980

 

복원추출과 비복원추출에 대한 오해

복원추출과 비복원추출을 잘못 이해하는 경우가 있어서 그 내용을 다뤄보려고 합니다. 제가 그랬었거든요. 추출 방법에는 복원추출과 비복원추출이 있습니다. 아마 아래와 같은 정의를 보셨을

hsm-edu.tistory.com