6. 샘플링분포 

(1)

6. 샘플링 분포

모집단(Population) 은 연구의 대상이 되는 모든 개체들의 집합이다.

개체들의 특성을 나타내는 것을 확률변수 X 라 한다면, 모집단의 분포는 X~N(^μ, ^σ²)으 로 나타낼 수 있다. 이때 ^μ와 σ²을 모수라고 한다. 모수는 모집단의 분포를 결정하는 상수로서 대체로 알려져 있지 않다. 모집단으로부터 모수를 연구하기 위하여 소수의 개 체들을 추출하는 과정을 샘플링(sampling)이라 한다. 이때 추출된 소수의 개체들은 모 집단을 연구하는데 사용되는 중요한 자료이므로 모집단을 잘 나타낼 수 있도록 해야 하 며, 독립적이어야 한다. 이렇게 추출된 소수의 개체들의 집합을 표본(sample)이라고 한 다. 표본 X₁,X₂,...,X_n 은 서로 독립적이면서 모집단의 분포와 동일한 분포를 갖게 된다. 이러한 표본의 특성을 기호로 나타내면 Xi ~ iid N(^μ, ^σ²) 이며 첫 번째 i 는 독립성 (independent)을 두 번째 i는 동일한(identical) 분포(distribution)를 나타낸다.

통계량(Statistic)은 표본 데이터 X1,X₂,...,X_n의 함수이며 확률변수이다. 통계량의 예로서 대표적인 것이 표본평균과 표본분산이다.

표본평균(sample mean) X= _i

∑

ⁿ

= 1X_i n

표본분산(sample variance) S²= _i

∑

_{= 1}ⁿ ⁽^Xi-X)² n-1

X와 S² 의 값은 표본 데이터의 구성에 따라 값이 변하므로 표본분산은 확률변수이다.

1. 표본평균의 분포

X^는 X₁,X₂,...,X_n 의 선형함수이므로 정규분포의 특성에 따라 정규분포를 따른다.

(1) 평균과 분산 E(X) = 

V(X_{) = }^_^