6. 샘플링 분포
모집단(Population) 은 연구의 대상이 되는 모든 개체들의 집합이다.
개체들의 특성을 나타내는 것을 확률변수 X 라 한다면, 모집단의 분포는 X~N(μ, σ2)으 로 나타낼 수 있다. 이때 μ와 σ2을 모수라고 한다. 모수는 모집단의 분포를 결정하는 상수로서 대체로 알려져 있지 않다. 모집단으로부터 모수를 연구하기 위하여 소수의 개 체들을 추출하는 과정을 샘플링(sampling)이라 한다. 이때 추출된 소수의 개체들은 모 집단을 연구하는데 사용되는 중요한 자료이므로 모집단을 잘 나타낼 수 있도록 해야 하 며, 독립적이어야 한다. 이렇게 추출된 소수의 개체들의 집합을 표본(sample)이라고 한 다. 표본 X1,X2,...,Xn 은 서로 독립적이면서 모집단의 분포와 동일한 분포를 갖게 된다. 이러한 표본의 특성을 기호로 나타내면 Xi ~ iid N(μ, σ2) 이며 첫 번째 i 는 독립성 (independent)을 두 번째 i는 동일한(identical) 분포(distribution)를 나타낸다.
통계량(Statistic)은 표본 데이터 X1,X2,...,Xn의 함수이며 확률변수이다. 통계량의 예로서 대표적인 것이 표본평균과 표본분산이다.
표본평균(sample mean) X= i
∑
n= 1Xi n
표본분산(sample variance) S2= i
∑
= 1n (Xi-X)2 n-1X와 S2 의 값은 표본 데이터의 구성에 따라 값이 변하므로 표본분산은 확률변수이다.
1. 표본평균의 분포
X 는 X1,X2,...,Xn 의 선형함수이므로 정규분포의 특성에 따라 정규분포를 따른다.
(1) 평균과 분산 E(X) =
V(X) =