제 3 장 모집단과 표본, 관측치의 정의
충북대학교 농업생명환경대학 지역건설공학과
실 험 통 계 학
맹 승 진
3.1 모집단
모 집 단 표본 집단
모수 통계량
평균 : μ 분산 : σ2 표준편차 : σ
모비율 : ρ 추 론
표본추출
평균 : χ 분산 : s2 표준편차 : s 표본비율 : ρ
3.1-1 모집단과 표본의 관계
3.1 모집단
3.1-2 모집단의 정의
• 어떤 하나 또는 그 이상의 공통적 특성치를 갖는 사물로부터 얻을 수 있는 관 측치의 전체를 말함.
• 모집단은 일반적으로 매우 크고, 실제로 무한히 클 수도 있음.
• 모집단 전체를 조사해 얻은 통계자료를 모집단 자료라고 함.
3.1 모집단
3.1-3 모집단의 종류
유한모집단
(Finite population)
무한모집단
(Infinite population) 모집단을 구성하는 전체 관측치의 수가
제한되어 있으므로 모집단의 전체를 쉽 게 파악할 수 있는 모집단
모집단을 구성하는 전체 관측치의 수가 무한하거나 그 수가 제한적이라 하더라도 실제적으로 전체 관측치의 조사가 불가능한 모집단
3.1 모집단
3.1-4 특성분석
• 전체 모집단을 측정하기 위한 어려움
① 많은 시간과 공간이 필요
② 막대한 경비가 소요
③ 조사 측정 자체가 파괴적인 행위
모집단 일부(표본)만 조사한 결과로서도 모집단에 관한 비교적 정확한 결과 를 얻을 수 있음.
3.2 표본
3.2-1 표본의 정의
• 표본이란 이론적으로 밖에 설명할 수 없는 모집단의 일부로서 모집단으로 부터 실제로 얻어낸 구체적인 자료들을 말함.
3.2 표본
3.2-2 표본의 종류
• 임의표본(Random sample 또는 Unbiased sample)
- 모집단을 구성하는 모든 관측치가 각각 독립적이고, 동일한 기회로 추출될 수 있는 상태하에서 추출된 표본.
• 편의표본(Biased sample)
- 몇 개의 관측치가 다른 것보다 더 많은 기회로 포함될 수 있는 상태에서 얻어진 표본.
3.3 표본추출 방법
3.3-1 표본추출 방법의 중요성
• 표본조사를 실시하는 경우, 모집단을 대표할 수 있는 표본을 선정하고 조사하여 얻은 통계량 값을 이용하여 모집단의 모수를 추정하거나 이에 대한 가설을 검정.
• 모집단 대신에 표본을 사용함으로써 표본 오류가 발생.
• 따라서, 이러한 표본오류를 줄이기 위해서는 모집단을 가장 정확하게 대표할 수 있는 표본 추출하는 것이 무엇보다도 중요.
3.3-2 표본추출 방법의 종류
• 단순임의추출법
- N개의 측정치로 되어 있는 모집단 n개의 관측치를 임의로 추출하여 표본 으로 사용하는 방법. 이 방법에서는 모집단을 구성하는 N개의 각 개체는 모두 독립적이고 표본으로 선택될 확률을 동등한 기회로 추출되어야 함.
• 모집단에 대한 사전지식을 요하지 않는다는 장점이 있음.
• 모집단에 대한 지식을 활용할 수 없다는 단점이 있음.
3.3 표본추출 방법
3.3-2 표본추출 방법의 종류
• 군락추출법
- 모집단 크기가 클 때는 모집단을 몇 개의 부분집단인 군락으로 나누어 그 중에서 몇 개의 표본군락을 임의로 선정한 후에 군락내의 전체
개체를 모두 조사하는 방법.
• 단순임의추출법이나 다단추출법에 비해서 경제적이라는 장점이 있음.
• 군집의 크기와 개수 사이의 최적을 찾는 것이 중요.
3.3 표본추출 방법
3.3-2 표본추출 방법의 종류
• 다단추출법
- 모집단을 몇 개의 부분집단인 군락으로 나누어 그 중에서 몇 개의
표본군락을 임의로 선발한 후에 표본군락 내에서 다시 단순임의 표본을 추출하여 표본으로 하는 방법.
• 시간, 노력을 절감하여 관리를 쉽게 할 수 있다는 장점이 있음.
• 조사비용을 동일한 비용으로 더 많은 군집에 대한 정보를 얻을 수 있음.
3.3 표본추출 방법
3.3-2 표본추출 방법의 종류
• 층별임의표본추출법
- 모집단이 이질을 내포하고 있을 경우에는 모집단을 그 성격에 따라 동질적인 몇 개의 부분집단 또는 계층으로 나눈 후 각 계층에서 임의로 표본단위를 추출하는 방법
• 계층을 분할할 때에 계층들 간의 변이는 크게 하는 반면 계층 내의 변이는 최소화 하여야 함.
3.3 표본추출 방법
3.4-1 도수분포표
3.4 관측치 정리
• 수집된 자료를 제한된 수의 범주나 구간으로 나누고, 각 구간에 속한 자료의 빈도를 기록한 표.
- 구간 : 계급(Class)
- 각 계급의 자료수 : 계급의 도수(Frequency)
- 계급, 도수, 상대도수, 누적도수, 누적상대도수로 구성.
- 관측치가 많아 체계적으로 정리하지 않으면 정보습득이 어려운 경우에 유 용함.
3.4-2 도수분포표의 작성과정
3.4 관측치 정리
① 자료의 범위결정
범위(Range) = Xmax - Xmin
② 계급수 결정
③ 계급폭 결정
④ 계급의 경계값 결정
⑤ 각 계급의 도수 산정
<도수분포표>
3.4-3 주상도표(Histogram)
3.4 관측치 정리
• 도수 분포를 직교좌표위에 그림으로 나타낸 것.
• 수평축 : 각 계급의 경계, 수직축 : 도수
• 막대의 폭 : 계급의 폭, 막대 높이 : 계급의 도수
• 계급의 경계치를 막대의 폭으로 하지 않고 막대의 폭을 임의로 정하여 막대와 막대의 사이가 연결되지 않는 것을 봉상도표라 함.
<주상도표> <봉상도표>
3.4-4 도수절선 및 도수곡선
3.4 관측치 정리
• 도수절선(Frequency polygon)
- 주상도표에서 막대에 계급치를 표시하고 선으로 연결한 것.
• 도수곡선(Rezuency curve)
- 관측치 수를 점점 증가시키면서 계급의 구간을 작게하여 도수절선을 하나의 곡선으로 나타낸 것.
<도수절선> <도수곡선>
3.4-5 원형그래프(Pie chart)
3.4 관측치 정리
• 원을 그린 후 상대도수에 비례하여 중심각을 나눠 표시.
• 질적자료의 분포에 유용한 도표.
<원형그래프>
3.4-6 파레토그림(Pareto chart)
3.4 관측치 정리
• 자료를 항목별로 분류해서 크기 순서대로 나열한 그림.
• 어떤 항목이 문제가 있는가? 어떤 문제점을 중점적으로 개선할 것인가?
등을 파악 가능함.
<파레토그림>