• 검색 결과가 없습니다.

제8장 통계적 추정 : 한 모집단

N/A
N/A
Protected

Academic year: 2022

Share "제8장 통계적 추정 : 한 모집단"

Copied!
40
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제8장 통계적 추정 : 한 모집단

전광희 교수

jkh96@cnu.ac.kr

(2)

Contents

점추정과 신뢰구간 추정

추정량

신뢰구간 추정

모평균의 신뢰구간 추정

t 분포

모비율의 신뢰구간 추정

표본크기 결정

(3)

점추정과 신뢰구간 추정

통계적 방법

통계분석

기술통계학 추리통계학

통계적 추정 가설검정

(4)

점추정과 신뢰구간 추정

추정량과 추정치

추정량(estimator): 표본정보에 의존하는 확률변수로서 모수를 추정하는 데 사용되는 표본통계량

추정치(estimate): 표본자료를 이용하여 계산한 통계량의 특정한 값(수치)

점추정과 신뢰구간 추정

점추정(point estimation) : 표본을 추출하고 필요한 계산을 하여 얻는 하나의 수치인 점추정치(point estimate)로 모수를 추정하는 방법

(5)

점추정과 신뢰구간 추정

신뢰구간의 범위(폭)

신뢰하한 점추정치 신뢰상한

모집단

확률분포

평균

= 50

표본 모평균

μ

모른다.

모평균은 40에서 60사이일 것이라고

나는

95%신뢰한다.

(6)

추정량

모수의 좋은 추정량이 되기 위한 조건

불편성(unbiasedness)

효율성(efficient estimator)

일치성(consistency)

충족성(sufficient estimator)

(7)

점추정과 신뢰구간 추정

불편추정량

점추정량 의 표본분포의 기대값이 모수 와 같을 때 점 추정량 은 모수의 불편추정량(unbiased estimator)이라고 한다.

(8)

추정량

효율추정량

불편추정량 중에서 분산이 작은 추정량을 효율추정량(efficient estimator)이라고 한다.

(9)

추정량

일치추정량

표본크기가 증가할수록 추정량 이 모수 에 더욱 근접하는 추정량을 일치추정량(consistent estimator)이라고 한다.

(10)

추정량

충족추정량

충족추정량(sufficient estimator)이란 모수 를 추정하기 위하여 추출하는 동일한 크기의

표본으로부터 가장 많은 정보를 제공하는 추정량을

말한다.

(11)

추정량

모수의 추정량

(12)

신뢰구간 추정

신뢰구간 추정

모수가 포함되리라고 보는 범위(구간)를 실수할 확률을 가지고 제시함으로써 추정치에 대한 불확실성을 표현한다.

신뢰구간 추정치 : 하한 ≤ 점추정치 ≤ 상한

신뢰구간(confidence interval)

점추정치를 중심으로 특정 확률로 모수가 포함될 것이라고 기대하는 하한부터 상한까지의 구간

신뢰하한과 신뢰상한을 신뢰한계(confidence limits)라고도 한다.

(13)

신뢰구간 추정

신뢰구간

신뢰수준(level of confidence)또는 신뢰도(degree of

confidence) : 미지의 모수의 참 값이 신뢰한계 안에 포함될 확률

모수 μ에 대한 95% 신뢰구간 : 모수 μ가 이 구간 속에 들어갈 확률이 95%라는 것을 의미하지 않고 표본크기 n을 반복하여 추출하여 설정하는 100개의 신뢰구간 중에서 95개(95%)는 모수 μ를 포함하고 5개(5%) 정도는 포함하지 않을 것이라는 것을 의미한다. 실제로 하나의 신뢰구간을 설정하기 때문에 모수 μ가 이 구간 속에 포함될 것으로 95% 신뢰한다고 말한다.

(14)

신뢰구간 추정

오차율(probalility of error)

설정된 신뢰구간이 모수의 참값을 포함하지 않을 확률

= 1 - 신뢰수준 신뢰수준 = 1 -

오차율 의 값이 작을수록 신뢰수준은 높게 되고 신뢰구간의 폭은 증가한다.

보통 =0.05, 95% 신뢰구간이 사용된다.

(15)

신뢰구간 추정

신뢰구간 설정

오차한계(margin of error) : 표본오차로서 표본평균과 모평균 사이의 차이

신뢰구간 추정치의 한계 = 점추정치 ± 오차한계

= 점추정치 ± Z

(추정의 표준오차)

Z는 임계치(critical value) 또는 신뢰요인(factor)

신뢰구간

신뢰하한 점추정치 신뢰상한

(표본통계량)

오차한계

(16)

신뢰구간 추정

신뢰구간

모평균

σ²기지

모분산 모비율

σ²미지

(17)

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우

가정(assumption)

모집단은 정규분포를 따른다.

모표준편차 σ 는 알고 있다.

모평균의 신뢰구간

모평균 μ의 신뢰구간의 한계 = ± Z

= ± Z

(18)

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우

모평균 μ의 신뢰구간

Z 는 각 꼬리에 의 확률을 갖는 표준정규분포의 임계치이다.

오차한계 ME =

신뢰수준에 따른 Z값

(19)

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우

모평균 μ의 신뢰구간

= 0.05 신뢰수준 = 95%

(20)

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우

모평균 μ의 신뢰구간

모평균 μ의 신뢰구간의 영향요소 : σ, (1- ), n

오차한계 축소 = 신뢰구간 범위의 축소 ME =

모표준편차 σ를 줄여야 한다.

신뢰수준(1- )를 낮추어야 한다.

표본크기 n을 증가시켜야 한다.

에서

(21)

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우

모평균 μ의 신뢰구간 : 예 8-1

모평균 소요시간이 35.2분에서 54.8분 사이일 것이라고 95%

신뢰한다.

(22)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(대표본)

가정

모집단이 정규분포를 따른다.

모표준편차 σ 를 모른다.

표본크기 n≥30이다.

예 8-2

}

σ 대신 s를 이용한다.

(23)

모평균의 신뢰구간 추정

Z분포와 t분포 사용의 결정방법

(24)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본)

가정

모집단이 정규분포를 따른다.

모표준편차 σ를 모른다.

표본크기 n<30 이다.

t 분포(t distribution)

평균 μ인 정규모집단으로부터 크기 n의 표본을 무작위로 추출하였을 때 평균 , 표본표준편차 s일 표본통계량 t는

(25)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본)

t 분포의 특성

t 분포는 표준정규분포와 같이 평균=0을 중심으로 좌우대칭이며 종모양이다.

t 분포의 밀도함수는 표준정규분포보다 큰 분산을 갖는다.

동일한 신뢰수준에서 t통계량을 사용한 신뢰구간의 범위가 Z통계량 사용시보다 넓다.

t 분포는 자유도 (n-1)에 따라 분포모양이 결정된다.

자유도(표본크기)가 증가할수록 t 분포는 표준정규분포에

(26)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본)

t 분포의 특성

(27)

모평균의 신뢰구간 추정

Z분포와 t분포의 비교(신뢰수준 95%, 표본크기 5)

(28)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본)

t 분포표 이용

확률이 아닌 t값

(29)

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본)

t 분포를 이용한 모평균 μ의 신뢰구간

t 분포를 이용한 모평균 μ의 신뢰구간 : 예 8-5

(30)

모비율의 신뢰구간 추정

가정 (대표본)

확률표본이 추출된다.

이면 표본비율 은 정규분포에 근접한다.

표본비율 의 표본분포

으로 표준오차 을 추정한다

(31)

모비율의 신뢰구간 추정

모비율 p에 대한 100(1- )% 신뢰구간(대표본)

모비율 p의 신뢰구간 : 예 8-6

(32)

표본크기 결정

모평균을 추정하는 경우

모표준편차 σ를 아는 경우

모평균을 추정하는 데에 필요한 표본크기 결정

임계치 Z값을 결정하는 신뢰수준(1- )를 알아야 한다.

오차한계(표본오차) e를 알아야 한다.

모표준편차 σ를 알아야 한다.

표본크기의 결정 : 예 8-7

(33)

표본크기 결정

모평균을 추정하는 경우

모표준편차 σ를 모르는 경우

표본크기의 결정 : 예 8-8

(34)

표본크기 결정

모비율을 추정하는 경우

표본비율을 아는 경우

표본비율을 모르는 경우

표본크기 결정 : 예 8-9

(35)

모분산의 신뢰구간 추정

분포

분포(chi-square distribution)

평균 μ, 분산 σ²인 정규모집단으로부터 크기 n의 표본을 무작위로 반복하여 추출하고 각 표본에 대해 분산 s²을 계산하였을 때 확률변수 은

으로 자유도 (n-1)인 분포를 따른다.

(36)

모분산의 신뢰구간 추정

분포

분포의 특성

t분포와 같이 자유도 (n-1)에 따라 분포의 모양이 변한다.

표본크기가 클수록 정규분포에 근접한다.

t분포, 정규분포와 달리 좌우대칭이 아니며 오른쪽 꼬리를 갖는다.

확률변수 은 언제나 양수이고 가장 왼쪽에서 0을 갖는다.

(37)

모분산의 신뢰구간 추정

분포

분포표 이용

(38)

모분산의 신뢰구간 추정

모분산 σ²의 신뢰구간

가정

모집단은 정규분포를 따른다.

분포의 신뢰구간

(39)

모분산의 신뢰구간 추정

모분산 σ²의 신뢰구간

분포를 이용한 모분산 σ²의 신뢰구간

분포를 이용한 모분산 σ²의 신뢰구간 : 예 8-13

(40)

E N D

참조

관련 문서

다양한 site 에서 여러 분포의 확률이나 검정값을 계산할 수 있다... d.f.:

적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단 특성에 대한 좋은 추정치를 제공할 수 있다.. 적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단

그러면 구간 에서 제차 선형상미분방정식의 두 개의 해 가 구간 에서 일차종속이 되는 필요충분조건은 그들의 Wronskian이 구간 내의

- 여러 기질의 수소를 산소로 젂달하는 효소(enzyme)를 가지고 있음 여러 기질의 수소를 산소로 젂달하는 효소(enzyme)를

• 프로젝트가 시작되면 프로젝트의 결과로 만들어지는 제 품이나 서비스에 대한 명확한 정의와 프로젝트의 목적 달성을 위한 각 단계별 산출물을 분석하여 작업의

 Discount Sounds 가 새로운 대리점 후보지 평가를 하기 위해 그 지역 거주자의 평균 연소득을 고려 한다.. 표 본규모는

일부에서는 Coverage문제, 제조품문제, 소비량 하한, 통계부재 문제 등을 우 선순위로

선박의 주요 치수를 토대로 한 정수 중의 저항(Resistance in calm water) 추정 - 계열 모형 시험 자료, 실험 결과의 통계적 추정식(Holtrop &amp; Mennen의 방법