• 검색 결과가 없습니다.

제4강 통계의 기초Ⅱ 가설검증

N/A
N/A
Protected

Academic year: 2022

Share "제4강 통계의 기초Ⅱ 가설검증"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제4강 통계의 기초Ⅱ

가설검증

가설검증에서 중요한 문제는 연구의 관심이 되는 특성이나 변수에 관련해서 표본 이 모집단과 같은지 아니면 다른지를 판정하는 일이다. 그런데 어떠한 표본을 뽑더 라도 이것은 특정 변수에 관련해서 모집단과 다른 값을 갖게 된다. 가설검증은 연 구자로 하여금 관찰된 차이(표본과 모집단의 차이)가 충분히 커서 특정 변수에 관 련해서 표본이 모집단과 다르다는 결론이 정당하다는 것을 밝히는 일이다.

예: 한 연구자는 알콜중독자 치료 프로그램의 효과를 측정하는 임무를 맡았다. 그래 서 치료프로그램에 참여한 N=127명의 알콜중독자들을 대상으로 이들이 결근일수를 측정하고 이들이 살고 있는 지역주민의 결근일수와 비교하였다. 그 결과는 아래 표 와 같다.

지역주민 표본

μ = 7.2일(단위: 1년) X‾ = 6.8일

σ= 1.43 N = 127

표본과 모집단간의 결근일수의 차이에 대해서 두 가지의 설명이 가능하다. 첫째 는 치료 프로그램이 정말로 효과가 있어서 이들의 결근일수를 줄였다는 설명이다.

다시 말해서 관찰된 차이는 ‘통계적으로 의미(statistically significant)'하다는 것인 데, 이 말은 우연에 의해서 이러한 차이가 발생하지 않았다는 것으로 풀어 해석할 수 있다(연구가설, 첫 번째 설명). 둘째는 결근일수에 관련해서 모집단과 표본사이 에는 아무런 차이가 없는데 단지 우연에 의해서 이러한 차이가 발생했다는 것이다 (영가설, 두 번째 설명).

(2)

그렇다고 한다면 이 두 설명들 가운데 어느 쪽이 옳은 것일까? 우리가 표본에 의 존하는 한 어느 쪽이 옳은지를 확실하게(절대적으로) 판정할 수는 없다. 그러나 우 리는 의사결정절차를 아주 보수적으로(conservative) 엄격하게 설정하여서 잘못된 결정을 내릴 확률을 매우 낮게 하면서 둘 중의 하나를 선택할 수 있게 할 수 있다.

이러한 의사결정과정은 영가설(두 번째 설명)이 참이라고 가정하는 것에서 시작 된다.

X‾ = μ = 연중 7.2 일의 결근

X‾ = μ라는 주장은 통계적으로 검증될 수 있다. 만약에 표본이 모집단과 다르지 않다면(즉 X‾ = μ이 참된 진술이라면) X‾ = 6.8이라는 관찰된 결과를 얻을 확률을 알게 될 것이다. 우선 객관적인 의사결정의 기준을 마련해 보자. X‾ = 6.8이라는 관찰된 결과를 얻을 확률이 0.05보다 작다고 하면(100번 가운데 5번), 그런 경우는 아주 드물기 때문에 우리는 영가설(두번째 설명)이 참이 아니라고 말할 것이다.

다음 과제는 영가설(두번째 설명)이 참일 경우에 관찰된 표본의 결과를 얻게 될 확률을 계산하는 일이다. 이것과 관련해서는 우리는 모든 가능한 표본의 결과의 표집분포에 대해서 알고 있기 때문에 상당히 정확성을 갖고 확률을 정할 수 있다.

이러한 표집분포의 특성에 대한 우리의 지식과 중앙집중한계정리에 의해서 우리는 표본의 평균의 표집분포가 정규분포를 이루고, 표본의 평균은 모집단의 평균과 같고(X‾ = μ), 표본의 표준편차는 모집단의 표준편차를

N

으로 나눈 것을 안다.

또한 정규분포의 특성으로 우리는 특정 표본의 평균(X‾=6.8)이라는 결과는 수 천개의 가능한 표본 결과중의 하나라는 것도 안다.

표본의 평균 결과와 함께 모든 가능한 평균의 표집분포는 아래 그림에서 묘사되어 있다.

0.05라는 확률은 표집분포의 상단과 하단 끝으로 양분되어 빗줄로 쳐진 영역을 가리킨다. 부록의 Z값 분포포를 통해서 우리는 α=0.05 확률(제1종오류)에 해당하는 Z값이 ±1.96이라는 것을 알 수 있다.

(3)

위 그림의 빗줄친 영역에 해당하는 표본의 결과가 발생할 수 있는 확률은

0.05이다. 그러한 결과가 발생한 경우는 매우 드물기 때문에 우리는 영가설(두번째 설명)이 참이 아니라고 기각할 수 있다.

나머지 과제는 표본의 평균결과를 Z값으로 변환하여 이것이 정규분포의 어디에 위치하는지를 확인하는 일이다. 그러기 위해서는 우리는 표준화 공식을 사용해서 모집단의 평균으로부터 표본의 평균이 떨어진 정도를 표본의 표준편차로

나누어주면 된다.

Z = X‾ - μ = X‾ - μ = 6.8 - 7.2 = -3.15 s σ/

N

1.43/ 127

(4)

* 가설검증의 다섯 단계

1. 연구가설 설정 2. 영가설 설정

3. 표집분포를 선정하고 임계영역(critical region)을 지정 4. 통계치(test statistic) 계산

5. 결정

*양측검증(two-tailed test)과 단측검증(one-tailed test)

연구자가 표본과 모집단의 평균차이의 방향에 대해서 알지 못하거나 확신하지 못할 경우에는 양측가설검증을 한다. 이 경우에 연구가설은 (H1: X‾ ≠ μ)이고 이에 대립하는 영가설은 (H0: X‾ = μ)이다.

그러나 연구자가 평균의 차이의 방향에 대해서 미리 알고 있거나 확신할

경우에는 단측가설검증을 할 수 있다. 이 경우에 연구가설은 (H1: X‾ > μ 또는 X‾ <

μ)이고 이에 대립하는 영가설은 (H0: X‾ ≤ μ 또는 X‾ ≥ μ)이다.

양측검증에서 α=0.05에 해당하는 임계지역은 Z값이 ±1.96에서부터 시작하였는 데, 단측검증에서는 α=0.05에 해당하는 임계지역이 Z값이 +1.65에서부터 시작한 다.

(5)

단측검증에서는 임계지역이 표집분포의 평균과 더욱 가깝기 때문에 영가설을 기 각하기가 양측검증에 비교해서 훨씬 유리하다.

* 표본의 점추정치와 신뢰구간

무작위로 표집이 이루어졌다면, 모집단 평균에 대한 가장 좋은 단일 추정치는 표 본평균이다. 표본평균의 다른 용어는 모집단 평균에 대한 점추정치 (point estimate)이다. 일단 우리가 표본을 뽑아 평균을 계산하면 주위에 신뢰구간 (confidence interval)을 설정할 수 있다. 그 다음 실제 모집단 평균이 신뢰구간 안 에 있을 확률을 말할 수 있다. 그 구간을 평균을 중심으로 대략 ±2표준편차로 설 정하면 같은 크기의 표집을 반복하여 구한 신뢰구간들 중 95%가 모집단 평균을 포

(6)

함하리라고 예상된다. 95% 신뢰구간인 경우 하위신뢰한계 (lower confidence limit)는 ‾Y-1.96σY이며 (sigma Ybar), 상위신뢰한계 (upper confidence limit)는 ‾Y +1.96σY이다.

일반적으로 특정신뢰구간은 다음의 공식으로 설정할 수 있다.

Y ± Zα/2σY

일반적으로 표본의 크기가 커지면 커질수록 특정 신뢰수준에 대한 표본평균을 중 심으로 한 신뢰구간이 좁아지는데 이 점을 다음과 같이 쉽게 보여 줄 수 있다.

σY = 15 이고 N이 100인 무작위 표본의 평균 ‾Y는 100이라고 가정하자. 한 신뢰 구간이 모집단 평균을 포함할 확률을 95%로 보고 싶으면, 구간은 100-1.96(15/

100) = 97.06에서

100+1.96(15/ 100) = 102.94까지일 것이다. 그러나 다시 ‾Y = 100이고 N=500이 면 신뢰구간은 98.69에서 101.31까지로 준다. 결국 특정 α수준에서 N을 증가시키 면 신뢰구간의 범위는 좁아진다. N이 1500정도만 되면 표본평균 주위의 신뢰구간 이 모집단의 표준편차에 비해 대단히 적다는 것을 알 수 있다.

앞에서 들었던 알콜치료프로그램의 효용성에 관한 자료를 예를 들어보자. 이 경 우에 모집단의 평균은 다음과 같은 신뢰구간안에 위치한다.

Y - Zα/2σY ≤ μ ≤ Y + Z‾ α/2σY

6.8 - 1.96*1.42/ 127 ≤ μ ≤ 6.8 + 1.96*1.42/ 127 6.55 ≤ μ ≤ 7.05

그런데 이 신뢰구간은 모집단의 평균인 7.2를 포함하고 있지 않고 있기 때문에 표본과 모집단의 평균이 같다는 영가설은 기각되어야 한다.

표준오차 σY (sigma Ybar)를 계산하기 위해서는 모집단의 표준편차를 알아야 하 는데, 일반적으로 우리는 그것을 알지 못한다. 그러나 N이 충분히 크다면 (100이 상) 표본의 표준편차 SY가 σY의 좋은 추정치임을 안다. 따라서 ̑σY = sY/

N

.

(7)

* 표준오차를 모를 때 추정치의 신뢰구간 설정: t분포

The substitution of s for σ is permitted only for large samples (100 cases or more). For smaller samples, when the value of the population standard deviation is unknown, the standaridzed normal distribution summarized in Appendix cannot be used in the estimation process. It is perfectly possible to construct meaningful interval estimates for esamples smaller than 100 but, to do so, we must use a different theoretical distribution, called the Student's t distribution, to find areas under the sampling distribution.

정규분포와 매우 유사한 또 다른 분포가 있는데 이 분포에서는 σY를 알 필요가 없다. 이를 t분포 (t distribution)이라고 한다. t 점수는 다음과 같다.

t = (‾Y - μY)/(sY/

N

)

t 분포는 가설검증에 사용된 Z분포와 매우 유사하다. 단지 차이라면 Z의 경우 σY

를 안다고 가정하지만 t는 sY를 사용한다.

모든 t분포는 Z로 변형된 정규분포와 마찬가지로 종 모양이며, 평균값도 0이다.

그러나

(1) 가설을 검증하기 위해 t분포를 사용할 때는 표본이 추출된 모집단이 정규분포라 고 가정하며,

(2) t분포는 같은 표본크기의 Z분포보다 분산값이 크다. 그러므로 t분포의 표준오차 는 Z분포의 표준오차보다 크다.

t점수를 통한 신뢰구간의 설정의 공식은

Y ± tα/2 sY/

N

(8)

가설검증의 오류

◦ 추리(추계)통계학은 표본으로부터 모집단의 특성을 추정하는 것이며, 추정한 값이 오류를 내포할 가능성은 언제나 존재한다.

- 연구가설1 : 병맥주의 평균맥주량은 640ml 보다 적다

- 연구가설2 : 여자들보다 남자들이 심장질환을 많이 가지고 있다.

* 표본분포(sampling distribution) : 표본통계량의 분포로서 같은 크기의 표본을 반복하여 추출했을 때 각 표본의 통계량(예:평균)의 분포를 말함

* 모집단분포(population distribution)

- 평균의 표본분포의 성격은 중심극한정리(central limit theorem)로 정리된다.

* 평균(μ)과 표준편차(σ)를 갖는 모집단에서 크리 n의 표본을 반복적으로 추 출하면 표본평균값( x ̄)의 분포는 정규분포와 근사하게 되며, 평균(μ)와 표준 편차(σ/√n)가 된다.

* 이때의 표본편차, 즉 표본분포의 표준편차를 표준오차(standard error)라 한 다.

* 표본분포는 표본의 크기가 클수록 정규분포에 근사하게 된다.

1. 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)

◦ 가설은 합리적인 근거 혹은 경험이나 관찰을 토대로 설정되어야 한다.

◦ 연구가설 즉, 연구자가 믿는 그리고 지지하기를 원하는 가설이 대립가설로 설정 된다.

◦ 귀무가설은 대립가설의 반대로 검증의 대상이 된다.

◦ 통계적 가설검증에서 귀무가설이 기각되거나 기각되지 않지만 해석은 “연구가설 이 지지되거나 지지되지 않는다”로 표현한다.

* 귀무가설은 항상 다음과 같이 설정된다.

HO(귀무가설) : 맥주 한병의 평균량 = 640

H1(대립가설, 연구가설) : 맥주 한병의 평균량 < 640

(9)

HO(귀무가설) : 남자의 심장질환 비율 = 여자의 심장질환 비율

H1(대립가설, 연구가설) : 남자의 심장질환 비율 > 여자의 심장질환 비율

2. 1종 오류(Type 1 error)와 2종 오류(Type 2 error)

◦ 1종 오류 : 귀무가설이 진실임에도 귀무가설을 기각할 오류 - 1종 오류의 허용 확률 : α

◦ 2종 오류 : 귀무가설이 허위임에도 이를 기각하지 않는 확률 - 2종 오류의 허용 확률 : β

결 정

귀무가설

진실 허위

H0 기각 1종 오류 바른 결정

H0 기각 안함 바른 결정 2종 오류

* H0 : 무죄, H1 : 유죄 일 때

- 1종 오류는 사실은 무죄인데 잘못 유죄로 결정하는 오류 - 2종 오류는 실제는 유죄인데 잘못 무죄로 결정하는 오류

◦ α의 크기에 따라 기각역이 정해지며, 하나의 표본으로부터 얻은 통계량이 있을 때 α가 클수록 귀무가설은 기각될 가능성이 높다.

- α의 크기는 보통 0.05, 0.01가 보통이며, 경우에 따라서는 0.5로 정해지기도 한다.

◦ p-value(유의확률) : 귀무가설을 기각하는 경우 1종 오류를 범할 확률을 말한다.

- p-value는 작을수록 분석결과는 통계적으로 유의적이다.

(10)

3. 가설검증 절차

① 귀무가설과 대립가설(연구가설)을 설정한다.

② 가설의 성격에 따라 Z-검증, t-검증, F-검증, χ2 (카이스케어) 검증 중 어떤 검 증을 할 것인지를 결정한다.

③ 통계자료로부터 검증통계량이 계산된다.

④ 통계표로부터 해당 임계치를 발견하고 기각역과 채택역이 결정된다.

⑤ 검증통계량이 기각역과 채택역중 어디에 위치하는지 본다. 기각역에 위치하면 귀무가설을 기각하고 그렇치 않으면 귀무가설을 기각하지 않는다, (기각하지 않 는다 대신 채택한다라는 말은 옳지 않다)

4 가설설정 방법

◦ 방향적 가설과 비방향적 가설

- 방향적 가설이 나은 가설이지만 상황에 따라 탐색적 연구인 경우에는 비방향적 가설이 설정될 수도 있다.

- 귀무가설은 반드시 등호를 포함하여야 한다.

가설요약

가설: 아직 경험적으로 검증되지 않은 일종의 예비이론으로서 둘 혹은 그 이상의 변인들 간의 추측적 진술

*가설검정: 표본으로부터 얻은 사실에 근거하여, 모집단에 대한 가설이 맞는지 틀리 는지를 통계적으로 검정하는 분석방법

*가설에서 기각: 통계학에서는 실제 표본의 관측치와 이론치와의 차이가 확률적인 오차의 범위를 넘어 오류라고 판단되어질 때. 가설이 기각한다라고 표현함.

*가설에서 채택: 관측치와 이론치의 차이가 신뢰수준 범위 내에 존재할 경우, 가설 이 채택한다라고 표현함.

(11)

*귀무가설: “아무런 차이가 없다 “ 또는 “전혀 효과가 없다”는 내용을 의미하는 주 장이고, 대체로 연구에서는 귀무가설을 거부하기 위해 설정한다.

*대립가설: “차이가 있다” 혹은 효과가 있다”는 귀무가설의 반대되는 개념이다.

귀무가설이 기각되고 대립가설이 받아들여지면 자료는 통계적으로 유의하다라고 표현한다.

참조

관련 문서

Current Tokyo is rich in green compared to other metro cities. In some parts, the greenery has been contributed by the many inherited gardens from the Edo era to today which

The use of an internal standard for the determination of ceramide concentration in samples provides an accurate and reproducible analytical method, and this method can be

In specific, better index could be calculated: attractive quality element was added to one-dimensional quality element, both of which affect the satisfaction when physical

(2000) 32) ADHD, attention deficit hyperactivity disorder; VR, virtual reality; CPT, continuous performance test; VC, virtual classroom; TOVA, Test of Variables of Attention;

• 대부분의 치료법은 환자의 이명 청력 및 소리의 편안함에 대한 보 고를 토대로

• 이명의 치료에 대한 매커니즘과 디지털 음향 기술에 대한 상업적으로의 급속한 발전으로 인해 치료 옵션은 증가했 지만, 선택 가이드 라인은 거의 없음.. •

[r]

노인에서의 수면 무호흡으로 인한 장기적 합병증이 중년 환자와 비교하여 차이가 있는지 여부는, 노인의 수면 무호 흡을 하나의 특정질환으로 간주할 것인지 아니면 노인의