1. 통계적 추론 : 통계치로부터 모수치를 추리하는 과정

(1)

제5강 PASW사용법-1

P-유의도(Probability)에 대하여

P값이란?

P-값은 보통 probability에서 온 말로 보통 유의도라고 읽는다. P에 대하여 통계 학적 설명으로는 'P-값은 가설이 맞다고 결정할 때에, 실제로 관찰되지 않을 크기 의 평균값을 얻게될 확률이다' 라고 되어 있다. 그러나 어려운 통계학 용어를 빼고 예를 들어 쉽게 말하면 이런 뜻이다.

'두 집단이 차이가 있다(P < .05)' 의 뜻은, 이 판단이 잘못될 가능성(유의성, 조심 성, probability)은 5% 이하이다. 나는 '이 판단이 맞다' 고 적어도 95% 정도는 자 신 있다는 주장을 하는 것이다. 사회현상에 대하여 어떤 판단(두 집단이 차이가 있 다. 혹은 없다)을 내릴 때, 그 판단은 수학에서 말하는 1+1=2 처럼 참과 거짓으로 분명히 나뉘는 것은 아니기 때문에, 그 판단이 틀릴 가능성도 얼마간은 있다고 말 하는 것이다.

다시 말하면, 통계 분석 결과에 나와 있는 표에서 "유의확률(Sig.)"의 값이 작으면 작을수록 연구자의 주장이 맞다고 생각하면 된다.

즉 유의확률이 .05이면 1-.05 =.95, 연구자의 주장이 맞을 확률이 95%이다.

따라서 아래의 각각은 같은 방법으로

(1)+, (2)*, (3)**, (4)*** (5)NS 의 의미는 각각 아래와 같이

P < .10

판단이 틀릴 가능성 10% 이하 = 판단이 맞을 가능성 적어도 90%이상

P < .05

(2)

구 분 성별 N Mean S. D. t-값 유의도 접근편리성 여자 52 3.9295 1.4632 1.696 .092+

남자 131 4.3219 1.3905

개인목적부합성 여자 52 2.7388 1.3064 .846 .399 NS 남자 131 2.9186 1.2925

정보의 유효성 여자 52 3.6026 1.2812 1.445 .150++

남자 131 3.8761 1.1022

( NS ; No Significance + ; P < .1, ++ ;P < .2 ) P < .01

P < .001

판단이 틀릴 가능성 0.1% 이하 = 판단이 맞을 가능성 적어도 99.9%이상

NS = No Significance = 유의성 없다 = 유의미한 차이가 없다.

의 뜻이다.

그리고 각각에 대하여 *로 표시는 하는데 통상적으로,

+ P < .10 * P < .05 ** P < .01 *** P < .001 로 표시를 한다.

연구자에 따라 다르게 할 수도 있으며, 그에 대하여는 그 내용을 표시해 주어야 한 다. (아래처럼)

< 표 > 남녀간 차이 비교표

유의도 해석의 예

기존의 학습방법으로 인한 학업성취의 평균 점수가 75인데, 새로운 수업법에 의

(3)

한 평균점수가 85점 일 때 P-값이 .031 로 나타났다. 그러면 우리는 새로운 교수 법이 학업성취를 위한 더 효과적인 방법이라고 97% 정도 확신하는 것이다. 이를 연구 논문에서 진술할 때에는 보통 '새 교수법은 통계적으로 유의미한 효과가 있 다.(P < .05)' 라고 쓰는 것이다.

그러므로 가설검증에서 'P < .05' 의 의미는 이 가설이 맞을 확률은 95%정도, 틀 릴 확률은 5%라는 뜻으로 , 가설이 틀릴 가능성이 정말로 희박하고, 판단이 잘못되 어 틀릴 가능성, 조심성, 유의성은 통계적으로 5% 이하이니, 이 판단을 받아들이자 고 주장하는 것이다.

일반적인 해석/진술과 새로운 진술/해석 방법

일반적으로 P-값을 해석할 때에 P<.05 이면, ' ㅇㅇ는 통계적으로 유의미한 차이 가 났다(P<.05)'라고 기술하였다. 그러나 이러한 진술의 의미를 일반인들은 이해하 기가 어려웠고, 그렇게 진술하는 연구자들도 가끔은 그 뜻의 모호함에 혼동을 일으 키곤 한다. '5% 오차수준에서 통계적으로 의미 있는 차이가 나타났다.' 또는 '통계 적으로 의미 있는 차이가 난다고 95% 확신할 수 있다'고 진술하면 보다 이해가 쉽 다.

위의 예를 보면, '새 교수법은 학업성취에 효과적이라고 95% 확신할 수 있다' 혹 은 '새 교수법은 효과적이라고 확신할 수 있다.(오차정도<5%)' 라고 쓸 수 있다. 다 시 말하면, 통계학상의 정의로는 P-값은 관찰된 평균값을 넘어서는 분포의 꼬리부 분 면적이다. 따라서 P-값은 가설이 틀릴 경우의 신뢰도(↔가설이 맞을 경우의 오 차수준)를 보여주는 것이다.

고전적 가설검증과 P-값

고전적 검정에서는 유의수준(α)를 자의적으로 정하였다(대개 5%수준). 유의수준 을 1%. 5%. 10% 등 연구자가 얼마로 하느냐에 따라 귀무가설(영가설) 가 달라지 게 되는 것이다. 즉 유의수준(α)은 귀무가설(H0: 집단간에 의미는 차이는 없다)의 신빙성을 재는 척도이다. 만일 결과가 자의적으로 정한 유의수준(α)의 기준 이하로 가라앉으면 영가설은 기각된다. 같은 결과를 가지고도 연구자가 정한 유의수준(α)

(4)

에 따라 차이가 있다고도 되고 차이가 없다고도 되는 것이다 .

따라서 응용통계학자들은 점차 고전적 검증 방법보다 P-값 자체를 선호하게 되 었다. 그리고 몇% 범위 내에서 유의한 차이가 있다고 진술하기를 더 좋아한다. 더 구나 요즈음에는 이전과 달리, 모두 통계패키지를 사용하여 곧바로 P-값 자체를 구 할 수 있게 되었다. 따라서 고전적 방법의 진술보다는 P-값을 바로 진술하는 방법 이 더 정확하고, 귀무가설(영가설, H0)의 수용여부는 독자와 정책결정자의 판단에 맡기는 것이 더 옳다는 주장이 있다. 즉 '영가설을 받아들인다', 또는 '영가설을 기 각한다'는 표현보다는 P-값을 제시하면서 '오차범위 P = .032 수준에서 차이가 있 다'고 진술하는 것이 더 좋을 것이라고 생각한다. 단순히 받아들이거나 기각하기보 다는 더 적당한 형태의 검정은 P-값을 산출하여 제시하는 것이다.

학문적인 연구성과에서는 95%신뢰수준을 중요시하지만, 기업체의 소비자 연구 등에서는 그보다 낮아도 의미 있는 차이가 있다면, 기업 이윤 획득을 위하여 선택, 또는 결정을 배제할 아무런 이유가 없기 때문이다.

옛날에는 유의도(P)를 직접 구하기가 어려우므로 통계학 책에서 t-값, F-비 X2 등과 자유도의 가로 세로에 해당하는 칸에서 P값의 범위만을 보았으나,

요즈음은 통계프로그램에서 직접 이 P값이 직접 나온다. 따라서 요즈음은 통계학 책에서 표를 찾을 필요 없이 이 P값을 직접 보고서 +, *, NS 등을 붙이기만 하면 된다.

가설검증 원리 및 절차 요약

1. 통계적 추론 : 통계치로부터 모수치를 추리하는 과정

․ 모수치와 통계치

- 모수치(parameter) : 모집단의 특성을 나타내는 수치, 모집단의 평균(μ), 분산(σ

²), 표준편차(σ) 등. 모수치는 대개 그리스문자로 나타냄.

- 통계치(statistic) : 표본의 특성을 나타내는 수치, 표본의 평균(Ｍ), 분산(S²), 표 준편차(Ｓ) 등

(5)

․모집단을 모두 조사할 수 없으므로 사회과학의 실증적 연구에서는 모집단을 대표 할 수 있는 표본을 추출하여(sampling) 그 표본에 대해 측정한 후(즉 통계치를 산 출한 후) 그러한 수치를 통해서 모집단을 간접적으로 관찰 측정하는 방법을 취한 다.

․모집단으로부터 추출된 표본의 통계치들(평균, 분산, 표준편차 등)를 모집단에 적용 시켜 모집단의 값을 추정하는 것을 통계적 추론이라고 한다.

2. 무작위표집(random sampling)과 통계적 추론

․통계적 추론을 위해서는 가장 기본적으로 표본이 모집단으로부터 확률표집을 통해 서 추출되어야 한다. 확률표집의 가장 기본인 단순무작위표집(simple random sampling)에서는 모집단의 각 관찰대상이 표본으로 선출될 가능성은 동일하다. 즉 모집단 T 개의 단위로 구성되어 있다면, 각 단위들이 표본으로 뽑힐 가능성은 1/T 이다. 이를 바탕으로 모집단과 표본간에 차이가 있다면, 이는 체계적인 차이가 아니 라 단순히 표집오차(sampling error, 우연적 에러)에 의한 것으로 가정한다.

3. 통계적 추론(추정)

① 하나의 통계치가 모집단에서도 사실인가 아닌가를 추정

예) 어느 학교의 6학년 한 반에 대한 키를 잰 결과 평균이 142㎝일 경우 이것이 그 학교 6학년 전체의 평균키에 얼마나 근접할 것인가?

② 표본에서의 두 집단간의 관계가 모집단에서도 사실인가 아닌가를 추정

예) 범죄에 대한 두려움의 평균이 남녀간에 차이가 있다는 표본의 결과가 모집단에 도 적용될 수 있을 것인가?

4. 통계적 추론의 논리

․표본에서 얻은 통계치가 모집단에서도 사실인가 아닌가를 알기 위해서는 모집단에

(6)

대한 정보가 있어야 한다. 그런데 우리는 모집단에 대해 모르기 때문에 표본을 통 해서 얻은 통계치를 통해서 모집단의 모수치를 추론하고자 한다. ---> dilemma의 해결

✡ 표집분포(sampling distribution)의 성격을 이용.

○ 표집분포(sampling distribution 혹은 표본분포)

․어떤 모집단으로부터 특정 크기의 가능한 모든 무작위 표본이 뽑혀졌다는 가정 하에서 각 표본으로부터 얻은 통계치의 이론적 빈도분포를 표집분포 라고 한다.

예) N=5인 가상의 모집단

대상자 a b c d d

나이 5 4 4 3 6

n=2인 가능한 표본을 모두 추출

표본번호 1 2 3 4 5 6 7 8 9 10 전체

표본평균 4.5 4.5 4.0 5.5 4.0 3.5 5.0 3.5 5.0 4.5 4.4

평균들의 평균=4.4 평균들의 분산=0.39

---> 표본평균값의 분포를 표본평균의 표집분포라 함

․실제로 모집단이 큰 경우에는 모든 가능한 표본을 나열해서 표본분포를 구하기란 불가능하다. 표본분포에 대한 통계학자들의 연구결과 중 다음은 통계적 추론을 위 해 필요한 것이다.

․표집분포와 관련된 통계적 연구결과

(1) 표집평균(M)과 표집분산(S²)은 모평균(μ)과 모분산(σ²)의 가장 좋은 추정치이다.

--> 모평균과 모분산을 몰라도 표집평균과 표집분산을 안다면 표본에서 얻은

(7)

통계치가 모집단에서도 사실인지 아닌지를 알 수 있다.

(2) 표집평균의 분산(S²)은 모분산(σ²)을 표본의 크기로 나눈 것과 같다.

S²= σ²/ N S=σ/√n

(3) 모집단의 분포에 상관없이 표본의 크기가 크면, 그 표본평균의 분포는 정규분포 로 접근한다. --> 중심극한정리(central limit theorem)

⇒ 어떤 모집단의 평균이 μ이고 분산이 σ²라면, n개의 표본을 뽑을 때 생길 수 있 는 표본평균들의 분포는 n이 큰 경우 대략 정규분포를 따르고, 이 평균들의 평균은 μ이고 분산이 σ²/n이다.

․<예제>에서는 모집단이 작고 표본의 크기도 작아서 표집분포를 쉽게 알 수 있지 만, 실제로 모집단이 큰 경우에는 모든 가능한 표본을 나열해서 표집분포를 구하기 어렵다. 따라서 표집분포들은 단지 이론적으로 정의된 분포들이다.

․표집분포는 자유도와 기초하고 있는 통계치에 따라 그 형태가 다소 다르다.

예) 카이자승분포, t-분포, f-분포, 정규분포 등 다양. 분석방법에 따라 다른 분포 를 사용한다.

5. 통계적 유의성 검증(가설검증)의 기본논리

- 연구자가 두 변수간에 관계를 미리 가정한 뒤에 모집단에서도 그러한 관계가 나 타나는지를 통계적으로 결정하는 절차

- 어떤 표본에서 두 변수간에 관계가 있는 것으로 나왔을 때, 이 표본이 실제로 두 변수간에 관계가 없는 모집단으로부터 선정되었을 확률은 얼마인가? 에 대한 질문 에 답하는 방식즉, 영가설을 검증하는 방식을 채택한다.

○ 영가설(null hypothesis)의 검증

- 영가설 : ‘통계적으로 나타난 차이나 관계가 우연의 법칙으로 인해 생긴 것’이라

(8)

고 진술하는 것

예) 남녀에 따라 투표 참여행위에는 차이가 없다.

소득수준과 출산자녀의 수는 관계가 없다

- 대안가설(연구가설) : 현상들 사이의 관계나 차이에 관한 진술

- 우리의 진정한 관심은 현상들 사이에 관계가 있거나 차이가 있다는 대안가설(연 구가설)을 검증하는 것이나, 이를 검증하기는 실질적으로 불가능하기 때문에 모집 단에서 두 변인이 서로 관계가 없다는 가설을 검증함으로써, 영가설이 기각될 때 대안적으로 대안가설(연구가설)을 받아들임으로써 두 변수간에 관계가 있다는 것을 간접적으로 증명한다.

- 표본에서 두 변수간에 관계가 있는 것으로 밝혀졌다 하더라도 모집단에서 관계가 없을 확률이 상당히 높다면 ---> 연구가설을 기각(영가설을 받아들임)

- 두 변수간에 관계가 있다는 것을 보여준 표본이 이러한 관계가 없는 모집 단으로 부터 선정되었을 가능성이 매우 적은 경우에만 ---> 연구가설이 기각될 수 없다 (영가설을 기각)고 결론을 내릴 수 있다.

○ 영가설을 취하는 이유

가설이 진실이라는 것을 직접 증명하려고 시도하는 것은 하나의 연구결과를 모든 시간, 모든 사람, 모든 문화에 다 적용시키려는 것으로 이것은 현실적으로 불가능하 다. 99가지 경우에 대해서 다 적용되었더라도 한 가지 경우에 대해 적용이 안되면 진실이라고 할 수 없기 때문이다. 현실적으로 직접적인 증명방법에 의해서 증명하 는 것은 불가능하다. 따라서 허위임을 입증함으로써 진실에 점진적으로 접근하려고 하는 방법을 취한다.--> 통계적으로 기각이라는 간접적 방법을 통함

○ 영가설을 기각할 때 관례상 α또는 alpha로 표시하는 확률수준(probability level) 을 .05혹은 그 이하로 설정한다. 이는 표본으로부터 모집단의 관계를 추리할 경우 생길 수 있는 오류의 위험수준을 나타낸다.

(9)

6. 통계적 유의성 검증(가설검증)의 절차

(1) 연구가설의 진술

예) 남녀의 신문 읽는 시간은 차이가 있을 것이다.

μm ≠ μf

더욱 정확히 표현하면,

신문을 읽는 시간에 있어서 표본으로 뽑힌 남자의 평균치(Mm)와 여자의 평균치(Mf) 사이에 나타나는 차이와 같이 두 모집단의 평균 신문 읽는 시간은 차이가 있을 것 이다.

(2) 영가설의 진술

예) 남녀의 신문 읽는 시간은 차이가 없을 것이다 μm = μf

(3) 영가설의 수용여부를 결정하기 위한 α수준(유의수준)을 설정한다.(α=.05/.01/

.001)

영가설을 받아들일 확률이 이러한 유의수준 이하로 떨어질 때 영가설은 부정되고 연구가설이 받아들여지는 것이다. 보통 이러한 영가설의 수용여부를 결정하기 위한 유의수준으로는 α=.05(p=.05)가 많이 사용된다. 즉, 유의도가 .05이하일 경우에 영 가설을 부정할 수 있다.

(4) 영가설을 기각하기 위해서는 검증통계치가 어느 정도 되어야 하는지를 결정하 기 위해 표에 있는 값, 즉 임계치를 결정한다.

(5) 검증통계치를 계산한다.

(6) 검증통계치를 임계치와 비교한다. 만약 검증통계치가 크다면 영가설을 기각하고 그렇지 않다면, 영가설을 기각할 수 없다.

(10)

PASW(SPSS)

SPSSWIN ?

는 컴퓨터를 이용하여 복잡한 자료를 편리하고 쉽게 SPSS(Statistical Package for the Social Science)처리 분석할 수 있도록 만들어진 통계분석 전용 소프트웨어이 다. 특히 SPSSWIN은 SPSS의 통계패키지의 한 분야로서 개인용 컴퓨터에서 사용 할 수 있도록 만들어진 우수한 프로그램이다. 1969년 사회과학분야의 데이터 분석 을 위한 National Opinion Research Center, Chicago University에서 컴퓨터 프로 그램의 모음집으로 출발하게 되었으며 SPSSWIN을 이용하면 연구자들은 원하는 통 계결과를 신속하고 용이하게 얻어낼 수 있다. 이 통계프로그램은 단순한 기술통계 로부터 복잡한 다변량 통계분석까지 원하는 결과를 비교적 쉽게 얻어낼 수 있게 해 준다. 현재 PASW(predictive analytics software) 로 개명했으며 Ver.18 판매중이 다.

1. 통계적 추론 : 통계치로부터 모수치를 추리하는 과정

제5강 PASW사용법-1

P-유의도(Probability)에 대하여

P값이란?

가설검증 원리 및 절차 요약

1. 통계적 추론 : 통계치로부터 모수치를 추리하는 과정

2. 무작위표집(random sampling)과 통계적 추론

3. 통계적 추론(추정)

4. 통계적 추론의 논리

✡ 표집분포(sampling distribution)의 성격을 이용.

5. 통계적 유의성 검증(가설검증)의 기본논리

6. 통계적 유의성 검증(가설검증)의 절차

PASW(SPSS)

PASW의 기능