통계이론의 이해 3

(1)

통계이론의 이해 3

-통계분석

한국성서대학교 간호학과 장 인 순

(2)

❏모수통계학(parametric statistics)

모집단의 분포에 대한 가정을 필요로 하는 통계적 방법으로서 대체로 연속형의 수량적 자료를 분석할 때 사용

❏비모수통계학(non ‐parametric statistics)

모집단의 분포에 대한 가정을 필요로 하지 않으며 질적 자료 혹은 비연속형의 수량적 자료를 분석할 때 사용

모수/비모수통계

(3)

가설검정을 위한 통계방법 선택

모수(parameter) 비모수

(non-parameter) 모집단의 평균과 분산,

정규분포

비정규분포, 표본수가 작 은 경우, 명목, 순위척도

교차분석 Chi-square

(Fisher exact test)

두집단 평균비교 T-test Wilcoxon rank sum test K집단 평균비교 ANOVA Kruskal wallis test

짝지은 평균비교 Paired-test Wilcoxon signed rank sum test

모수/비모수통계

(4)

통계분석

1. 데이터를 가지고 통계분석을 하기 위해서는 1) 데이터에 있는 변수들의 성질 파악

- 변수들은 측정 방법에 따라 명목척도 변수, 순서척 도 변수, 구간∙비율척도 변수로 구분

- 변수의 척도에 따라 분석방법이 달라짐

2) 명목척도, 순위척도 변수-범주형(categorical) 변수

3) 구간 ∙비율척도 변수- 척도변수

(5)

1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한 데이터의 수집절차

 연구목적, 연구내용 및 분석방법 결정

 설문지 작성, 표본추출방법과 표본크기결정, 조사방 법 결정, 조사원 훈령, 예비조사

 설 문 조 사

 데이터의 코딩과 컴퓨터 입력 및 오류데이터 수정

통계분석

(6)

(2) 통계분석 작업의 단계

(가) 제1단계: 각 변수의 분포 파악 - 빈도분석(Frequency Analysis)

- 기술 통계분석(Descriptive Statistics Analysis)

각 변수에 대한 분포 파악

범주형 변수 빈도분석

구간 ∙비율척도 변수 기술 통계분석

통계분석

(7)

(나) 제2단계: 데이터의 타당성 및 신뢰성 검토 - 요인분석(Factor Analysis)

- 신뢰도 분석(Reliability Analysis)

데이터의 타당성과 신뢰성

여러 개의 순서척도(3점, 5점, 7점척도)변수

요인분석 신뢰도분석

통 계 분 석

(8)

(다) 제3단계: 통계분석기법의 선정

1. 몇 개의 변수를 동시에 분석할 것인가?

2. 변수의 측정척도는 무엇인가?

3. 분석목적은 무엇인가?

통 계 분 석

(9)

1.빈도분석: 명목척도나 순서척도 변수에 대해 빈도 (Frequency)분포를 알아보는 분석

2.기술 통계분석: 구간 ∙비율척도 변수에 대해 요약 통계략 (평균, 표준편차 등)을 구하는 분석.

3.요인분석: 많은 문항(변수)를 적은 수의 요인변수로 축소 하는데 사용하는 분석

-하나의 개념을 측정하기 위해 여러 개의 문항(변수)들을 사용했을 경우에 이 문항들이 한 개의 요인으로 묶여지는 것은 그 측정도구가 타당함을 나타냄

4.신뢰도분석: 동일한 개념을 여러 문항(변수)으로 질문하 였을 경우에, 응답들이 비슷하게 나타나는지를 측정하는 신 뢰계수를 계산

통 계 분 석

(10)

두 변수의 연관성 정도

 두 개 모두 범주형 변수

=> 교차분석

 두 개 모두 구간 ∙비율척도변수

=> 상관분석

집단간 평균 비교

독립변수: 범주형변수(2개범주) 종속변수: 구간 ∙비율척도 변수

=> T-검정(t-test)

독립변수: 범부형변수(3개이상범주) 종속변수: 구간 ∙비율척도 변수

=> 일원배치분산분석(ANOVA)

두 변수의 연관성 정도

통 계 분 석

(11)

인하대학교 통계학과

여러 개의 독립변수와 한 개의 종속변수 간의 관계

독립변수 모두: 범주형 변수 종속변수: 구간 ∙비율척도 변수

=> 분산분석(ANOVA)

독립변수, 종속변수모두 구간 ∙비율 척도 변수

=>다중회귀 분석

통 계 분 석

독립 변수가 종속변수에 영향을 주는지 파악

독립변수와 종속변수:

구간 ∙비율척도 변수

=> 단순회귀분석

(12)

2. 통계적 추론과 가설검정

(1) 모집단(Population)과 표본(Sample)

우리나라 간호학생

2000명의 간호학생

모집단

표본추출

표본

통 계 분 석

(13)

(2) 통계적 추론(Statistical Inference)

- 표본은 모집단의 아주 작은 일부이기 때문에 이 표본만을 가지고 모 집단 전체에 대해 정확히 알아낼 수는 없음

-> 모집단에 대한 통계적 추측방법을 통계적 추론 이라고 함 -> 추론방법: 신뢰구간에 의한 방법, 가설검정방법

-> 신뢰구간(흔히 95% 신뢰구간): 모집단의 한 특성의 값을 신뢰구간 내에서 추측하는 구간을 말함

-> 가설검정: 모집단에 대한 가설을 세워놓고서 이 가설이 옳거나 그르 다고 추측하는 방법

[Ex]

어느 도시의 실업률에 대한 95%신뢰구간은 (0.058,0.106)으로 나타났다.

통 계 분 석

(14)

(3) 가설 검정(Hypothesis Testing)

-많은 통계분석 방법(T-검정, 분산분석, 회귀분석 등)에서 는 가설검정방법을 통해 추측을 함.

-가설검정에 대한 추측의 단계

1단계

가성을 세운다.

H

₀

(귀무가설) H

₁

(대립가설)

2단계

표본자료를 가지고 검정통계량

(T, x

²

, F등)값을 계산한다.

3단계

검정통계량 값의 P값(유의확률)을 계산한다.

4단계

결론을 내린다.

P값 유의수준이면 H

₁

을 채택한다.(H

₀

기각)



통 계 분 석

(15)

1단계:가설

- 연구자는 귀무가설과 대립가설, 두 개의통계적 가설을 세움.

-가설은 모두 모집단에 대한 기술이어야 함

- 예상하거나 새로 알아내고자 하는 명제를 대립가설(연구가설, 목적가설 alternative hypothesis)로 하고 대립가설에 반대되는 명제를 귀무가설

(null hypothesis)로 설정함

- 귀무가설(영가설)은 흔히’동일하다’,’차이가 없다’, 등으로 표현됨

[Ex1]

H

_O

: 두 변수는 상관(correlation)이 없다.

H

₁

: 두 변수는 상관이 있다.

[Ex2]

H

₀

: 새로운 간호중재와 기존 간호중재의 효과에 차이가 없다.

통 계 분 석

(16)

가설

통 계 분 석

1.가설: 모수에 대한 예상, 주장, 또는 단순한 추측 예) 인간은 질병에 걸린다

-> 아직은 하나의 추측일 뿐임. 통계적 가설검정은 이러한 가설에 대해 증거를 수집하여 과학적으로 증명하는 것임

2.귀무가설(영가설): 기각하기를 희망하여 형식화한 가설. 기존에 받아들이던 가설, 모수에 관한 귀무가설은 항상 모수의 정확한 값을 지정하도록 진술될 것 인 반면 대립가설은 여러 개의 값의 가능성이 허용됨

->보통 같다, 차이가 없다, 0이다

3. 대립가설(연구가설): 표본을 통해 입증하고자 하는 새로운 가설, 모수에 대한 관심의 영역 중에서 귀무가설로 지정되지 않은 모든 경우를 포괄적으로 지정함 ->보통 다르다, 차이가 있다, 0이 아니다

(17)

2단계: 검정통계량 값 (Test Statistics) - 가설을 검정하기 위한 통계량 값

- T 검정통계량, x

²

검정통계량, F 검정통계량 등이 있는데, 이것은 표 본자료 값을 가지고 계산됨

3단계: P값(유의확률, p-value, significance probability)

- 귀무가설이 참(true)일 경우, 2단계에서 계산된 검정통계량 값이 얼 마나 빈번하게 일어날지에 대한 확률 값임

-만약 P값이 작으면 귀무가설하에서 일반적인 현상이 아니므로 귀무가 설을 기각하고 대립가설을 채택하게 됨

- 이 때의 기준으로 유의수준을 사용함. 유의수준으로는 1%, 5%, 10%

를 일반적으로 설정하는데 5%수준이 가장 널리 사용됨

통 계 분 석

(18)

4단계: 결론

- 통계적으로 결론은 ‘H

₀

를 기각한다’나 ‘H

₀

를 기각할 수 없다’의 두 가 지인데, 연구자는 통계적 결론을 바탕으로 연구의 결론을 내리게 됨 - 즉, 표본 데이터에 의거해서 연구의 목적하던 바를 옳다고 받아들이 거나, 받아들일 수 없다고 기술함

통 계 분 석

(19)

통계분석방법

(20)

통계분석방법

(21)

통계분석방법

(22)

통계분석방법

(23)

통계분석방법

(24)

주제에 맞는 분석방법??

1. 학생의 성별에 따른 삶의 질 정도의 차이

2. 혈중 콜레스테롤 농도와 지방간 발생과의 관계

① t-test ② 분산분석 ③ 상관분석

④ 회귀분석 ⑤ 카이스키 검정

Q&A

(25)

주제에 맞는 분석방법??

1. 정신과 환자의 성별에 따른 우울 정도의 차이 2. 실험군과 대조군의 암발생 여부 비교

① t-test ② 분산분석 ③ 상관분석

④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test

Q&A

(26)

주제에 맞는 분석방법??

3. 환자 기분상태를 상,중, 하로 나누었을 때 혈압의 차이

4. 혈중 크레아틴 농도와 하루 소변량의 관계

① t-test ② 분산분석 ③ 상관분석

④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test

Q&A

(27)