통계이론의 이해 3
-통계분석
한국성서대학교 간호학과 장 인 순
❏모수통계학(parametric statistics)
모집단의 분포에 대한 가정을 필요로 하는 통계적 방법으로서 대체로 연속형의 수량적 자료를 분석할 때 사용
❏비모수통계학(non ‐parametric statistics)
모집단의 분포에 대한 가정을 필요로 하지 않으며 질적 자료 혹은 비연속형의 수량적 자료를 분석할 때 사용
모수/비모수통계
가설검정을 위한 통계방법 선택
모수(parameter) 비모수
(non-parameter) 모집단의 평균과 분산,
정규분포
비정규분포, 표본수가 작 은 경우, 명목, 순위척도
교차분석 Chi-square
(Fisher exact test)
두집단 평균비교 T-test Wilcoxon rank sum test K집단 평균비교 ANOVA Kruskal wallis test
짝지은 평균비교 Paired-test Wilcoxon signed rank sum test
모수/비모수통계
통계분석
1. 데이터를 가지고 통계분석을 하기 위해서는 1) 데이터에 있는 변수들의 성질 파악
- 변수들은 측정 방법에 따라 명목척도 변수, 순서척 도 변수, 구간∙비율척도 변수로 구분
- 변수의 척도에 따라 분석방법이 달라짐
2) 명목척도, 순위척도 변수-범주형(categorical) 변수
3) 구간 ∙비율척도 변수- 척도변수
1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한 데이터의 수집절차
연구목적, 연구내용 및 분석방법 결정
설문지 작성, 표본추출방법과 표본크기결정, 조사방 법 결정, 조사원 훈령, 예비조사
설 문 조 사
데이터의 코딩과 컴퓨터 입력 및 오류데이터 수정
통계분석
(2) 통계분석 작업의 단계
(가) 제1단계: 각 변수의 분포 파악 - 빈도분석(Frequency Analysis)
- 기술 통계분석(Descriptive Statistics Analysis)
각 변수에 대한 분포 파악
범주형 변수 빈도분석
구간 ∙비율척도 변수 기술 통계분석
통계분석
(나) 제2단계: 데이터의 타당성 및 신뢰성 검토 - 요인분석(Factor Analysis)
- 신뢰도 분석(Reliability Analysis)
데이터의 타당성과 신뢰성
여러 개의 순서척도(3점, 5점, 7점척도)변수
요인분석 신뢰도분석
통 계 분 석
(다) 제3단계: 통계분석기법의 선정
1. 몇 개의 변수를 동시에 분석할 것인가?
2. 변수의 측정척도는 무엇인가?
3. 분석목적은 무엇인가?
통 계 분 석
1.빈도분석: 명목척도나 순서척도 변수에 대해 빈도 (Frequency)분포를 알아보는 분석
2.기술 통계분석: 구간 ∙비율척도 변수에 대해 요약 통계략 (평균, 표준편차 등)을 구하는 분석.
3.요인분석: 많은 문항(변수)를 적은 수의 요인변수로 축소 하는데 사용하는 분석
-하나의 개념을 측정하기 위해 여러 개의 문항(변수)들을 사용했을 경우에 이 문항들이 한 개의 요인으로 묶여지는 것은 그 측정도구가 타당함을 나타냄
4.신뢰도분석: 동일한 개념을 여러 문항(변수)으로 질문하 였을 경우에, 응답들이 비슷하게 나타나는지를 측정하는 신 뢰계수를 계산
통 계 분 석
두 변수의 연관성 정도
두 개 모두 범주형 변수
=> 교차분석
두 개 모두 구간 ∙비율척도변수
=> 상관분석
집단간 평균 비교
독립변수: 범주형변수(2개범주) 종속변수: 구간 ∙비율척도 변수
=> T-검정(t-test)
독립변수: 범부형변수(3개이상범주) 종속변수: 구간 ∙비율척도 변수
=> 일원배치분산분석(ANOVA)
두 변수의 연관성 정도
통 계 분 석
인하대학교 통계학과
여러 개의 독립변수와 한 개의 종속변수 간의 관계
독립변수 모두: 범주형 변수 종속변수: 구간 ∙비율척도 변수
=> 분산분석(ANOVA)
독립변수, 종속변수모두 구간 ∙비율 척도 변수
=>다중회귀 분석
통 계 분 석
독립 변수가 종속변수에 영향을 주는지 파악
독립변수와 종속변수:
구간 ∙비율척도 변수
=> 단순회귀분석
2. 통계적 추론과 가설검정
(1) 모집단(Population)과 표본(Sample)
우리나라 간호학생
2000명의 간호학생
모집단
표본추출
표본
통 계 분 석
(2) 통계적 추론(Statistical Inference)
- 표본은 모집단의 아주 작은 일부이기 때문에 이 표본만을 가지고 모 집단 전체에 대해 정확히 알아낼 수는 없음
-> 모집단에 대한 통계적 추측방법을 통계적 추론 이라고 함 -> 추론방법: 신뢰구간에 의한 방법, 가설검정방법
-> 신뢰구간(흔히 95% 신뢰구간): 모집단의 한 특성의 값을 신뢰구간 내에서 추측하는 구간을 말함
-> 가설검정: 모집단에 대한 가설을 세워놓고서 이 가설이 옳거나 그르 다고 추측하는 방법
[Ex]
어느 도시의 실업률에 대한 95%신뢰구간은 (0.058,0.106)으로 나타났다.
통 계 분 석
(3) 가설 검정(Hypothesis Testing)
-많은 통계분석 방법(T-검정, 분산분석, 회귀분석 등)에서 는 가설검정방법을 통해 추측을 함.
-가설검정에 대한 추측의 단계
1단계
가성을 세운다.
H
0(귀무가설) H
1(대립가설)
2단계
표본자료를 가지고 검정통계량
(T, x
2, F등)값을 계산한다.
3단계
검정통계량 값의 P값(유의확률)을 계산한다.
4단계
결론을 내린다.
P값 유의수준이면 H
1을 채택한다.(H
0기각)
통 계 분 석
1단계:가설
- 연구자는 귀무가설과 대립가설, 두 개의통계적 가설을 세움.
-가설은 모두 모집단에 대한 기술이어야 함
- 예상하거나 새로 알아내고자 하는 명제를 대립가설(연구가설, 목적가설 alternative hypothesis)로 하고 대립가설에 반대되는 명제를 귀무가설
(null hypothesis)로 설정함
- 귀무가설(영가설)은 흔히’동일하다’,’차이가 없다’, 등으로 표현됨
[Ex1]
H
O
: 두 변수는 상관(correlation)이 없다.H
1
: 두 변수는 상관이 있다.[Ex2]
H
0
: 새로운 간호중재와 기존 간호중재의 효과에 차이가 없다.통 계 분 석
가설
통 계 분 석
1.가설: 모수에 대한 예상, 주장, 또는 단순한 추측 예) 인간은 질병에 걸린다
-> 아직은 하나의 추측일 뿐임. 통계적 가설검정은 이러한 가설에 대해 증거를 수집하여 과학적으로 증명하는 것임
2.귀무가설(영가설): 기각하기를 희망하여 형식화한 가설. 기존에 받아들이던 가설, 모수에 관한 귀무가설은 항상 모수의 정확한 값을 지정하도록 진술될 것 인 반면 대립가설은 여러 개의 값의 가능성이 허용됨
->보통 같다, 차이가 없다, 0이다
3. 대립가설(연구가설): 표본을 통해 입증하고자 하는 새로운 가설, 모수에 대한 관심의 영역 중에서 귀무가설로 지정되지 않은 모든 경우를 포괄적으로 지정함 ->보통 다르다, 차이가 있다, 0이 아니다
2단계: 검정통계량 값 (Test Statistics) - 가설을 검정하기 위한 통계량 값
- T 검정통계량, x
2
검정통계량, F 검정통계량 등이 있는데, 이것은 표 본자료 값을 가지고 계산됨3단계: P값(유의확률, p-value, significance probability)
- 귀무가설이 참(true)일 경우, 2단계에서 계산된 검정통계량 값이 얼 마나 빈번하게 일어날지에 대한 확률 값임
-만약 P값이 작으면 귀무가설하에서 일반적인 현상이 아니므로 귀무가 설을 기각하고 대립가설을 채택하게 됨
- 이 때의 기준으로 유의수준을 사용함. 유의수준으로는 1%, 5%, 10%
를 일반적으로 설정하는데 5%수준이 가장 널리 사용됨
통 계 분 석
4단계: 결론
- 통계적으로 결론은 ‘H