8주. Chi-Square test
변해원
고급연구방법 및 통계
오늘의 수업 개요
• 이전 수업 복습
• 수업
- Chi-Square test
- McNemar`s test
핵심정리(10분)
지난 시간 주요 복습
독립인 여러 집단의 평균비교 ANOVA
; 비교하고자 하는 집단이 셋 이상일 때의 분석방법 - 영가설: 세 집단에 차이가 없다.
연구가설: 한 집단이라도 차이가 있다.
• 요인: 그룹을 나누는 변수
• 한 개의 요인을 고려하는 경우 (1-Way ANOVA) - 독립변수가 하나인 경우
• 두 개의 요인을 고려하는 경우 (2-Way ANOVA) - 독립변수가 두 개인 경우
* 독립변수가 세 개 이상이면 요인간 주효과 간접효과를 모 두 살펴보아야 하기 때문에 해석하기가 어려움. -> 두 개 요인까지만 설계할 것.
한 개의 요인을 고려하는 경우
(1-Way ANOVA)
*요인: 그룹을 나누는 변수집단간: 처리제곱합이 커지면 상대 적으로 오차제곱합이 작아지기 때 문에 그룹간 차이가 있다고 볼 수 있 음
집단내: 개개의 관측치가 평균값과 떨 어져 있다는 것. 오차제곱합이 커지면 처리제곱합이 작아져서 세 그룹간 파 이가 없다고 볼 수 있음.
• (예제 2.4) on p.24 : One-way ANOVA
-면역이상에 대한 한 연구에서 자폐아, 정상아, 지진아에 대한 혈청 항원의 농도에 대해 조사하였따. 이 연구의 목적 은 자폐아, 정상아, 지진아에 따라 혈청 항원의 농도에 유 의한 차이가 있는가이다.
• y : 혈청 항원 농도
• group : 1=자폐아, 2=정상아, 3=지진아
독립인 여러 집단의 평균비교ANOVA
; 비교하고자 하는 집단이 셋 이상일 때의 분석방법
• 한 개의 요인을 고려하는 경우 (1-Way ANOVA) - 독립변수가 하나인 경우
• 두 개의 요인을 고려하는 경우 (2-Way ANOVA) - 독립변수가 두 개인 경우
* 독립변수가 세 개 이상이면 요인간 주효과 간접효
과를 모두 살펴보아야 하기 때문에 해석하기가 어
려움. -> 두 개 요인까지만 설계할 것.
오늘 수업 시작
Categorical data analysis
• 분할표(contingency table)분석
- 몇 개의 범주로 나누어진 명목형 자료일 경우, 각 범주에 해당하 는 도수(frequency)를 표로 만든 분할표(contingency table)로 결과를 정리하여 변수 간의 연관성(association) 파악
관련성 연구의 큰 두 흐름 1. Case-control study
2. (Prospective) Cohort study
1. (Retrospective) Case-control study (환자-대조군 연구)
• 위험인자와 질병 간의 관계를 규명하기 위하여 특정 한 질병을 가진 환자군과 그렇지 않은 대조군의 독립 적인 두 집단을 연구대상으로 함
• 두 군에서 의심되는 위험인자에 노출되었는지의 과 거력을 조사하여 노출분율을 두 군 간에 비교함으로 써 질병발생과 위험인자 간에 관련성이 존재하는지 판단하는 방법
1. (Retrospective) Case-control study
• [장점] - 상대적으로 비용 및 필요한 연구대상수가 적고 비교 적 단기간 내에 연구를 수행할 수 있고 드물게 발생하거나 잠 복기간이 긴 질병에 대한 연구 가능
• [단점] - 위험인자에 관한 노출경험 등의 정보가 기억이나 과 거의 기록에 의존하기 때문에 상대적으로 bias가 개입될 가능 성 있음
- 필요로 하는 다양한 위험인자에 대한 정보 수집이 제약적임 - 적절한 대조군 선정이 어렵고 연구에서 통제해야 할 변수에 관한 정보 수집이 어려움
2. Cohort study (코호트 연구)
• 연구하고자 하는 질병이 발생하기 이전에 연구대상집 단(코호트)에 대하여 의심되는 위험인자들에 대한 노 출 여부의 정보를 미리 조사하고 장기적으로 대상 집 단을 관찰한 후, 발생하는 질병과 의심되는 인자와의 관련성을 파악하고자 하는 설계 방법
Cohort study (코호트 연구)
• [장점]
- 위험인자에 관한 노출에서부터 질병 발생까지의 진행과정을 관찰할 수 있고 위험인자에 대한 노출의 수준을 반복적으로 측정할 수 있음
- 연구자가 특별히 관심 갖고 있는 인자들을 연구자의 의도에 따라 포함시킬 수 있고 원인과 결과에 대한 인과적 추론을 비교적 분명하게 할 수 있음
• [단점]
- 연구자의 노력과 연구기간 및 비용이 대규모로 소요됨
- 연구가 종료되기 전에 연구대상들이 중도에 추적 불능 상태로 탈락되어질 가능성이 있음
- 연구기간 동안 질병의 진단 및 검사방법과 그 기준 등이 변화할 수도 있고 연구대상자들의 위험인자에 대한 노출상태가 변할 수도 있음
- 매우 드물게 발생하는 질병인 경우에는 적용하기가 부적절
연관성의 검증
- 분할표 자료에서 두 변수 간의 연관성을 검정하는 방법
• 카이제곱 검정/교차 분석 (Chi-square Test)
피셔의 정확한 검정 (Fisher's Exact Test)
카이제곱(교차분석)예제. 교과서에 없음.
• 황영진 음성위생법과 성대병변 발생과의 관계
성대병변발생 성대병변
발생안함 합
황영진 음성위
생법 시행 50 650 700
시행 안함 530 170 700
피셔의 정확한 검정 예시.
• 10명의 후두염 환자들이 각각 황 음성치료와 변 음성치료를 받은 후 다음과 같이 정상음도가 회복되거나 회복되지 않은 결과를 보였다.
정상음도 회복 정상음도 회복
안됨 합
황 음성치료 4 1 5
변 음성치료 2 3 5