1. 자료의 정리 및 이해
통계학(statistics) 이란?
• 단순히 자료의 정리만을 의미하는 것이 아니라, 관심사에 대한 정확한 대상을 선정하고,
조사목적에 필요한 자료나 정보를 최적의 방법으로 수집하여 수집된 자료를 과학적 이론에 의하여
정리하고 분석하는데 필요한 방법을 제시해 주는 학문
• 기술통계학(Descriptive Statistics) : 자료를 어떻게 정리하고 요약 할 것인가?
즉, 조사한 현상을 수치 혹은 원하는 것으로 표시
• 추측 통계학(Inferential Statistics) : 자료의 일부만
살펴봄으로써 전체적인 것에 대해 어떻게 판단할 것인지 터득.
즉, 현상에 대해 느끼는 것을 파악 “~하더라”하는 방법
자료수집
1. 자료수집
자료를 이용할 사람과 필요로 하는 정보에 따라 자료수집 달라져야 함
2. 변수(Variable) : 사물이 가지고 있는 특성, 개체에 따라 변화가 가능한 상태 또는 특성
어떤 특성을 관찰할 때 그것을 가진 장소나 사람, 기타 등등이 달라짐에 따라 그 값들이 달라지는 특성으로 조사하고자 하는 용어, 변하는 수차 (연구자가 관여할 수 없는 성질) ex) 체중, 혈압, 나이, 시력....
① 상수(Constant) : 변화가 가능하지 않은 상태 또는 특성 ex) 눈, 코, 손가락 수
② 일변량 자료 : 개체에 관하여 한 개의 변수만을 다룬 경우
다변량 자료 : 〃 두 개 이상의 변수가 관측된 경우
양적변수와 질적변수
(1) 양적변수(quantitative variables) => 연속형 변수
관심의 대상이 되는 특성을 수치로 나타낼 수 있는 변수
① 연속변수(continuous variables)
어떤 구간 내에서 취할 수 있는 값이 무한히 많은 변수, 소수점 이하표현 ex) 신장, 체중, 거리, 수질오염도, chol 수치, 시력
→
측정도구의 정밀성이 측정값의 정확성에 크게 영향을 준다.
② 이산변수(Discrete variables)
어떤 구간 내에서 취할 수 있는 값이 한정되어 있는 변수, 정수로 측정 ex) 가구당 자녀 수, 입원 환자 수, 학생 수
(2) 질적변수(qualitative variables) => 범주형 변수
특성을 수치로 표현하기 보다는 범주(category)로 구분 수량화 할 수 없는 것
ex) 성별(남, 여), 직업, 학력, 종교, 경제상태(상, 중, 하)
독립변수와 종속변수
두 변수 (X, Y)가 있을 때 한 변수(X)가 다른 변수(Y) 에 시간적으로나 논리적으로 선행하면서 그 변수(X) 의 변화가 다른 변수(Y)의 변화에 영향을 미친다
영향을 미치는 변수 : 독립변수
영향을 받는 변수 : 종속변수
측정도구
기구: 혈압계, 체중계, 체온계 등 사람: 문진, 시진, 촉진
혼합: X-ray판독
측정척도(Scale of Measurement)
1) 명목척도 (Normal scale)
· 가장 낮은 수준의 척도
· 특정대상의 특성을 명칭으로 구별하는 척도 · 가감승제의 수학적 연산기능을 수행하지 못함 · 같다, 다르다 관계만 성립
ex) 남 : 1, 녀 : 2 일 경우 1과 2는 양적 의미가 없음 → 가장 많이 혼동 하는 부분
2) 서열척도 (Ordinal scale) = 순위척도
· 명목척도의 속성에 서열적인 의미가 부여됨 · 크고 작은 순서, 많고 적은 순서의 관계 성립 · 수학적 계산 불가능
ex) 소득수준 : 상, 중, 하
학력 : 초, 중, 고졸
측정척도(Scale of Measurement)
3) 간격척도(Intenal scale) = 등간척도
측정대상의 속성에 따라 순서를 정할 수 있을 뿐만 아니라
등급 간의 간격이 같은 변수 · ‘0’의 개념이 없다 · 가감만 가능 ex) 온도, IQ, 시력 등
4) 비척도(Ratio scale) =비율척도
· 측정 수준이 가장 높은 수준의 척도
· 측정값의 순위와 간격, 절대적인 크기를 알 수 있다.
· ‘0’의 개념을 포함함으로 가감승제가 가능하다 ex) 체온, 몸무게, 신장 등
*** 비척도는 명목척도나 서열척도로 변환 가능 명목척도는 서열척도나 비척도로 전환 불가능 ex) 고혈압 수치 : 비척도
120-80을 기준으로 150-100이상 → 고혈압 이하 → 정상
⇒ 명목척도로 변환했을 경우
120-80이하(정상), 120-80~150-100(고혈압 위험군), 150-100이상(고혈압)