자료 분석
자료(data) 정보(information
)불확실한 상황에서 합리적, 최선의 의사결정 (전공지식+통계지식)
자료정리, 분석
자료분석의 의의
변수
(Variable) 상수
(Constant)
값이 달라질 수 있는 것 예) 키, 체중, 성, 연령, 혈압
값이 달라지지 않는 것 예) 파이 (=3.14)
Variation is the root of scientific inquiry, and researchers are interested in explaining and understanding variation
1. 변수 vs 상수
독립변수 (Independent
Variable)
종속변수 (Dependent
Variable)
원인이 되는 것
= 설명변수
결과가 되는 것
= 결과(반응)변수
출생시 체중은 병원감염 발생에 영향을 주는가?
독립변수 : 출생시 체중 종속변수 : 병원감염 발생
2. 독립변수 vs 종속변수
질적변수 (Qualitative
Variable)
양적변수
(Quantitative Variable)
수치로 나타낼 수 없는 변수 예) 성, 혈액형, 직종 등
수치로 나타낼 수 있는 변수 예) 체중, 키, 온도
3. 질적(범주형)변수 vs 양적변수
성: 남자=1, 여자=2 또는 남자=2, 여자=1
혈액형: A형=1, B형=2, AB형=3, O형=4 또는 A형=4, B형=3, AB형=2, O형=1
빈도(분율) 자료 평균 자료
질적변수 (Qualitative
Variable)
양적변수
(Quantitative Variable)
예 1) 당신의 연령은 몇 세입니까? - 양적변수
예 2) 당신의 연령은 다음 중 어디에 해당합니까? - 질적변수
1) 10-19세 2) 20-29세 3) 30-39세 4) 40-49세 5) 50세 이상
이산변수 (Discrete
Variable)
연속변수 (Continuous
Variable)
하나하나 셀 수 있는 정수값을 가지는 변수 예) 학생수, 과목수, 학점수
소수점 이하의 값을 가질 수 있는 변수
예) 체중, 키, 온도
4. 이산변수 vs 연속변수
변수
질적변수
양적변수 명목변수
서열변수
등간변수 비 변수
5. 명목변수 vs 서열변수 vs 등간변수 vs 비 변수
자료의 특성을 서로 다른 범주로 구분하기 위해 하나의 이름표로 서 수치 부여(단순 분류)
변수 변수 코드
성 1. 여성 2. 남성
결혼상태 1. 미혼 2. 기혼 3. 이혼 4. 기타
명목 변수 (Nominal Variable)
자료의 특성에 서열을 매기기 위해 수치 사용(분류 + 서열)
변수 변수 코드
교육수준 1. 초등졸 2. 중졸 3. 고졸 4. 대졸
삶의 만족도 1. 매우 만족 2. 만족 3. 보통 4. 불만족 5. 매우 불만족
서열 변수 (Ordinal Variable)
특성에 서열을 매기는 것은 물론 그들의 상대적인 차이(distance) 까지를 제시하기 위해 수치 사용 (분류 + 서열 + 차이)
예) 체온 : 20℃와 30℃ = 10℃ 차이 30℃와 40℃ = 10℃ 차이
등간 변수 (Interval Variable)
특성에 서열을 매기는 것은 물론 그들의 상대적인 차이(distance) 까지를 제시하기 위해 수치 사용(분류 + 서열 + 차이 + 절대 영점)
예) 키 : 180cm = 90cm X 2배 체온 : 30℃ = 15℃ X 2배 (?)
비 변수 (Ratio Variable)
Q) 변수의 유형 찾기
성별 나이 최종
학력 교육 경험 질적
양적 이산 연속 명목 서열 등간 비
O O O
O
O
O O
O O