• 검색 결과가 없습니다.

1. 자료의 정리 및 이해

N/A
N/A
Protected

Academic year: 2022

Share "1. 자료의 정리 및 이해"

Copied!
15
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

1. 자료의 정리 및 이해

(2)

통계학(statistics) 이란?

단순히 자료의 정리만을 의미하는 것이 아니라, 관심사에 대한 정확한 대상을 선정하고,

조사목적에 필요한 자료나 정보를 최적의 방법으로 수집하여 수집된 자료를 과학적 이론에 의하여

정리하고 분석하는데 필요한 방법을 제시해 주는 학문

• 기술통계학(Descriptive Statistics) : 자료를 어떻게 정리하고 요약 할 것인가?

즉, 조사한 현상을 수치 혹은 원하는 것으로 표시

• 추측 통계학(Inferential Statistics) : 자료의 일부만

살펴봄으로써 전체적인 것에 대해 어떻게 판단할 것인지 터득.

즉, 현상에 대해 느끼는 것을 파악 “~하더라”하는 방법

(3)

자료수집

1. 자료수집

자료를 이용할 사람과 필요로 하는 정보에 따라 자료수집 달라져야 함

2. 변수(Variable) : 사물이 가지고 있는 특성, 개체에 따라 변화가 가능한 상태 또는 특성

어떤 특성을 관찰할 때 그것을 가진 장소나 사람, 기타 등등이 달라짐에 따라 그 값들이 달라지는 특성으로 조사하고자 하는 용어, 변하는 수차 (연구자가 관여할 수 없는 성질) ex) 체중, 혈압, 나이, 시력....

① 상수(Constant) : 변화가 가능하지 않은 상태 또는 특성 ex) 눈, 코, 손가락 수

② 일변량 자료 : 개체에 관하여 한 개의 변수만을 다룬 경우

다변량 자료 : 〃 두 개 이상의 변수가 관측된 경우

(4)

양적변수와 질적변수

(1) 양적변수(quantitative variables) => 연속형 변수

관심의 대상이 되는 특성을 수치로 나타낼 수 있는 변수

① 연속변수(continuous variables)

어떤 구간 내에서 취할 수 있는 값이 무한히 많은 변수, 소수점 이하표현 ex) 신장, 체중, 거리, 수질오염도, chol 수치, 시력

측정도구의 정밀성이 측정값의 정확성에 크게 영향을 준다.

② 이산변수(Discrete variables)

어떤 구간 내에서 취할 수 있는 값이 한정되어 있는 변수, 정수로 측정 ex) 가구당 자녀 수, 입원 환자 수, 학생 수

(2) 질적변수(qualitative variables) => 범주형 변수

특성을 수치로 표현하기 보다는 범주(category)로 구분 수량화 할 수 없는 것

ex) 성별(남, 여), 직업, 학력, 종교, 경제상태(상, 중, 하)

(5)

독립변수와 종속변수

두 변수 (X, Y)가 있을 때 한 변수(X)가 다른 변수(Y) 에 시간적으로나 논리적으로 선행하면서 그 변수(X) 의 변화가 다른 변수(Y)의 변화에 영향을 미친다

영향을 미치는 변수 : 독립변수

영향을 받는 변수 : 종속변수

(6)

측정도구

기구: 혈압계, 체중계, 체온계 등 사람: 문진, 시진, 촉진

혼합: X-ray판독

(7)

측정척도(Scale of Measurement)

1) 명목척도 (Normal scale)

· 가장 낮은 수준의 척도

· 특정대상의 특성을 명칭으로 구별하는 척도 · 가감승제의 수학적 연산기능을 수행하지 못함 · 같다, 다르다 관계만 성립

ex) 남 : 1, 녀 : 2 일 경우 1과 2는 양적 의미가 없음 → 가장 많이 혼동 하는 부분

2) 서열척도 (Ordinal scale) = 순위척도

· 명목척도의 속성에 서열적인 의미가 부여됨 · 크고 작은 순서, 많고 적은 순서의 관계 성립 · 수학적 계산 불가능

ex) 소득수준 : 상, 중, 하

학력 : 초, 중, 고졸

(8)

측정척도(Scale of Measurement)

3) 간격척도(Intenal scale) = 등간척도

측정대상의 속성에 따라 순서를 정할 수 있을 뿐만 아니라

등급 간의 간격이 같은 변수 · ‘0’의 개념이 없다 · 가감만 가능 ex) 온도, IQ, 시력 등

4) 비척도(Ratio scale) =비율척도

· 측정 수준이 가장 높은 수준의 척도

· 측정값의 순위와 간격, 절대적인 크기를 알 수 있다.

· ‘0’의 개념을 포함함으로 가감승제가 가능하다 ex) 체온, 몸무게, 신장 등

*** 비척도는 명목척도나 서열척도로 변환 가능 명목척도는 서열척도나 비척도로 전환 불가능 ex) 고혈압 수치 : 비척도

120-80을 기준으로 150-100이상 → 고혈압 이하 → 정상

⇒ 명목척도로 변환했을 경우

120-80이하(정상), 120-80~150-100(고혈압 위험군), 150-100이상(고혈압)

(9)

• Central tendency - mean, median, mode

• Dispersion - variance, S.D., C.V., range,

quartile, percentile, etc.

자료의 요약

(10)

평균과 중앙값의 위치

(11)

변동계수

• 변동계수 (Coefficient of Variation : CV)

- 동일한 변수를 다룬 여러 연구들 간의 표준편차를 비교 하기에 유용한 통계치

- 표준편차를 평균값의 백분율로 표시한 것

- CV = 100 (SD/ ) or 100(SD/m)

(12)

범위 (Range)

• 변위성을 측정하는 간단한 측정값으로 분포의 최대값과 최소값 사이의 차이

• 범위는 분포 내에 있는 단지 두 값에 의해 결정되 기 때문에 불안정적이고, 표본의 크기가 커지면 함께 증가하는 경향이 있다.

• 범위는 극단치에 민감하다.

(13)

백분위수 (Percentile)

• 한 분포에서 정해진 특정 기준 안에 포함되는 점수 값

• 문자 P로 표시되며 특정 점수 값 아래 백분율을 의미하는 아 래첨자와 함께 기호화 된다.

• P 60 은 60백분위수를 말하며 전체 값의 60% 이하에 위치하는 값을 가르친다.

• “P 40 =55”라는 것은 분포의 값의 40%가 55점 이하라는 것을 의미한다.

• 25백분위수는 제1사분위수 (first quartile)를 말하는 것이고, 50백분위수는 제2사분위수 (second quartile) 또는 중앙값 (median)을, 그리고 75백분위수는 제3사분위수 (third quartile)를 말하는 것이다.

• 사분위수는 단지 한 점을 의미하므로, 점수는 일사분위수 내

에 놓이는 것을 말하지 않는다.

(14)

결측자료

• 결측자료의 처리

- 완전한 자료만을 가진 관찰치의 사용 - 사례 또는 변수의 삭제

- 가중법

- 대체법에 의한 결측치 추정

 사전지식

 평균 대체

 결측값을 추정하는 복잡한 방법인 회귀사용

 기대최대화

 다중매체

(15)

자료의 형태

DATA

범주형 변수 연속형 변수

(categorical variable) (continuous variable)

명목척도 순위척도 간격척도 비척도

(nominal) (ordinal) (interval) (ratio)

참조

관련 문서

이해 기초 전자 회로

Produce only the assembly code using –S option.. Produce only the compiled code using

따라서

도형의 닮음과 피타고라스 정리... 도형의

미래 산업에 걸맞은 규제 체계를 갖추는 일은 현 시점에서 긴요하고도 시급한 과제 중의 하나이다. 무엇보다도 기술과 산업의 융합이 본격적으로 시도되는 시대에는

이상에서 원에 내접하지

[r]

통계자료의 정리 평균 , 표준편차 다섯숫자요약 빈도수. 평균 ,