• 검색 결과가 없습니다.

통계학

N/A
N/A
Protected

Academic year: 2022

Share "통계학"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

1

통계학(Statistics)이란?

(2)

2

통계학의 개념

• 통계학(Statistics): 연구대상이 되는 자료(data)들을 수집하고 이를 정리하여 분석하고 해석함으로써 보다 합리적이고 효율 적인 결론(정보)을 도출하기 위한 하나의 과학이다

- 통계학은 자료(data)로부터 정보(information)을 찾아내는 수단이다

자료(Data)

통계학(Statistics)

정보(Information)

• 통계학의 목적: 자료의 불확실성을 제거함으로써 합리적이 고 과학적인 결론을 도출하는데 있다.

(3)

3

통계학의 형태:

기술적 통계학과 추론적 통계학

• 기술적 통계학(Descriptive Statistics)

- 연구대상의 자료를 수집하고 도표, 그림 또는 수치 등을 이 용하여 자료에 대한 특성이나 정보를 쉽게 파악할 수 있도록 자료를 정리, 요약, 설명하는 방법을 다룬다

- 수치 또는 지표를 이용하는 기법:평균값, 분산값 등의 수치 를 이용하여 자료의 특성 또는 정보를 나타내는 방법

- 그래프를 이용하는 기법: 자료가 지닌 특성이나 정보를 여러 형태의 그래프를 이용하여 설명하는 방법

• 추론적(추정적) 통계학(Inferential Statistics)

- 수집된 자료(표본: sample)에 내재된 정보/특성을 이용하여 전체자료(모집단:population)에 대한 일반적인 특성/정보를 과학적으로 추정 하는 방법을 다룬다

(4)

4

기술적 통계학(Descriptive Statistics)

•기술적 통계학은 자료(data)의 수집, 정리, 요약하여 자료의 특 성/정보를 나타내는 방법을 다룬다

-그래프 또는 도표를 이용하는 기법: 비교적 쉽게 자료의 특성 이나 정보를 파악할 수 있는 방법

ex) 원그래프(pie chart),선그래프(line graph),막대 그래프(bar chart), 히스토그램(histogram), 산포도(scatter plot)등

-수치 또는 지표를 이용하여 자료의 특성를 파악하는 기법:

1) 자료값들의 위치(location) 또는 집중화를 측정 하는 방법: 평균값(mean), 중앙값(median), 최빈값(mode)

2) 자료값들의 변동성(variability)또는 산포경향을 측정 하는 방법: 범위(range), 분산(variance), 표준편차(standard deviation)

(5)

5

추정적 통계학(Inferential statistics)

• 기술적 통계학은 자료의 특성을 나타내지만 이를 토대로 자 료에 대한 어떤 결론이나 추정을 할 수 없다. 따라서 결론 도 출이나 추정과정을 위해 추정적 통계 기법이 필요하다.

• 추정적 통계학: 표본(sample) 자료를 토대로 전체자료(모집 단: population)의 특성을 추정하기 위한 방법을 설명한다

• 기본 요소:

1) 모집단(population) 2) 표본(sample)

3) 통계적 추정과정(statistical inference)

(6)

통계학의 기본용어: 변수와 자료

6

• 변수(variable)와 자료(data)

1) 변수: 숫자 또는 특성등으로 표현된 값이 경우에 따라 변화되는 것 - 양적변수(quantitative variable): 숫자로 표현된 변수

예) 학생들의 학점, 개인별 소득, 주가 등

- 질적변수(qualitative variable): 특성, 범주등으로 표현된 변수

예) 성별(남,여), 직업(사무직, 노동직), 학력(중졸, 고졸,대졸)등

 질적변수는 코드화를 통해 양적변수로 전환이 가능하다.

 상수(constant): 경우에 따라 변하지 않고 일정하게 고정되어 하나의 값 만 가지는 것

2) 자료: 관심의 대상이 되는 변수들의 관측값 또는 측정값의 집합

예) 2013년도 경제학과 학생들의 학점, 2010~13간의 국가별 GDP등

(7)

7

통계학의 기본용어: 모집단과 표본

모수(Parameter):

모평균, 모분산등 모집단(Population)

표본(Sample)

통계량(Statistic):

표본평균, 표본분산

Subset

• 모집단 (population): 연구대상이 되는 모든 자료들의 집합

 모집단의 특성을 나타내는 기술적 통계치: 모수(parameter)

• 표본(sample) :모집단에서 추출된 일부 자료의 집합

 표본의 특성을 나타내는 기술적 통계치: 통계량(statistic)

(8)

8

통계학의 기본용어: 통계적 추정

• 통계적 추정(statistical Inference): 표본자료를 토대로 하 여 모집단 자료에 대해 추정하거나 결과를 도출하는 일련의 과정을 의미한다

Parameter Population

Sample

Statistic

추정 (Inference)

- 표본자료의 통계량(statistic)을 이용하여 모집단의 모수 (parameter)를 추정하는 과정

(9)

9

통계적 추정(Statistical Inference)

현실적 이유:

• 대규모 크기의 전체 모집단 자료를 직접 조사 분석하는 것은 현실적으로 불가능하며 또한 많은 시간 및 비용이 소요된다

• 모집단의 일부 자료인 표본자료를 이용하는 것이 보다 쉽고 보다 적은 시간 및 비용으로 분석이 가능하므로 표본자료를 이 용하여 모집단 전체자료에 대해 추정하는 것이 바람 직하다.

문제점:

표본자료를 이용한 통계적 추정과정에서 도출된 모집단에 대 한 결론이나 추정결과가 항상 정확하지 않을 수 있다

 이러한 문제점을 해결하기 위해 통계적 추정과정에 대한 신 뢰성 측정(measures of reliability)이 필요하다: 신뢰수준

(confidence level) 또는 유의수준(significance level) 이용

(10)

10

신뢰수준(Confidence level)과 유의수준 (Significance level)

• 신뢰수준(confidence level): 많은 추정과정들이 실행된 가운 데 정확한 결론이나 추정결과를 나타내는 추정과정의 통계적 비율을 나타낸다

-ex) 95%의 신뢰수준: 100번의 추정과정들 중에서 적어도 95 번의 추정과정들이 통계적으로 정확한 결과를 나타낸다는 것 을 의미한다

• 유의수준(significance level ): 여러 번의 추정과정들에서 나 타난 결론들에 내재된 통계적인 오류 또는 에러의 비율을 나 타낸다

- ex) 5%의 유의수준: 추정과정에서 나타난 결론들이 적어도 5%정도의 통계적인 오류가 있으며 따라서 도출된 결론이는 틀 릴 수 있음을 나타낸다

(11)

연습문제

• 컴퓨터 생산관리자는 자사에서 생산되는 컴 퓨터의 5%미만이 불량품이라고 한다. 모집단 으로 부터 1000대의 컴퓨터를 임의 추출하여 조사하니 1%가 불량품이었다

1) 관심의 대상이 되는 모집단은?

2) 표본은?

3) 생산관리자의 주장은 타당한가? 그 이유는?

11

참조

관련 문서

또한 농업테크, 푸드-사이언스, 일부 온라인 플랫폼 기반 서비스 등은 국내 의 소비자들도 국내 기업이 아닌 글로벌 기업의 서비스를 이용하는 것이 가능하므로 해외

그러나 많은 사람들이 이러한 증상을 일시적으로 호소하는 경우도 많으며 치료를 통해 충분히 증상을 해소할 수 있으므로 그대로 방치하기 보다는 자세한 상담과 꾸

이 기술은 고정 입자 방식으로 슬라이스 다결정 실리콘 기판에 분사 처리와 산성 에칭 액에 의한 처리를 결합하여 표면 텍스처 구조를 형성해 표면 반사율을 저감하는

결론적으로 CTA가 DSA보다 뇌동맥류 경부를 평가하는데 우월한 것으로 평가되었고, 특히 DSA에서 경부 분석이 어려 운 뇌동맥류의 경우에는 CTA를 추가적으로 촬영하여