• 검색 결과가 없습니다.

위치 척도

N/A
N/A
Protected

Academic year: 2022

Share "위치 척도"

Copied!
34
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

3 장

기술통계 : 수치 척도 Part A

위치 척도

변동성 척도

(2)

위치척도 (measures of location)

척도들이 표본으로부터 추출된 자료로부터 계산된다면, 이를

표본통계량(sam ple statistic)이라 한다.

척도들이 모집단의 자료로부터

도출된다면, 모집단 모수(population param eter)라고 한다.

표본통계량은 해당 모수의

점 추정량(point estim ator)이다.

 평균

 중앙값

 최빈값

 백분위수

 사분위수

(3)

평균 (mean)

자료집합의 평균은 모든 자료값들의 평 균이다 .

표본평균 은 모집단 평균  의 점추

정량 이다 . xx

(4)

표본평균 (sample mean)

표본 관찰값의 수

n개의 관찰값의 합

x

i

x   n x

i

x   n

(5)

모집단 평균 (population mean)

모집단 관찰값의 수

N 개 관찰값의 합

x

i

   N x

i

   N

(6)

 어느 대학가에서 표본으로 간이 아파트 (efficiency apartments ) 70채가 무작위 선정되었다.

 이 아파트의 월세는 오름차순으로 다음 슬라이더에 나타나 있다.

표본 평균

 예 : 아파트 임대

(7)

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

표본 평균

(8)

표본 평균

34,356 490.80 70

x

i

x   n34,356 490.80 70

x

i

x   n  

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

(9)

중앙값 (median)

자료에 극단값이 포함되어 있을 경우, 중앙값은 중심위치를 측정하는 데에 있어서 선호된다

 몇 몇의 극단값을 갖는 소득이나 재산은 평균을 부풀릴 수 있다.

연소득이나 재산 자료에서는 중앙값이 위치척도로 자주 사용된다.

중앙값은 자료가 순서대로(오름차순) 배열되어 있을 때 중앙에 있는 값을 의미한다.

(10)

중앙값

12 14 18 19 26 27 27

 자료의 수가 홀수일 경우:

오름차순 26 18 27 12 14 27 19 7개 관찰값

중앙값은 가운데 값이다.

중앙값 = 19

(11)

12 14 18 19 26 27 27

중앙값

 자료의 수가 짝수일 경우:

오름차순 26 18 27 12 14 27 30 8 개 관찰값

중앙값은 중앙에 있는 두 개 숫자의 평균이다. 중앙값 = (19 + 26)/2 = 22.5

19 30

(12)

중앙값

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

35, 36번째 값의 평균:

중앙값 = (475 + 475)/2 = 475

(13)

최빈값 (mode)

 최빈값은 가장 빈번하게 나타나는 값이다.

가장 빈번하게 나타나는 값이 2개 이상이 있을 수도 있다.

만약 자료가 2개의 최빈값을 가진다면, 이를 이중모드(bim odal)라고 한다.

만약 자료가 3개 이상의 최빈값을 가진다면, 이를 다모드(multimodal)라고 한다.

(14)

최빈값

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

450 이 가장 많다 (7 번) 최빈값 = 450

(15)

백분위수 (percentiles)

 백분위수는 가장 작은 값부터 가장 큰 값 사이에 자료가 어떻게 퍼져 있는지에 대한 정보를 제공한다.

 대학의 입학시험성적은 주로 백분위수로 보고된다.

(16)

백분위수

 p 백분위수는 적어도 관찰값의 p 퍼센트

가 그 값과 같거나 작은 값이다 . 그리고 적어도 관찰값의 (100- p) 퍼센트는 p

분위수와 같거나 더 큰 값을 가진다 .

(17)

백분위수

자료를 크기 순서대로 배열한다(오름차순).

지표 (index)i, p 백분위수의 위치를 계산한다.

i = (p/100)n

만약 i 가 정수가 아니라면, 올림한다. p 백분위수는

i번째 위치한 값이다.

만약

i 정수라면, p 백분위수는 i 와 i+1 번째 위치한

값의 평균이다.

(18)

90

th

백분위수

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

i = (p/100)n = (90/100)70 = 63

63, 64번째 값의 평균:

90 백분위수 = (580 + 590)/2 = 585

(19)

90

th

백분위수

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

“적어도 관찰값의 90%가

585 보다 작거나 같다.”

“적어도 관찰값의 10%가

585 보다 크거나 같다.”

63/70 = .9 또는 90% 7/70 = .1 또는 10%

(20)

사분위수 (quartiles)

 사분위수는 특정 백분위수이다.

 1사분위수 = 25th 백분위수

 2사분위수 = 50th 백분위수 = 중앙값

 3사분위수 = 75th 백분위수

(21)

3 사분위수

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

3사분위수 = 75th 백분위수

i = (p/100)n = (75/100)70 = 52.5 = 53

3사분위수 = 525

(22)

변동성 측정 (measures of variability)

 위치를 측정하는 것 외에도 변동성(산포도)을 측정하는 것이 필요할 때가 있다.

 예를 들어, 공급자 A 또는 공급자 B를 선정 할 때, 각각의 평균 배달기간 뿐만 아니라 각각의 배달기간 변동성도 고려하여야 한다.

(23)

변동성 측정

 범위

 사분위수 범위

 분산

 표준편차

 변동계수

(24)

범위 (range)

 범위는 최대값과 최소값의 차이이다.

 변동성을 측정하는 가장 단순한 방법이다.

 범위는 최대값과 최소값에 영향을 많이 받는다.

(25)

범위

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

범위 = 최대값 - 최소값

= 615 - 425 = 190

(26)

사분위수 범위 (interquartile range)

 사분위수 범위는 3사분위수와 1사분위수의 차이이다.

사분위수 범위는 자료의 중앙 50%의 범위를 의미한다.

 이는 극단값의 영향을 줄일 수 있다.

(27)

사분위수 범위

425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615

3사분위수 (Q3) = 525 1사분위수 (Q1) = 445

사분위수 범위 = Q3 - Q1 = 525 - 445 = 80

(28)

분산은 자료 모두를 사용하여 그 자료의 변동성을 측정하는 도구이다.

분산 (variance)

분산은 각각의 관찰값 (xi)과 평균 ( 표본평균 , 모집단평균

과의 차이에 기초한다.

xx

(29)

분산

분산은 아래와 같이 구한다:

분산은 각각의 자료값과 평균과의 차이에 대한 제곱의 평균이다.

표본 분산 모집단 분산

2 (x

)2 N

2 (xi

)2 N

s xi x i

n

2

2

 1

( )

s xi x

n

2

2

 1

( )

(30)

표준편차 (standard deviation)

표준편차는 분산에 제곱근(square root)을 취한 값이다.

표준편차는 원래의 자료에서 사용된 단위와 동일한 단위로 측정되므로 분산보다 해석이 용이하다.

(31)

표준편차는 아래와 같이 계산된다:

표본표준편차 모집단표준편차

표준편차

ss

2

ss

2

     

22

(32)

변동계수는 아래와 같이 계산된다:

변동계수 (coefficient of variance)

100 % s

x

  

 

s 100 %  x

  

 

 

변동계수는 표준편차가 평균에 비하여 얼마나 큰지를 나타낸다.

표본의 경우 모집단의 경우

100 %

 

  

  100 % 

 

  

 

(33)

   

       

   

   

54.74

100 % 100 % 11.15%

490.80 s

x

   

       

   

   

54.74

100 % 100 % 11.15%

490.80 s

x

2

2 ( )

2,996.16 1

xi x

s n

  

2

2 ( )

2,996.16 1

xi x

s n

  

2

2996.47 54.74 ss

2

 2996.47 54.74 

ss  

표준편차는 평균의 약 11% 이다.

 분산

 표준편차

 변동계수

분산 , 표준편차, 변동계수

(34)

3 장 끝, Part A

참조

관련 문서

전체 이온 반응식은 모든 가용성 이온 물질을 해리된 이온으로 표시한다.. 이 용액에서 종류에 대한 가장

 건강에 부정적인 영향을 미치는 행동을 바꾸기 위해 어 떻게 행동 수정이 사용될 수 있는지에 대한 보기를 제시 한다..  가장

 엔터테인먼트 스토리텔링은 디지털 스토리텔링 중 가장 큰 부분을 차지하는 디지털 콘텐츠들을 주로 제작하는 스토리텔링으로 디지 털 영화, 디지털 애니메이션,

소나기 구름과 같은 작은 규모의 현상들은 국지적인 기 상현상에 큰 영향을 줄 수 있으며 나아가 전체 대기 시스템의 가장 중요한 요소일 수도 있다.. 그러한

• 가장 효율적인 방법으로 최고의 제품을 생산하는 기술이 없이는. • 가장 효율적인 방법으로 최고의 제품을 생산하는 기술이

한국경제연구원에서는

- 설문조사 결과 학생들은 공간지원을 가장 필요로 하는 것으로 나타남에 따라 창업동아리 수 대비 지원공간 부족 여부 진단 - 창업활성화에 대한 의지가 강한 대학의

measurement)에 따라 가장 낮은 수준인 명목 척도(nominal scale), 순위척도(ordinal scale), 등간척도(interval scale), 그리고 가장 높은 수 준인 비율척도(ratio scale)