• 검색 결과가 없습니다.

가중평균

N/A
N/A
Protected

Academic year: 2022

Share "가중평균"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

가중평균과 그룹화 자료 (The weighted mean and working with grouped data)

가중평균

그룹화 자료의 평균

그룹화 자료의 분산

그룹화 자료의 표준편차

(2)

가중평균 (weighted mean)

 관찰값의 중요도를 반영한 가중치를 각각의 자료값에 부여하여 평균을 계산할 때, 이러한 평균을 ‘가중 평균’

이라고 한다.

 학점(GPA)을 계산할 때, 가중치는 각 등급(grade)에 해당하는 학점수이다.

 관찰값이 중요도에 있어서 서로 다를 때, 분석자는 각 관찰값이 가지는 중요도를 가장 잘 반영할 수 있는

가중치를 선택하여야 한다.

(3)

가중평균

i i i

x w x

  w

w x

i ii

x   w

여기서:

x

i = i 번째 관찰값

w

i = i 번째 관찰값의 가중치

(4)

그룹화된 자료 (grouped data)

 가중평균 계산법이 그룹화된 자료의 평균, 분산, 표준편차의 대략적인 값을 구하는데 사용된다.

 가중평균을 계산하기 위해, 각 계급의 중간점을 그 계급의 평균처럼 가정하여 사용한다.

 계급의 도수를 가중치로 사용하여 계급 중간점들의 가중평균을 계산한다.

 분산과 표준편차를 계산할 때도 유사한 방법으로 계급의 도수를 가중치로 사용한다.

(5)

그룹화 자료의 평균

i i

x f M

  n f M

i i

x   n

N M f

i i

 

N

M f

i i

 

여기서:

f

i = i 계급의 (빈)도수

M

i = i 계급의 중간점

 표본평균

 모집단 평균

(6)

 앞선 예에서 본 70채의 아파트 표본 월세 자료가 아래와 같이 도수분포 형식으로 그룹 화되어 있다 .

Rent ($) Frequency

420-439 8

440-459 17 460-479 12

480-499 8

500-519 7

520-539 4

540-559 2

560-579 4

580-599 2

600-619 6

그룹화 자료의 표본평균

(7)

그룹화 자료의 표본 평균

이런 근사값은 실제 평균인 $490.80과는

$2.41 정도 차이가 있다.

34,525

493.21 x  34,525 70 

493.21 x  70 

Rent ($) fi 420-439 8 440-459 17 460-479 12 480-499 8 500-519 7 520-539 4 540-559 2 560-579 4 580-599 2 600-619 6 Total 70

Mi 429.5 449.5 469.5 489.5 509.5 529.5 549.5 569.5 589.5 609.5

fiMi 3436.0 7641.5 5634.0 3916.0 3566.5 2118.0 1099.0 2278.0 1179.0 3657.0 34525.0

(8)

그룹화된 자료의 분산

s f M x

n

i i

2

2

  1 

( )

s f M x

n

i i

2

2

  1 

( )

2

 f M  

2

N

i

(

i

)

2

 f M  

2

N

i

(

i

)

 표본의 경우

 모집단의 경우

(9)

Rent ($) fi 420-439 8 440-459 17 460-479 12 480-499 8 500-519 7 520-539 4 540-559 2 560-579 4 580-599 2 600-619 6 Total 70

Mi 429.5 449.5 469.5 489.5 509.5 529.5 549.5 569.5 589.5 609.5

그룹화 자료에서 표본분산

Mi - x -63.7 -43.7 -23.7 -3.7 16.3 36.3 56.3 76.3 96.3 116.3

f i(Mi - x )2 32471.71 32479.59 6745.97 110.11 1857.55 5267.86 6337.13 23280.66 18543.53 81140.18 208234.29 (Mi - x )2

4058.96 1910.56 562.16 13.76 265.36 1316.96 3168.56 5820.16 9271.76 13523.36

계속

(10)

3,017.89 54.94 s  3,017.89 54.94 

s 

s

2 = 208,234.29/(70 – 1) = 3,017.89

이러한 근사값은 실제 표준편차인 $54.74와는 겨우 $.20 정도 차이가 난다.

그룹화 자료에서 표본 분산

 표본 분산

 표본 표준편차

(11)

3장 끝, Part B

참조

관련 문서

Data (tables 1-5) presents the range, mean ± SEM and significant differences in various biochemical, haematological and thyroid hormone levels in Kathiawari horses of same

The object position in the current image sequence can be estimated with past object positions, mean-shift vectors, and a hypothesis: the object moved as a mean-shift

Histograms of the grouped frequency distribution for blade length, plant weight, and stipe length and diameter of the present population are shown in Fig.. In the monthly

In the real data example, we employ two threshold variables: one is simply grand mean of the entire time series and the other is the local constant mean which

Relative mean sea level (RMSL) includes land movements, because it is based on the data recorded by tide gauge established on the ground expected to be stable.. Absolute

Issues and Challenges in the Extraction and Mapping of Linked Open Data Resources with Recommender

The efficiency of the proposed method is illustrated with the numerical results on randomly generated synthetic/deterministic data and gene expression data, in comparison

However, the mean 25(OH)D values were decreased significantly with decreasing eGFR levels in moderate and severe chronic kidney disease stages.. Also, the mean ACR