• 검색 결과가 없습니다.

제12강 집중경향치, 변산도 및 표준점수

N/A
N/A
Protected

Academic year: 2022

Share "제12강 집중경향치, 변산도 및 표준점수"

Copied!
25
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

DEPT. OF SPORTS SCIENCE LEE CHAE SAN

제12강

집중경향치, 변산도 및 표준점수

(2)

집중경향치central tendency의 미

운동소질과 운동기능 사이의 관계를 조사하기 위해 특징을 분 류하여 발전시켰다고 하자. 일정 기간이 지나 두 집단 사이에 뚜

렷한 차이가 났다. 어떤 특정한 기능을 비교했을 운동소질이 높 은 집단이 탁월한 우수성을 나타냈다.

이 실험의 결과를 논하려 한다. 이 두 집단 사이에는 공통점이 있다는 것을 주의해야 한다. 운동소질이 높은 집단이 모두 높은 기능을 나타 낸 것이 아니며, 운동소질이 낮은 집단이 모두 낮은 기능을 나타낸 것 은 아니다. 사실 운동소질이 높게 나타난 몇몇은 매우 우둔해서 어떤

학습자보다 훨씬 낮게 나타날 수 있다.

정의를 내리면, 전체분포에 대해 한 점수를 대표로 인 정하는 통계적 기준

(3)

최빈치mode

전체 분포에 대해 한 점수를 대표로 인정하는 통계적 기준

<최빈치, 중앙치, 평균치>

* Mo로 표시되는 최빈치는 가장 최대의 빈도를 갖는 점수 또는 유목

* 유행하고 있는 의복, 구두, 등이 형과 같이 대표적인, 또는 전형적인 값을 필요로 할 때

집중경향치의 개요

(4)

예제 1) 표 1. 의 학부 1학년에게 출 신지를 적어내라고 하였다. 이들의 측정치는 독립된 유목이므로 명명

자료에 속한다. 이 최빈치는 ?

표 1. 스포츠과학부 1년의 출신지 N=110 출신지역 f(빈도)

서울 10

부산 5

대구 3

광주 22

인천 13

전북 47

기타 10

답) 전북

(5)

표 2. 다봉분포

X Mpt f 21-23 22 10 18-20 19 10 15-17 16 9 12-14 13 10

9-11 10 8

* 한 분포가(3,4,4,4,5,6,6,7,7,7,8) 한 개 이상의 최빈를 가질 수 있다.

최빈치는 4와 7이며, 이 분포를 쌍봉분포라 한다.

* 하나의 분포가 세 개 이상 의 최빈치를 가질 때

쌍봉분포

다봉분포

(6)

표 3. 묶음자료의 최빈치

X Mpt f 21-23 22 6 18-20 19 14 15-17 16 13 12-14 13 19 9-11 10 8 묶음자료의 최빈치

• 가장 많은 빈도(f) 19에 해당 하는 급간은 12-14

• 중간 점수 최빈치 13 예제 2) 표 3. 의 이 최빈치는 ?

(7)

중앙치median

* Mdn로 표시되는 중앙치는 50번째 백분위 점수

* 즉 분포의 정확한 중앙점을 결정 N 이 홀수일 때

* 순서대로(최저부터 최고로) 적고, 바로 중앙에 있는 점수가 중앙치

3, 5, 8, 10, 11 ; 중앙점수 , X=8이므로 중앙치는 8.0 N 이 짝수일 때

* 가운데 두 점수 사이의 절반 값 3,3,4,5,7,8; 중앙치-4+5/2=9/2=4.5

(8)

분포 중앙에 동일 값이 여러 개 있을 때

a) 1,2,2,3,4,4,4,4,4,5 ; 중앙에 있는 한 쌍의 평균치

X f cf cp

5 1 10 100%

4 5 9 90%

3 1 4 40%

2 2 3 30%

1 1 1 10%

예제 3) 아래 관찰값에 대하여 분포표를 작성하시오?

b) 4는 중앙에 있지 않다. 보다 정밀하게 중앙치를 찾기 위해서는 보간법 사용 답) 중앙치 4.0

(9)

예제 3의 b)의 보간법 과정의 4단계

1) 백분위 넓이는 50%이고, 백분점수 넓이는 3.5~4.5 = 1.0점이다.

2) 특정(백분위)와 맨 위의 구간과 비교해 40%가 차이가 나고, 이것은 정확히 구간의 40/50 = 4/5 = 0.8이다.

3) 백분점수의 넓이를, 0.8 * (1.0) = 0.8점

4) 백분점수를 보면, 맨 위 구간이 4.5점이므로 0.8점을 빼면, 4.5점 – 0.8점 = 3.7점이다.

그러므로 백분위 50%는, X = 3.7점 이다.

X cp 4.5 90%

? 50%

3.5 40%

* 비례식으로 계산하면, 1 : x = 50 : 40

50x = 40, x = 40/50 = 0.80 X = 4.5 - 0.80 = 3.70

중앙치는 3.7점

(10)

묶음자료의 중앙치

표 1. 묶음자료에서의 중앙치 N=76

X f cf

45-49 1 76 40-44 2 75 35-39 3 73 30-34 6 70 25-29 8 64 20-24 17 56 15-19 26 39 10-14 11 13

5-9 2 2

연습문제 1. 표 1. 묶음 자료의 중앙치를 구하시오.

1) 전체 사례수를 상위반과 하위반으로 양분 2) 누가빈도(cf)에서 N/2인 누가빈도 38이 들어 있는 급간 찾기

3) 찾은 급간 사이에 26명이 있다.

도움말

(11)

연습문제 1)의 보간법

X cf 19.5 39

?

14.5 13

* 방법 1, 하위급간에서 더하기, 5 : 26 = X : 25

26x= 5*25, x= 125/26 = 4.81 X = 14.5 + 4.81 = 19.31

중앙치는 19.31

1) 전체 사례수를 상위반과 하위반으로 양분 N/2인 76/2 = 38

2) 누가빈도(cf)에서 N/2인 누가빈도 38이 들어 있는 급간은 15-19 누가빈도 38이 들어 있는 급간의 정확한계는 14.5~19.5

3) 보간법에 의하여 14.5~19.5 사이에 26명이 있으므로 이 26명을 하위 25와 상위 1명으로 나누점을 급간 14.4~19.5 사이에서 구한다.

* 방법2, 상위급간에서 빼기 5 : 26 = X : 1

26x= 5*1, x= 5/26 = 0.19 X = 19.5 - 0.19 = 19.31

중앙치는 19.31

(12)

평균치mean

* 분포되어 있는 점수를 다 합하여 점수의 개수로 나누어 계산한다.

* 모집단의 평균치는 그리스 문자 어느 한 표본의 평균치는

μ 로 나타내며,

X로 나타낸다.

(13)

표 2. 묶음 자료에서의 평균치의 계산

급간 X’ f fX’

75-79 77 7 593

70-74 72 10 720

65-69 67 12 804

60-64 62 9 558

55-59 57 5 285

50-54 52 3 156

N = 46 fX=3062

=

= 66.6

N

∑ fx

= 46

3062

N : 모집단 사례수 n : 표본 사례수

(14)

표 2. 간편계산법에 의한 평균치 계산

급간 f X’ fX’

75-79 7 +2 14

70-74 10 +1 10

65-69 12 0 0

60-64 9 -1 -9

55-59 5 -2 -10

50-54 3 -3 -9

N = 46 Fx’= 4

N : 모집단 사례수 n : 표본 사례수

1. 평균치 예상 급간

2. 급간의 중간 점(65-69); ; = 67

=67+5(-4/46)=66.6

X’

(15)

대칭분포mean

C. 정상분포

D. 쌍봉분포

* 중앙치가 중앙에 온다.

평균치, 중앙치, 최빈치 (하나일 때)가 똑 같다.

* 평균치와 중앙치가 중앙 에 오고, 최빈치(두 개일 때)

가 양쪽에 온다.

비대칭분포mean

A. 정적편포분포

* 평균치가 가장 큰 값, 그 리고 중앙치, 최빈치의 순

* 어려운 시험 점수

B. 부적편포분포

* 최빈치, 중앙치,평균치 순

* 쉬운 시험점수

(16)

변산도variability의 의미

분포를 완전히 특정 짓기 위해서 집중경향치에 추가해서 변산치 가 필요하다. 점수가 평균에서 이탈되어 있다는 사실은 점수가 가변적이라는 의미다. 변산도란 가장 기본적인 통계적 개념 중의

하나

예, X대학의 두 학과 입학자들의 IQ 평균이 다 같이 115라면 이 두 집 단은 지적인 능력면에서 비슷한 두 학과임을 알 수 있다. 그러나 이들 두 학과 중의 한 과에서는 IQ 100 이하의 학생이 한 사람도 없을 뿐더 러 IQ 125의 학생들도 없다는 것이 밝혀진 반면에, 다른 학과에서는 범위가 80에서 부터 140까지라는 사실이 밝혀졌다면, 이 두 학과 사 이에는 집중경향에 있어서 차이는 없으나 변산도에서는 큰 차이가 있

다는 것을 나타냄

정의를 내리면, 분포에 있는 점수들이 흩어져 있는지, 아니면 함께 몰려 있는지의 정도를 양적으로 나타냄

(17)

80 90 100 110 120 130 140

IQ

그림 1. 평균치는 같으나 변산도가 다른 분포

(18)

범위range

* 분포에서 가장 큰 점수에서 가장 작은 점수를 뺀 것.

범위=높은 점수-낮은 점수+1

사분범위 및 사분편차

* 사분범위는 제1과 제3사분간 거리이다. 사분범위=Q3-Q1

* 사분편차는 사분범위의 ½이다.

사분편차(Q)= Q3-Q1/2

변산도 variability의 종류

(19)

7 8 5 6

3 4

1 2 9

2 1

10 11 3

Q1 = 4.5

하위25% 상위25%

4분 범위

Q3 = 8 Q1 = 4.5

제1사분면 Q1 = 4.5, 제3사분면 Q3 = 8.0 그러므로 사분범위는 3.5 그림 2. N = 16인 모집단의 점수들의 빈도분포

Q3 = 8 3.5

(20)

Σx 2 N

* 표준편차는 분포의 평균을 참고해서 각 점수와 평 균 사이의 간격을 고려하여 변산도를 측정

* 편차 자승합의 평균 평방근

σ = 표준편차 x

2

= 편차

N = 사례수

σ =

모집단의 표준편차(σ, SD)와 변량

(21)

σ =

Σx 2

N = 6.8 = 2.61

예제 1> N =5인 턱걸이 관찰값의 일련 점 수. 이 점수를 모두 합하면 ∑X=20이고, 평균은 μ=20/5=4. 각 점수의 편차를 계 산한다

평균편차는 항상 0이다(변산도로서 의미 없음) 따라서 편차를 자승한다. 즉 변량이 라 한다.

표준편차는 = 변량의 자승 근

표 1. 표준편차의 계산

피험자 X x x2

A 8 +4 16

B 6 +2 4

C 3 -1 1

D 2 -2 4

E 1 -3 9

N=5 X=4 X=0 x2=34

(22)

어떤 운동기능이 01반에서 우수한 학생이 있다고 하자. 이 학생 이 얼마나 우수한지 얼마나 앞서 있는가를 알고 싶어할 것이다.

01반에서는 우수하다고 할 수 있다. 하지만 02반 또는 어느 분반 과 비교하느냐에 따라 우수할 수도 , 열등할 수도 그리고 보통일

수도 있는 것이다.

검사나 조사에서 얻은 원점수는 절대영점이 없거나 있더라도 실제상 의 영점과 다르며, 또한 측정 단위가 다르기 때문에 가감승제를 할 수 없고 서로 비교할 수도 없다. 그래서 이같은 원점수는 분포상에서 상

대적 위치로 표시하여 의미 있는 비교를 가능하게 할 필요가 있다.

따라서 평균과 표준편차의 개념에 기초해서 개인이 평균 이상인지, 혹은 평균 이하인지 알아보기 위한 것이다.

표준점수

(23)

* 분포 내에서 각 값의 정확한 위치를 명시한다. 수치는 X와 μ 사이의 표준편차의 수를 세어서 평균으로부터의 간격을 명시

원점수로 z점수 구하기

Z점수로 원점수 구하기 zσ=X- μ X- μ =zσ X= μ +zσ

X- μ

Z = σ

Z점수

(24)

+1σ +2σ +3σ +4σ -2σ -1σ

-4σ -3σ 0

-4 -3 -2 -1 0 +1 +2 +3 +4 20 30 40 50 60 70 80

Z점수

T점수 SD

예제 2> 원만이는 체육측정평가 시험 X=60, µ=50, σ=10, 트레이 닝론 시험 X=56 µ=48, σ=4이다. 이때 체육측정평가 z점수는 1.0, 트레이닝론 z점수는 2.0이다.

상대적 수강과목 석차에 의해 원만이는 트레이닝론 강좌를 더 잘 했음을 알 수 있다.

X- μ

Z = σ

(25)

Q & A

차시 예고

제13강 표본의 추리통계

출처

송인섭(1994). 통계학의 이해. 서울: 학지사

참조

관련 문서

이상의 결과들 가운데 연중 수온이 가장 높은 시기인 8월에 교잡종, 참돔 , 긴키돔의 glucose의 농도가 가장 낮은 농도를 나타낸 점과 GPT의 농도가 8월에 높은 농도를

넷째 사회적 지지에 따른 가족의 건강성도 네 하위영역 모 두 사회적 지지가 높은 집단이 중간 집단과 낮은 집단에 비 해 가족의 건강성을 높게 인지하고 있는

표층은 낙동강하구와 마산만 및 진해만 내측의 일부해역에서 높게 , 저층은 행암만과 진해만 중앙의 대부분해역에서 높은 분포를 나타내었으며 , 표․저층 모두

표층은 마산만 내측 , 진동만 및 고현만에서 높게, 울산, 낙동강하구 및 진해만 남쪽의 일부해역에서 낮은 분포를 나타내었으며 , 저층은 진동만과 진해만의 중앙부

실패회피 요인 모두 낮은 비완벽주의 집단에 비해 성취추 구 요인과 실패회피 요인 모두 높은 혼합집단 간 차이로 인해 나타났다. 다시 말해 비완벽주의 집단에 비해 혼합

본 연구에서 뇌경색환자 간호과정에 대한 이론적 지식 정도는 시나리오 적용 후 실험군과 대조군 모두 유의하 게 상승하였다. 그러나 사후조사에서 실험군이 대조군에

부정적 영향 항목에서는 운영․관리상 예산과 관리인원의 증가항목에서 정보와 자원의 영향정도가 낮은 집단의 평균이 3.42, 높은 집단의 평균이 3.74로 높은

-두 사후분석 방법 모두 프로그램 C와 D간의 차이가 있는 것으로 나타나는데, 즉 판매실적은 프로그램D가 높은 것으로 나타난 반면, 프로그램 C가