DEPT. OF SPORTS SCIENCE LEE CHAE SAN
제12강
집중경향치, 변산도 및 표준점수
집중경향치central tendency의 미
운동소질과 운동기능 사이의 관계를 조사하기 위해 특징을 분 류하여 발전시켰다고 하자. 일정 기간이 지나 두 집단 사이에 뚜
렷한 차이가 났다. 어떤 특정한 기능을 비교했을 운동소질이 높 은 집단이 탁월한 우수성을 나타냈다.
이 실험의 결과를 논하려 한다. 이 두 집단 사이에는 공통점이 있다는 것을 주의해야 한다. 운동소질이 높은 집단이 모두 높은 기능을 나타 낸 것이 아니며, 운동소질이 낮은 집단이 모두 낮은 기능을 나타낸 것 은 아니다. 사실 운동소질이 높게 나타난 몇몇은 매우 우둔해서 어떤
학습자보다 훨씬 낮게 나타날 수 있다.
정의를 내리면, 전체분포에 대해 한 점수를 대표로 인 정하는 통계적 기준
최빈치mode
전체 분포에 대해 한 점수를 대표로 인정하는 통계적 기준
<최빈치, 중앙치, 평균치>
* Mo로 표시되는 최빈치는 가장 최대의 빈도를 갖는 점수 또는 유목
* 유행하고 있는 의복, 구두, 등이 형과 같이 대표적인, 또는 전형적인 값을 필요로 할 때
집중경향치의 개요
예제 1) 표 1. 의 학부 1학년에게 출 신지를 적어내라고 하였다. 이들의 측정치는 독립된 유목이므로 명명
자료에 속한다. 이 최빈치는 ?
표 1. 스포츠과학부 1년의 출신지 N=110 출신지역 f(빈도)
서울 10
부산 5
대구 3
광주 22
인천 13
전북 47
기타 10
답) 전북
표 2. 다봉분포
X Mpt f 21-23 22 10 18-20 19 10 15-17 16 9 12-14 13 10
9-11 10 8
* 한 분포가(3,4,4,4,5,6,6,7,7,7,8) 한 개 이상의 최빈를 가질 수 있다.
최빈치는 4와 7이며, 이 분포를 쌍봉분포라 한다.
* 하나의 분포가 세 개 이상 의 최빈치를 가질 때
쌍봉분포
다봉분포
표 3. 묶음자료의 최빈치
X Mpt f 21-23 22 6 18-20 19 14 15-17 16 13 12-14 13 19 9-11 10 8 묶음자료의 최빈치
• 가장 많은 빈도(f) 19에 해당 하는 급간은 12-14
• 중간 점수 최빈치 13 예제 2) 표 3. 의 이 최빈치는 ?
중앙치median
* Mdn로 표시되는 중앙치는 50번째 백분위 점수
* 즉 분포의 정확한 중앙점을 결정 N 이 홀수일 때
* 순서대로(최저부터 최고로) 적고, 바로 중앙에 있는 점수가 중앙치
3, 5, 8, 10, 11 ; 중앙점수 , X=8이므로 중앙치는 8.0 N 이 짝수일 때
* 가운데 두 점수 사이의 절반 값 3,3,4,5,7,8; 중앙치-4+5/2=9/2=4.5
분포 중앙에 동일 값이 여러 개 있을 때
a) 1,2,2,3,4,4,4,4,4,5 ; 중앙에 있는 한 쌍의 평균치
X f cf cp
5 1 10 100%
4 5 9 90%
3 1 4 40%
2 2 3 30%
1 1 1 10%
예제 3) 아래 관찰값에 대하여 분포표를 작성하시오?
b) 4는 중앙에 있지 않다. 보다 정밀하게 중앙치를 찾기 위해서는 보간법 사용 답) 중앙치 4.0
예제 3의 b)의 보간법 과정의 4단계
1) 백분위 넓이는 50%이고, 백분점수 넓이는 3.5~4.5 = 1.0점이다.
2) 특정(백분위)와 맨 위의 구간과 비교해 40%가 차이가 나고, 이것은 정확히 구간의 40/50 = 4/5 = 0.8이다.
3) 백분점수의 넓이를, 0.8 * (1.0) = 0.8점
4) 백분점수를 보면, 맨 위 구간이 4.5점이므로 0.8점을 빼면, 4.5점 – 0.8점 = 3.7점이다.
그러므로 백분위 50%는, X = 3.7점 이다.
X cp 4.5 90%
? 50%
3.5 40%
* 비례식으로 계산하면, 1 : x = 50 : 40
50x = 40, x = 40/50 = 0.80 X = 4.5 - 0.80 = 3.70
중앙치는 3.7점
묶음자료의 중앙치
표 1. 묶음자료에서의 중앙치 N=76
X f cf
45-49 1 76 40-44 2 75 35-39 3 73 30-34 6 70 25-29 8 64 20-24 17 56 15-19 26 39 10-14 11 13
5-9 2 2
연습문제 1. 표 1. 묶음 자료의 중앙치를 구하시오.
1) 전체 사례수를 상위반과 하위반으로 양분 2) 누가빈도(cf)에서 N/2인 누가빈도 38이 들어 있는 급간 찾기
3) 찾은 급간 사이에 26명이 있다.
도움말
연습문제 1)의 보간법
X cf 19.5 39
?
14.5 13
* 방법 1, 하위급간에서 더하기, 5 : 26 = X : 25
26x= 5*25, x= 125/26 = 4.81 X = 14.5 + 4.81 = 19.31
중앙치는 19.31
1) 전체 사례수를 상위반과 하위반으로 양분 N/2인 76/2 = 38
2) 누가빈도(cf)에서 N/2인 누가빈도 38이 들어 있는 급간은 15-19 누가빈도 38이 들어 있는 급간의 정확한계는 14.5~19.5
3) 보간법에 의하여 14.5~19.5 사이에 26명이 있으므로 이 26명을 하위 25와 상위 1명으로 나누점을 급간 14.4~19.5 사이에서 구한다.
* 방법2, 상위급간에서 빼기 5 : 26 = X : 1
26x= 5*1, x= 5/26 = 0.19 X = 19.5 - 0.19 = 19.31
중앙치는 19.31
평균치mean
* 분포되어 있는 점수를 다 합하여 점수의 개수로 나누어 계산한다.
* 모집단의 평균치는 그리스 문자 어느 한 표본의 평균치는
μ 로 나타내며,
X로 나타낸다.
표 2. 묶음 자료에서의 평균치의 계산
급간 X’ f fX’
75-79 77 7 593
70-74 72 10 720
65-69 67 12 804
60-64 62 9 558
55-59 57 5 285
50-54 52 3 156
합 N = 46 ∑fX=3062
=
= 66.6
N
∑ fx
= 46
3062
N : 모집단 사례수 n : 표본 사례수
표 2. 간편계산법에 의한 평균치 계산
급간 f X’ fX’
75-79 7 +2 14
70-74 10 +1 10
65-69 12 0 0
60-64 9 -1 -9
55-59 5 -2 -10
50-54 3 -3 -9
합 N = 46 ∑Fx’= 4
N : 모집단 사례수 n : 표본 사례수
1. 평균치 예상 급간
2. 급간의 중간 점(65-69); ; = 67
=67+5(-4/46)=66.6
X’
대칭분포mean
C. 정상분포
D. 쌍봉분포
* 중앙치가 중앙에 온다.
평균치, 중앙치, 최빈치 (하나일 때)가 똑 같다.
* 평균치와 중앙치가 중앙 에 오고, 최빈치(두 개일 때)
가 양쪽에 온다.
비대칭분포mean
A. 정적편포분포
* 평균치가 가장 큰 값, 그 리고 중앙치, 최빈치의 순
* 어려운 시험 점수
B. 부적편포분포
* 최빈치, 중앙치,평균치 순
* 쉬운 시험점수
변산도variability의 의미
분포를 완전히 특정 짓기 위해서 집중경향치에 추가해서 변산치 가 필요하다. 점수가 평균에서 이탈되어 있다는 사실은 점수가 가변적이라는 의미다. 변산도란 가장 기본적인 통계적 개념 중의
하나
예, X대학의 두 학과 입학자들의 IQ 평균이 다 같이 115라면 이 두 집 단은 지적인 능력면에서 비슷한 두 학과임을 알 수 있다. 그러나 이들 두 학과 중의 한 과에서는 IQ 100 이하의 학생이 한 사람도 없을 뿐더 러 IQ 125의 학생들도 없다는 것이 밝혀진 반면에, 다른 학과에서는 범위가 80에서 부터 140까지라는 사실이 밝혀졌다면, 이 두 학과 사 이에는 집중경향에 있어서 차이는 없으나 변산도에서는 큰 차이가 있
다는 것을 나타냄
정의를 내리면, 분포에 있는 점수들이 흩어져 있는지, 아니면 함께 몰려 있는지의 정도를 양적으로 나타냄
80 90 100 110 120 130 140
IQ
그림 1. 평균치는 같으나 변산도가 다른 분포
범위range
* 분포에서 가장 큰 점수에서 가장 작은 점수를 뺀 것.
범위=높은 점수-낮은 점수+1
사분범위 및 사분편차
* 사분범위는 제1과 제3사분간 거리이다. 사분범위=Q3-Q1
* 사분편차는 사분범위의 ½이다.
사분편차(Q)= Q3-Q1/2
변산도 variability의 종류
7 8 5 6
3 4
1 2 9
2 1
10 11 3
Q1 = 4.5
하위25% 상위25%
4분 범위
Q3 = 8 Q1 = 4.5
제1사분면 Q1 = 4.5, 제3사분면 Q3 = 8.0 그러므로 사분범위는 3.5 그림 2. N = 16인 모집단의 점수들의 빈도분포
Q3 = 8 3.5
Σx 2 N
* 표준편차는 분포의 평균을 참고해서 각 점수와 평 균 사이의 간격을 고려하여 변산도를 측정
* 편차 자승합의 평균 평방근
σ = 표준편차 x
2= 편차
N = 사례수
σ =
모집단의 표준편차(σ, SD)와 변량
σ =
Σx 2
N = 6.8 = 2.61
예제 1> N =5인 턱걸이 관찰값의 일련 점 수. 이 점수를 모두 합하면 ∑X=20이고, 평균은 μ=20/5=4. 각 점수의 편차를 계 산한다
평균편차는 항상 0이다(변산도로서 의미 없음) 따라서 편차를 자승한다. 즉 변량이 라 한다.
표준편차는 = 변량의 자승 근
표 1. 표준편차의 계산
피험자 X x x2
A 8 +4 16
B 6 +2 4
C 3 -1 1
D 2 -2 4
E 1 -3 9
N=5 X=4 ∑X=0 ∑x2=34
어떤 운동기능이 01반에서 우수한 학생이 있다고 하자. 이 학생 이 얼마나 우수한지 얼마나 앞서 있는가를 알고 싶어할 것이다.
01반에서는 우수하다고 할 수 있다. 하지만 02반 또는 어느 분반 과 비교하느냐에 따라 우수할 수도 , 열등할 수도 그리고 보통일
수도 있는 것이다.
검사나 조사에서 얻은 원점수는 절대영점이 없거나 있더라도 실제상 의 영점과 다르며, 또한 측정 단위가 다르기 때문에 가감승제를 할 수 없고 서로 비교할 수도 없다. 그래서 이같은 원점수는 분포상에서 상
대적 위치로 표시하여 의미 있는 비교를 가능하게 할 필요가 있다.
따라서 평균과 표준편차의 개념에 기초해서 개인이 평균 이상인지, 혹은 평균 이하인지 알아보기 위한 것이다.
표준점수
* 분포 내에서 각 값의 정확한 위치를 명시한다. 수치는 X와 μ 사이의 표준편차의 수를 세어서 평균으로부터의 간격을 명시
원점수로 z점수 구하기
Z점수로 원점수 구하기 zσ=X- μ X- μ =zσ X= μ +zσ
X- μ
Z = σ
Z점수
+1σ +2σ +3σ +4σ -2σ -1σ
-4σ -3σ 0
-4 -3 -2 -1 0 +1 +2 +3 +4 20 30 40 50 60 70 80
Z점수
T점수 SD
예제 2> 원만이는 체육측정평가 시험 X=60, µ=50, σ=10, 트레이 닝론 시험 X=56 µ=48, σ=4이다. 이때 체육측정평가 z점수는 1.0, 트레이닝론 z점수는 2.0이다.
상대적 수강과목 석차에 의해 원만이는 트레이닝론 강좌를 더 잘 했음을 알 수 있다.
X- μ
Z = σ
Q & A
차시 예고
제13강 표본의 추리통계
출처
송인섭(1994). 통계학의 이해. 서울: 학지사