• 검색 결과가 없습니다.

백분율

문서에서 경영의사소통 (페이지 111-121)

개 요

③ 백분율

백분율은 전체의 수량을 100으로 하여, 나타내려는 수량이 그 중 몇이 되는가를 가리키는 수(퍼센트)로 나타낸다. 기호는

%(퍼센트)이며, 100분의 1이 1%에 해당된다. 백분율은 오래 전부터 실용계산의 기준으로 널리 사용되고 있으며, 원형그래 프 등을 이용하면 이해하기 쉽다.

학습평가

1. 괄호 안에 적절한 용어를 적어 넣어보자.

( )란 집단현상에 대한 구체적인 양적 표현을 반영하는 숫자를 의미한다. 특히 사회집단 또는 자연집단의 상황을 숫자로 나타낸 것이다.

2. 다음은 업무수행 과정에서 흔히 활용하는 통계치와 그에 대한 설명들이다. 적절 하게 연결시켜보도록 하자.

3. 괄호 안에 적절한 용어를 적어 넣어보자.

통계에 사용되는 자료는 ( ), ( ), ( )를 기준으로 파악된다.

4. 괄호 안에 적절한 용어를 적어 넣어보자.

( )는 손쉽게 자료 전체의 성격을 나타낼 수 있지만 극단적인 값에 의해 왜곡될 수도 있다.

2.

직업인으로서 업무를 효과적으로 수행하기 위해서는 방대한 양의 자 료를 효과적으로 요약할 수 있어야 한다. 특히 이러한 과정에서 기본적 인 통계기법의 활용은 매우 필수적이다. 그렇다면 업무수행과정에서 흔 히 접할 수 있는 간단한 통계를 계산하여 보도록 하자.

사 례

표본 관찰값의 범위

선생님: 사실 표준편차라는 말은 여러 사람이 알고 있어도 개념정의는 쉽지 않습니다.

이것을 이해하기 위해서 위와 같이 두 집단의 표본 관찰값을 보면서 생각해보도록 하겠습니다.

K 씨: 두 집단 모두 평균은 비슷하겠네요. 평균이 5로 같으니까요. 그런데 A집단은 B집 단에 비해서 양극으로 나뉘어져 있을 것 같네요. 최대값과 최소값의 차이가 더 크 니까요.

선생님: 아! 훌륭합니다. 지금 이야기 한 관점이 범위라는 개념입니다. 그러니까 자료의 퍼짐을 나타내는 것인데, 최대값과 최소값의 차이를 범위라고 합니다.

L 양: 그것은 쉽게 알 수 있네요. 그럼 표준편차는 무엇이지요?

선생님: 표준편차의 의미를 생각해 보죠. 그럼 L양은 두 집단 중에 어느 집단이 더 넓게 퍼져 있을 것 같은가요?

L 양: A집단이요.

선생님: 왜 그렇게 생각했죠?

L 양: K씨가 범위에 대해서 말씀하지 않았나요?

선생님: 최대, 최소값만 생각하는 범위 말고, 조금 더 자료를 많이 활용할 수 있는 관점 을 생각해보지요.

L 양: 일반적으로 퍼짐이라는 말은 자료값이 평균에서 얼마나 떨어져 있는가를 말하는 것이잖아요. 그렇다면 이렇게 생각해보면 어떨까요?

선생님: 아주 훌륭한 생각입니다. L양이 이야기한 것을 우리는 평균편차라고 합니다. 그 렇다면 표준편차는 무엇일까요?

B-2-나 2 업무에 활용할 수 있는 통계기법은?

활 동

‘표본관찰값의 범위’ 사례를 읽고 범위, 평균, 평균편차 및 표준편차가 의미하는 것 은 무엇인지 각자의 생각을 적어보도록 하자.

개념 의미

범위

평균

평균편차

표준편차

내 용

● 범위와 평균

범위란 관찰값의 흩어진 정도를 나타내는 도구로써 최고값과 최저값 을 가지고 파악하며, 최고값에서 최저값을 뺀 값을 의미한다. 예를 들 어 B집단의 관찰값이 3, 4, 6, 7이라면 최고값이 7이고, 최저값이 3 이기 때문에 최고값에서 최저값을 뺀 값, 즉 7-3=4가 B집단의 범위 가 된다. 범위는 계산이 용이한 장점이 있으나 극단적인 끝값에 의해 좌우되는 단점이 있다.

평균은 관찰값 전부에 대한 정보를 담고 있어 대상집단의 성격을 함축적으로 나타낼 수 있는 값이다. 평균에는 산술평균과 가중평균이 있고 산술평균은 전체 관찰값을 모두 더한 후 관찰값의 개수로 나눈 값을 의미한다. 예를 들어 B집단의 관찰값이 3, 4, 6, 7이라면 B집단의 평균을 구하는 수식은 아래와 같이 표현할 수 있다.

가중평균은 각 관찰값에 자료의 상대적 중요도(가중치)를 곱하여 모두 더한 값을 가중치 의 합계로 나누어 구한다.

● 분산과 표준편차

분산이란 자료의 퍼져있는 정도를 구체적인 수치로 알려주는 도구 이다. 각 관찰값과 평균값과의 제곱을 모두 더한 값을 총 회수로 나 누어 구한다. 더욱 구체적으로 설명하면 각 관찰값과 평균값과의 차 이의 제곱을 모두 합한 값을 개체의 수로 나눈 값을 의미한다. 예를 들어 A집단의 관찰값이 1, 2, 8, 9이고 평균이 5라면 A집단의 분산 은 (1-5)2+(2-5)2+(8-5)2+(9-5)2을 사례수 4(또는 4-1=3)로 나눈 값을 의미한다. 따라서 A집단의 분산은 16+9+9+16=50을 사례수 4(또는 4-1=3)로 나눈 값, 즉 12.5가 된다. (정확한 추정을 위해 표본수보다 하나 작은값으로 나눠준다)

표준편차란 분산값의 제곱근 값을 의미한다. 개념적으로는 평균으로부터 얼마나 떨어져 있는가를 나타내는 개념으로서 앞의 사례에 제시된 평균편차의 개념과 개념적으로는 동일 한 개념이다. 예를 들어 A집단의 분산은 12.5가 되며, 여기서 표준편차는 12.5의 제곱근 값이 된다. 표준편차가 크면 자료들이 넓게 퍼져있고 이질성이 큰 것을 의미하고 작으면 자료들이 집중하여 있고 동질성이 커지게 된다.

학습평가

1. 다음에 제시된 자료들로부터 범위, 평균, 분산, 표준편차는 얼마인지 각자 구해 보도록 하자(계산기를 활용해도 무방함).

개념 정답 계산식

1. 범위

2. 평균

3. 분산 4. 표준편차

B-2-나 3 통계자료를 효과적으로 해석하려면?

3.

직업인으로서 업무수행과정에서 다양한 통계를 접하게 된다. 그렇지만 직업인들은 통계자료를 해석하는데 종종 실수를 하곤 한다. 그렇다면 다 양한 통계자료를 효과적으로 해석하는 방법은 무엇인지 알아보자.

사 례

평균과 표준편차 분석

선생님: 특정 지역에서 임의로 추출한 4인 가구의 가장 30명으 로부터 지난 달 생활비를 조사한 결과 평균이 170만원, 표준 편차가 17만원이 나왔습니다. 30가구의 생활비에 대해 대략 적인 감이 잡히십니까?

K 씨: 약간요. 170만원 정도를 쓰는 사람이 많고 몇 명이 190 만원 정도, 또 일부가 210만원 정도 쓸 것 같은데요.

L 양: 편차가 의미하는 것이 각 가구당 생활비와 평균의 차이 의 평균이라고 해석할 수 있으니까 30가구의 생활비는 평균 170만원과 차이가 클 수도 있고 작을 수도 있을 것 같습니다. 그것들의 평균이 17만원이니까 몇몇은 17만원 이상 큰 차이가 날 것 같고 반 이상은 17만원 미만의 차이가 날 것 같은데요.

활 동

다음에 제시된 자료는 ‘평균과 표준편차 분석’ 사례에 대한 원자료이다. 그렇다면 위의 사례에서 K씨와 L씨는 모두 올바른 해석을 한 것이라고 볼 수 있는 것인가? 혹은 한 명만 올바른 해석을 한 것인가, 아니면 모두 올바르게 해석을 하지 못한 것인가? 각자 의 생각을 적어보도록 하자.

[가구당 월평균 생활비] (단위 : 만원)

내 용

위의 사례와 활동에서도 보았듯이 평균과 표준편차, 두 개의 요약값만으로는 원자료의 전체적인 형태를 추측하기는 불가능하다. 그렇다면 평균과 표준편차 이외의 요약값들에 대 해서 알아보도록 하자.

● 다섯숫자요약(Five Number Summary)

평균과 표준편차만으로는 원자료의 전체적인 형태를 파악하기 어렵기 때문에 우리는 최 소값, 중앙값, 최대값, 하위 25%값, 상위 25%값 등을 활용하며, 이를 다섯숫자요약(Five Number Summary)라고 부른다.

최소값이란 원자료 중 값의 크기가 가장 작은 값을 의미한다. 사례에 제시된 한달 평균 생활비를 예로 들면 우리는 최소값으로부터 한 달 동안 생활비를 가장 적게 쓰는 사람의 수준을 알 수 있을 것이다. 이와는 반대로 최대값이란 원자료 중 값의 크기가 가장 큰 값 을 의미한다. 이로부터 우리는 한달동안 생활비를 가장 많이 쓰는 사람의 수준을 파악할 수 있을 것이다.

중앙값이란 정확하게 중간에 있는 값을 의미한다. 이는 관찰값을 최소값부터 최대값까지 크기에 의하여 배열하였을 때 순서상 중앙에 위치하는 관찰값을 말한다. 예를 들어 46.0, 46.9, 48.2, 48.5, 50.4의 학생 5명 가운데, 즉 세 번째 있는 학생의 체중인 48.2가 중앙 값이 되며, 이는 평균값과는 다르다. 자료값 중 어느 하나가 너무 크거나 작을 때 자료의 특성을 잘 나타낸다.

하위 25%값과 상위 25%값은 원자료를 크기순으로 배열하여 4등분한 값을 의미한다. 백 분위 수의 관점에서 제25백분위수, 제75백분위수로 표기할 수도 있다. 사례에 제시된 한 달 평균 생활비를 예로 들면 우리는 이러한 값으로부터 상위층과 하위층의 경계선을 파악 할 수 있다.

● 평균값과 중앙값

우리는 흔히 평균값을 집단을 대표하는 값으로 활용한다. 그러나 평균값과 중앙값이 다 를 경우에도 평균값이 집단을 대표하는 값이라고 볼 수 있는 것인가 하는 의문이 발생한 다. 다음에 제시된 유형들로부터 올바르게 통계값을 제시하는 방법에 대해서 생각해볼 수 있을 것이다.

B-2-나 3 통계자료를 효과적으로 해석하려면?

위에 제시된 4가지 자료제시 유형 중에서 A유형과 C유형은 잘못된 것이라 할 수 있다.

우리가 살펴보았듯이 평균값과 중앙값은 엄연히 다른 개념이고, 모두 중요한 개념이므로 평균값인지 중앙값인지에 대해서 명확하게 제시해주어야 할 것이다. 이는 원자료에 대한 대표값으로서 정책을 결정한다든지 평가를 받는다든지 할 때 중요한 역할을 하게 되기 때 문이다. 또한, 우리가 통계값을 제시할 때에는 평균값과 중앙값 모두 똑같은 중요도를 갖 고 활용할 필요가 있을 것이다.

학습평가

1. 다음에 제시된 자료들로부터 최소값, 중앙값, 최대값, 하위 25%값, 상위 25%값 등을 구해보도록 하자.

구분 정답

최소값(m) 중앙값(Q

2

) 최대값(M) 하위 25%값(Q

1

) 상위 25%값(Q

3

)

2. 다음은 어느 집단의 평균값과 중앙값을 나타낸 것이다. 이로부터 이 집단은 어 떠한 특징을 갖고 있는지 각자의 생각을 적어보도록 하자.

평균값이 중앙값보다 클 경우 집단의 특징

문서에서 경영의사소통 (페이지 111-121)