• 검색 결과가 없습니다.

6 통계

문서에서 주제 선정하기 1 (페이지 37-40)

통계

35

6

통계는 기술통계와 추리통계로 나뉜다. 기술통계는 수집된 자료의 특성치를 구하는 것이며, 추리통계는 표본에서 얻은 통계치를 가지고 모집단의 모수치를 추정하는 통계적 방법이다.

가. 중심 경향성

나. 분산도

a. 최빈수

a. 범위 b. 평균

c. 중간값

분산도는 개별 값이 다른 값과 어떻게 다른지를 나타내며 ‘편차’, ‘범위’, ‘분산’으로 알 수 있다. 편차를 통해 평균과 얼마나 다른지를 알 수 있으며, 평균으로부터 퍼져 있을수록 값이 커진다. 분산도를 측정하는 방법으로 범위, 사분위수 범위, 표준편차, 분산의 4가지가 있다.

최빈수는 데이터세트에서 가장 많이 보이는 수를 말한다. 최빈값은 한 개의 값만 있지 않고, 같은 빈도수를 갖는 여러 개의 값이 될 수도 있다.

범위는 분산도를 측정하는 가장 일반적인 방법으로 데이터가 어떻게 퍼져 있는지 나타낸다. 범위는 가장 작은 수와 큰 수 사이의 차이를 측정하여 계산한다.

평균을 계산하는 방법은 모든 값들을 더해서 값들의 개수로 나누는 것이다. 여러 실험을 진행하였고 그 값들을 비교하고 싶다면 평균값을 구하면 된다. 평균은 데이터 값이 거의 대칭을 이룰 때 유용하며, 이상치가 존재할 때에는 데이터가 비대칭이므로 평균 측정에서 오류가 생길 수 있다. 이상치가 있을 때에는 평균보다는 중간값이 더 유용할 수 있다.

중간값은 숫자들을 낮은 것부터 높은 것으로 순서대로 나열하여 가장 가운데 값을 나타낸다. 홀수개의 데이터들이 있을 때는 가운데 값을 의미하나, 짝수개의 데이터들의 중간값은 2개일 수도 있다.

이상치들이 있을 때 중간값을 사용한다.

✽온도 측정 결과가 12, 12, 12, 14, 14, 15, 15, 15, 15, 37, 39 이라면, 가장 많이 나온 15가 최빈수이다.

✽만일 12, 12, 13, 14, 14, 15, 15, 15, 15, 37, 39 라는 온도 값이 있을 때, 범위는 39-12=27이 된다.

✽이상치: 아주 특별히 크거나 아주 작은 관측값, 관측된 다른 값들과는 달리 매우 동떨어진 값

b. 사분위수 범위(=IOQ)

IOQ는 데이터 세트를 도표/그래프에서 네 구간으로 나누어 표현하는데, 측정한 데이터를 각각 25%씩 나눈다. 사분위수 범위는 이상치 데이터를 측정할 때 유용하다.

통계

37

6

c. 표준편차(=SD)

d. 분산

표준편차(=SD)는 변이성을 알아볼 때 가장 빈번하게 사용하는 방법이다. SD가 클수록 각각의 데이터가 평균으로부터 멀리 떨어져 있음을 의미하며, 낮은 SD를 가질수록 평균주위에 데이터들이 몰려있음을 알 수 있다. 모집단을 대표하는 표본이 많을수록 통계적으로 더 정확하므로, 실험을 구상할 때 4-10개 정도가 실험군과 대조군에 포함되어야 한다.

분산은 표준편차의 제곱이다. 분산은 평균으로부터의 평균적인 거리와 더불어 숫자들이 서로 얼마나 퍼져 있는지를 알려주기 때문에 항상 표준편차와 같이 표시되어야 한다.

✽만일 12, 12, 13, 14, 14, 15, 15, 15, 15, 37, 39에서 중간값은 15이다. 낮은 사분위수 중간값은 13이고 높은 사분위수 중간값은 15이다. 사분위수 범위를 구하기 위해서는 이 두 값 사이의 차를 구하면 된다. 즉 15-13=2이다.

가설: 둘 또는 그 이상의 변수간의 관계에 대한 잠정적인 해답을 제시한 진술문이다.

연구가설: 연구문제에 대한 잠정적인 해답으로서 변인의 관계성에 대한 일반적인 진술을 연구가설이라 함.

예 ‘소득수준이 높을수록 사회정책에 비판적 태도를 가질 것이다.’

영가설: ‘집단 간 차이가 없음’으로 정의.

예 ‘소득 수준이 높은 집단과 낮은 집단 간에는 사회정책에 대한 비판적 태도에서 차이가 없을 것이다.’

대안가설: 영가설과 대립관계에 놓여 있는 가설.

예 ‘소득수준이 높은 집단과 낮은 집단 간에는 사회 정책에 대한 비판적 태도에서 차이를 보일 것이다.’

6.2 추리 통계

추리 통계는 수집된 자료로 그 자료가 추출된 모집단의 현상이나 특징을 추정, 예견, 일반화하려는 통계이다.

추리 통계는 그룹간의 차이가 우연인지 실험조치에 따른 결과인 지룰 수학적으로 판단하도록 도와주므로 자료 수집에 신중을 기해야 한다. 추리 통계방법은 ‘가설 검증’, ‘t-test’, ‘ANOVA’, ‘카이 제곱’, ‘상관관계’ 등이 있다.

가. 가설 검증

가설검증은 모집단의 특성에 대한 어떤 가설을 설정한 뒤 표본의 특성치를 통해 그 가설에 대한 채택 여부를 결정하는 방법이다. 연구가설을 영가설로 검증하는 방법으로, 이때 영가설은 통계적으로 기각하기 위해 설정한 가설이다.

추리 통계를 통해 그룹 간의 차이가 유의하다면, 영가설이 틀렸다는 증거를 가지게 되므로 영가설을 기각하고 대안 가설을 받아들일 수 있다.

나. t-test

문서에서 주제 선정하기 1 (페이지 37-40)

관련 문서