[제 9 장] 내용분석 및 기술통계

(1)

www.withview.com

위드뷰는 함께 보는 열린 학습공간입니다.

이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.

[제 9 장] 내용분석 및 기술통계

^학습과정

− ^{내용분석의 종류}

− ^{내용분석의 단계}

− ^기술통계

− ^{분석기법의 종류}

− ^통계분석

(1) 내용분석의 종류

− 질적분석의 의미 : 주제의 성격에 따라 양적으로 분석할 수 없는 내용의 분석, 비모수통계

− 양적분석의 의미 : 양적분석의 초기형태로 언어나 주제의 발생빈도, 지면의 단위나 길이, 방송시간 등 양적으로 알 수 있게 하는 분석방법, 모수통계

(2) 분석내용의 단계 1. 모집단과 표본

− 통계의 주목적은 모집단의 성격을 파악하는 것, 여기에는 전수조사와 표본조사가 있음

− 모집단 : 평균µ^{, 분산}σ²

− 표본 : 평균X^{, 분산}S

2. 자료의 형태

− 비수치적 질적자료 : 단지 어떤 범주에 속하는지를 구분해 주는 자료

− 양적자료 : 수치 척도에 의해 측정된 자료

(3) 기술통계

− 기술통계 : 자료분포의 모양과 형태를 파악하는데 주안점 1. 중심위치의 척도

− 자료들을 대표할 수 있는 대표값으로 자료분포의 중심점을 나타내며 평균, 중위수, 최빈수 등 i. 평균 : 산술평균, 기하평균, 조화평균, 가중평균, 중앙평균, 추리통계의 가장 큰 관심사가 표본의

평균, 분산, 비율을 측정에 모집단의 평균, 분산, 비율을 추정하는 것

ii. 중위수(중앙값) : 위치적인 대표값으로 자료를 크기순서대로 나열했을 때 중앙에 위치하는 값 iii. 최빈수(최빈값) : 자료의 분포에서 가장 많은 빈도를 갖는 관찰 값, 주로 질적자료분석에 활용

− 좌로 치우친 분포 : 최빈값 > 중앙값 > 평균

− 우로 치우친 분포 : 평균 < 중앙값 < 최빈값 2. 산포의 척도

− 평균은 같다고 해도 분포의 형태가 다를 경우 발생

− 분포란 집단내 값들이 중앙에서 얼마나 멀리 떨어져 있는가를 나타내는 형상

i. 범위 : 자료의 최대값과 최소값의 범위, 자료분포의 폭 파악, 자료의 밀집정도는 파악이 불가

(2)

위드뷰는 함께 보는 열린 학습공간입니다.

이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.

ii. 사분위간 범위 : 최대와 최소의 일정부분을 제외한 나머지로 범위산정, 이를 산포의 척도로 iii. 표준편차 : 각각의 관찰치와 표본평균과의 차이, 편차의 합은 항상 0 이 되어야

iv. 분산 : 편차들의 제곱합

v. 절대평방오차 : 표본평균에서 각 관찰치의 편차를 절대값으로 표기

vi. 왜도 : 자료가 좌우로 치우친 정도를 나타내는 척도로서 -3 에서 +3 의 값을 가짐 vii. 첨도 : 분포가 중심근처에서 퍼져있는 정도를 측정, 표준편차가 작을수록 높아짐 viii. 변동계수 : 변동계수가 클수록 자료의 분포는 평균에서 넓게 분포

− 신뢰구간

i. 1

σ

^{= 평균}± 1

σ

^{= 68.26%}

ii. 2

σ

^{= 평균}± 2

σ

^{= 95.44%}

iii. 3

σ

^{= 평균}± 3

σ

^{= 99.74%}

− 표준편차와 표준오차

i. 표준편차 : 표본평균과 표본들과의 차이, 작을수록 표본값들이 표본평균에 밀집되어 있음 ii. 표준오차 : 모평균과 표본평균과의 차이, 즉 표본이 모집단으로부터 얼마나 차이가 나는가의

수치, 작을수록 표본의 대표성 높음

(4) 분석기법의 분류 1. 단일변량분석

− 분석에 이용되는 변수가 하나인 경우의 분석

− 정규분포, t 분포, 카이제곱분포 등 특정한 성격을 이용해 표본집단을 분석 또는 비모수통계기법 등 2. 다변량분석

− 분석에 사용되는 변수가 2 개 이상인 경우

− 변수간 상호관계추정에 활용 3. 변수의 수

− 단일변량분석 : Z 검정, T 검정

− 다변량분석 : 분산, 회귀, 상관, 판별, 요인, 군집 등 4. 분석의 성격

− 종속관계분석 : 독립변수와 종속변수간 종속관계를 분석, 분산, 회귀, 판별, 결합, 로짓분석 등

− 상호관계분석 : 변수간 상호 이질성이나 동질성을 분석, 요인, 군집, 다차원척도법 등

− 구조분석 : 특정현상을 구성하는 각 이론단위간의 종속 및 상호관계를 포괄적으로 파악하는 분석 5. 척도의 종류

− 모수통계분석 : 등간이나 비율척도로 측정된 자료분석

− 비모수통계분석 : 명목이나 서열척도로 측정된 자료분석 6. 집단의 수

− T 검정 : 두집단의 평균차이분석

− F 검정 : 세집단 상의 집단간 평균차이분석 7. 평균의 독립성

(3)

위드뷰는 함께 보는 열린 학습공간입니다.

− 각 표본집단 중 하나의 표본이 다른 표본집단으로부터 추출되었을 경우 Æ 독립성 결여

− 각 표본집단이 상호 독립적으로 추출되었을 경우

(5) 통계분석 1. 교차분석

− 범주형 자료(명목척도)의 분석방법으로 카이제곱분석

− 교차분석은 통계적으로 기대되는 비율/빈도와 실제비율/빈도와의 차이를 분석하는 기법

− 예) 가족수에 따라서 냉장고 크기의 차이가 있는가 등

− 적합도 검정 : 가정과 실제가 맞는지 검정, 즉 기대빈도와 관측빈도의 일치정도를 의미

− 독립성 검정 : 두변수간 기대도수와 관찰도수가 일치하는지 등의 분석, 기타 강의 참조 2. T-test

− 집단간 평균차이검정에 주로 활용

− 단일표본 T 검정 : 하나의 집단에 대한 추론, 예) 새우깡 한봉지의 무게가 예전과 차이 나는지

− 독립표본 T 검정 : 두 집단이 서로 독립일때 사용, 예) 대졸남자와 대졸여자의 봉급차이

− 대응표본 T 검정 : 두 집단이 짝을 이룰 때, 예) 식품복용 전과 식품복용 후의 차이 분석

독립변수 종속변수 통계기법

단일변량 명목,서열 명목,서열 등간,비율 등간,비율

명목,서열 등간,비율 등간,비율 명목,서열

카이제곱,빈도분석

T-test, 분산분석, 더미회귀분석 상관분석, 회귀분석

로짓모형, 프로빗모형 등간,비율

등간,비율

등간,비율 명목,서열

다변량 회귀분석 로지스틱분석, 판별분석 다변량

구분 없는 경우 요인, 주성분, 군집

[제 9 장] 내용분석 및 기술통계

위드뷰는 함께 보는 열린 학습공간입니다.

이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.

[제 9 장] 내용분석 및 기술통계



위드뷰는 함께 보는 열린 학습공간입니다.

이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.

σ

σ

σ

σ

σ

σ

위드뷰는 함께 보는 열린 학습공간입니다.

이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.