전체 글

(1)

제5장

표집

본 강의 자료는 아래의 자료를 요약하여 구성하였음을 밝힙니다.

(2)

- 중요 개념 제시

* 표본(sample): 연구하고자 하는 전체 모집단으로부터 추출된 하나의 단위들에 대한 부분 집합(a

subset of units).

* 확률 표본(probability sample: 단위들이 무작위로 선택됨)을 선택할 경우, 학자들은 연구 중인

내용의 모집단에 대한 타당한 추론을 할 수 있다. 확률 표집을 통한 추론에는 표집오차(sampling

error)가 있을 수 있지만, 통계적 처리를 통해 연구자들은 주어진 확률 수준을 가진 표집오차에

대한

추정치(estimates)를 산출해 낼 수 있다. 만약에 연구자들이 무작위 표집(random sampling)

이외의 방식으로 표본들을 수집한다면(많은 사람이 그렇게 하며 그렇게 하지 않을 수 없는

경우도 있음), 표본의 대표성(representativeness)이 편향되고(biased), 표집오차를 정확하게 계산해

낼 수 있다.

(3)

- 표집기법

1. 센서스

: 모집단 내의 모든 단위가 내용분석에 포함되는 것. (센서스의 가능여부는 개별 연구 프로젝트의 자원과 목적에 달려 있다.)

2. 비확률 표집(nonprobability sampling):

① 편의 표본(convenience sample): 이용 가능하기 때문에 사용되는 표본 ▲ 편의 표본은 다음과 같은 세 가지 조건 하에서는 사용이 정당화될 수 있다: 1). 연구하고자 하는 자료의 확보가 어렵다. 2). 모집단에 대한 무작위 표본을 구하기 어렵다. 3). 어느 정도조사가 덜 이루어졌지만 중요한 분야를 연구하는 경우다. ② 의도적 표본(purposive sample): ▲ 의도적 표집: 프로젝트의 속성상 비확률 표본을 사용한다. (특정한 유형의 출판물이나 특정한 사기에 관한 연구) ▲ 자주 이용되는 의도적 표본 유형: 연속-단위(consecutive-unit)표집. (*특정 기간 동안 생산된 일련의 내용을 선택한 것)

3. 비확율 표본의 문제점:

★ 진정한 센서스는 이론에 바탕을 두고 모집단이 정의되는 반면, 의도적 표본과 편의 표본은 이용 가능성이라는 실제적인 고려 사항을 토대로 모집단이 정의되기 때문에, 비확률 표집은 진정한 세서스와는 다르다. → (일반화 한계)

(4)

4. 확률 표집(probability sampling)

▲ 핵심 개념: 관심을 가지고 있는 어떤 모집단의 각 구성원에게 표본에 포함될 확률이 동일하게 주어진다.

5. 단순 무작위 표집(simple random sampling):

모집단 내 모든 단위들의 선택확률이 동일한 상태에서 일어난다. ▲ 단순 무작위 표집은 확률 표본을 구성하기에 좋은 방법이다. 모집단의 목록이 특히 길거나 혹은 모집단의 목록을 작성하는 것이 쉽지 않다면 → 단순 무작위 표집× 다른 무작위 표집기법O

6. 체계적 표집(systematic sampling):

어떤 표집 프레임에서 매 n번째 단위를 선택하는 것. 예: 10000개의 문장에서 1000개의 문장을 뽑아 하나의 표본을 구성하고자 한다면, 매 10번째 문장을 선택하면 될 것이다. ▲ 문제 발생할 수 있는 두 가지 조건: ① 체계적 표집은 추출될 단위들의 목록을 필요로 한다. 만약에 표집 프레임이 불완전하다면(전체 모집단이 목록화되지 않아서) 모집단에 대한 추론을 할 수 없다. ② 체계적 표집이 주기성의 영향을 받을 때 발생한다. (*주기성: 단위들을 목록으로 작성함에 있어 주기적 배열로 인해 목록이 편향되어 있는 것이다.) 예: 광고에 대한 표집을 할 때, 연구자가 어떤 잡지를 선정하여 1월호 20권, 4월호 20권, 7월호 20권 및 10월호 20권으로 구성된 표본을 갖추었다고 가정한다. 표본에 포함된 1월과 7월은 통상적으로 광고량이 적어 페이지 수가 적은 달이고 표본에서 제외된 8월은 통상적으로 광고량이 많아 페이지 수가 많은 달이기 때문에 위 표본은 문제가 있다.

(5)

7. 유층 표집(stratfied sampling):

정의: 하나의 모집단을 좀더 작은 집단들로 나눈 다음 그러한 집단들 내에서 무작위 표집을 하는 것. (이러한 각 집단들은 연구자가 중요하다고 생각하는 특성들의 측면에서 동질성을 지닌 집단들이다.) 예: 1964년에서 1974년 사이에 미국의 상원에서 행해진 연설레 포함된 베트남전에 대한 주전론적 언어에 대해 연구할 때, 그 언어는 시간에 따라 변화될 가능성이 있기 때문에 표본의 대표성을 높이기 위해 각 연도에 행해진 연설량의 비율에 맟줘 그 연도에서 추출할 단위의 수를 정할 수 있다. *비례 표집(proportionate sampling): 모집단에서의 층의 비율을 기준으로 각 층 내에서부터 표본의 크기를 선택하는 것. *비비례 표집(disproportionate sampling): 모집단 내에서 낮은 비율을 차지하고 있을 때 유층 표집은 연구에 포함될 단위들의 수를 증가시킬 수 있다.

★ 비비례 표집은 충분한 사례를 확보해서 유용한 분석을 할 수 있도록 하기 위해 특정한

단위들을 과다 표집한다. 그러나 표본 구성원들의 부분 집합이 표본 내에서 과장되어 있기

때문에, 비비례 표집은 전체 모집단을 대표하지 않는 표본을 구성하게 되는 결과를

초래한다.

(6)

8. 군집 표집(cluster sampling):

집단들로부터 내용 단위들을 추출하는 과정 예: 신문의 각 발행판은 많은 기사들의 군집으로서 보통 스포츠, 경제 및 오락과 같은 토픽 군집들로 나눠진다. ▲ 군집 표집할 때는 먼저 집단들을 확률 표집한 다음 색인들을 통해 하부집단들을 확률 표집하게 된다. 그러한 하부집단들 내에서 무작위 표집을 통해 구체적인 내용 단위들을 추출하게 된다.

9. 다단계 표집(multistage sampling):

서로 다른 단계에서 표집 기법들 가운데 하나 혹은 몇 가지를 복합적으로 사용할 수도 있을 하나의 일반적인 관행을 나타낸다. 예: 토크 라디오(talk radio)의 내용에 대해 연구하고자 하는 연구자는: ① 1단계로 먼저 라디오 방송국들을, 그 다음에는 분석하고자 하는 내용을 추출하게 될 날짜들을, 그리고 마지막으로 특정한 토크 프로그램들을 무작위로 선택해야 할 것이다. ② 그 다음 단계로 라디오 토크 프로그램들 내에서 특정한 토픽들을 선정하게 될 것이다. ★ 순수한 의미에서의 다단계 표집은 각 단계에서의 무작위 표집을 전제로 한다!!

(7)

- 매체 분석을 위한 유층 표집

<1년치 내용에 대한 추론을 위한 효율적인 계층화된 표집방법>

내용 유형

표본의 속성

일간신문

1년 가운데 두 구축된 주일 추출(모든 요일이 두 번씩 포함되게 무작위로 요일을 추출)

주간신문

1년 가운데 모든 달에서 하나의 발행호를 무작위로 추출

텔레비전 네트워크의

저녁 뉴스캐스트

1년 가운데 매달 방송된 뉴스 캐스트들 가운데 2일치를 무작위로 추출

뉴스 잡지

1년 가운데 모든 달에서 하나의 발행호를 무작위로 추출

(8)

네트워크 텔레비전 뉴스 주간신문 잡지 일간신문 ★ 구축주일(constructed week) - 예: 스템펠(1952)는 매주 6일 간 발행되는 신문의 제1면에 게재된 사진의 수를 이용했을 때 무작위로 첫 출발점을 정한 다음 매 n번째 발행호를 선택하는 벙법으로 구성된 6일치, 12일치, 18일치, 24일치 및 48일치 발행호들로부터 각각 10개의 표본들을 추출했다. 이러한 표집방법으로 인해 일요일에 제외한 모든 요일이 골고루 표함되는 구축된 주일이 구성했다. ▲ 큰 집단을 에 대해 추론할 때 요일 유층표집이 단순 무작위 표집보다 다 효율적이다. ★ 주간 신문의 내용을 연구할 때: ① 1년치로부터 14개의 발행호를 무작위로 뽑다. (연구 결과가 위험스러운 결정을 낼릴 때 사용. 정확성 중요.) ② 각 달에서 하나씩 모두 12개의 발행호를 뽑아야 한다. (결정을 덜 위험스럽고 비용과 시간을 제약하고자 하는 경우 사용. ) ★ 가장 효율적인 표집방법: 매달 하나의 발행호를 무작위로 선택하는 것이 1년치 내용에 대한 추론을 한다. ★ 효율적인 방법: 각 달에서 2일을 무작위로 추출하여 총 24일로 구성된 표본을 사용한다. ▲ 경고: 특정한 내용 범주들 내에 존재하는 극도의 가변성에 유의해야 한다.

(9)

- 뉴미디어 표집

- 개인적 커뮤니케이션 표집

▲ 범주 및 색인별 비율을 파악함으로써, 연구자는 홈페이지에 대한 비율 표집 방법을 이용 가능.

▲ 편의 표본들이 여러 가지 다양한 상황에서 추출된 경우, 그러한 표본들을 통한 누적된 뒷받침들은

최상의 효과를 발생 시킨다.

(10)

☆ 내용분석은 다양한 기법들을 사용하여 내용을 선택한다. 어떤 기법이 적합한가 하는 것은 연구

프로젝트에 내재하는 이론적 이슈와 실제적인 문제들에 따라 달라진다:

① 단위수가 적을 때: 세서스 / 단위수가 많을 때: 확률 표본 (확률 표본을 통한 모집단 추론이 가능) ② 통계적 추론을 사용하고자 할 때: 반드시 확률 표본 사용.

수치

Updating...

참조

Updating...

관련 주제 :