Politics behavior data analysis using the adaptive Neyman test

(1)

2013, 24

(

2)

,

289–301

적응-네이만-검정을 이용한 미국 정치 행동분석

^†

김묘정

¹

· 한규섭

²

· 임요한

³

· 이경은

⁴

1연세대학교 의과대학 연구부 통계지원실 ·²서울대학교 언론정보학과 ·

3서울대학교 통계학과 ·⁴경북대학교 통계학과

접수 2012년 12월 25일, 수정 2013년 2월 12일, 게재확정 2013년 3월 7일

요 약

본 연구는 ‘광고 다이얼 (ad dial)’이라는 도구를 통하여 얻어진 함수 자료에 대한 독립 이표본 검 정에 관련한 사례연구이다. 본 연구에서는 2008년 미국대선에 출마한 오바마 대통령 후보의 TV광고 를 실험참여자의 정치성향 (민주당/공화당/무당파)별로 오바마 후보의 피부색을 달리한 두 광고 형태 의 다이얼 점수에 차이가 있는지를 검정한다. 특히 시간상관관계 (serial correlation)가 존재하는 함 수자료의 분석을 위하여 이산 푸리에 변환에 기반한 ‘적응-네이만-검정 (adaptive Neyman test)’을 적용하여 광고형태별 차이에 대한 통계적 유의성을 검정하였고 오직 무당파 실험군에서 유의한 차이 가 있음을 발견하였다.

주요용어: 광고 다이얼자료, 적응-네이만-검정, 정치행동자료.

1. 서론

최근 사회과학 연구에서 특이할 만한 한 가지 경향은 실험 대상에 대한 선호도를 측정함에 기존의 자 기기입식 설문 측도에서 벗어나 보다 객관적이고 신뢰도 높은 측정방법의 활용이다. 널리 알려진 바와 같이 기존의 자기기입식 설문 측도들은 측정값의 신뢰도 (reliability)에 문제점이 존재하고 실험 참여자 들의 선호를 측정하는데 여러 어려움이 있다 (Katosh와 Traugott, 1981). 이러한 이유로 선호도 측정 을 위한 다양한 측정방법이 개발되었고 기존의 통계 방법론으로 분석이 어려운 새로운 형태의 자료들이 소개되었다.

사회과학의 새로운 형태의 자료로 개별 참여자에 대하여 시간에 따른 반복적인 측정값을 얻는 경시적 자료 (longitudinal data) 또는 함수적 자료 (functional data)를 쉽게 접하게 됨에 따라, 본 연구에서는 특별히 ‘광고다이얼 (ad dial)’이라는 도구를 이용한 2008년 미국 대선과 관련한 실험 연구로 부터 얻어 진함수적 자료의 분석에 관하여 살펴본다. 일반적으로 시간에 따른 함수적 자료는 기존연구에서 많은 관심을받은 다변량 자료와 비교하여 자료의 차원이 높으며 시간적으로 인접한 관측값간의 연속성등의 가정을 동반한다.

본 논문에서는 이러한 함수적 자료에 대한 이표본 검정에 대하여 연구한다. 특히 Fan (1998)이 제안 한 ‘적응-네이만-검정 (adaptive Neyman test)’에 대하여 살펴보고 이를 미국 대선과 관련한 광고다이

†

이 논문은 2012학년도 경북대학교 학술연구비에 의하여 연구되었음.

1

(120-752) 서울 서대문구 연세로 50, 연세대학교 의과대학 연구부 통계지원실, 조교.

2

(151-746) 서울 관악구 관악로 599, 서울대학교 언론정보학과, 조교수.

3

(151-747) 서울 관악구 관악 1로, 서울대학교 통계학과, 부교수.

4

교신저자: (702-701) 대구 북구 대학로 80, 경북대학교 통계학과, 조교수. E-mail: [email protected]

(2)

얼자료에 적용하여 본다. 특히 함수적 특성을 무시한 다변량 분석 방법과의 비교를 통하여 함수적 접근 법의 장점을 살펴보고자 한다.

본 논문의 구조는 다음과 같다. 2절에서는 본 논문에서 다루게 될 ‘광고다이얼자료’ 에 대하여 설명 하고 자료의 배경과 분석의 목적을 소개한다. 3절에서는 기존에 널리 사용되고있는 비함수적 방법들과 이들의 문제점을 살펴보고 이들의 해결책으로 제시된 Fan (1998)의 적응-네이만-검정에 대하여 소개한 다. 4절에서는 미국 대선 관련 실험자료를 이용하여 3절에서 소개된 방법들의 특성을 비교하여 보고자 한다.

2. 정치행동 자료: 광고 다이얼

현대 선거 캠페인에서 TV광고는 유권자의 표심을 결정하는데 지대한 영향력을 가진다. 현대 선거 캠 페인에서는 경선제도 등의 도입으로 인해 기존의 정당정치의 틀에서 벗어나 개별 후보들이 직접 유권자 들에게 어필해야 하는 과정으로 바꿨다 (Wattenberg, 1991). 따라서, 유권자들에게 직접 어필하기 위 해서 미디어의 역할이 증대된것은 물론이다. 특히 점점 더 뉴스가 후보자들에게 비판적 논조를 띄는 경 향이 심해지고 일반 뉴스보다는 분석뉴스의 비율이 현격하게 높아지면서 후보자들에게 TV광고는 가장 중요한 캠페인 수단으로 자리 잡은지 오래다 (West, 1994). 현재 우리나라의 대통령선거에서는 TV광 고의 방송횟수가 30회로 제한되어 있음에도 불구하고 TV광고가 후보자의 이미지 결정에 상당한 영향 력을 미친다는 것에 대부분의 학자들이 동의한다. 2002년 대선에서 노무현 당시 후보가 기타를 치며

‘상록수’를 부르는 TV광고를 통해 상당한 정도의 지지율 반전을 이끌어 낸 것과 2007년 대선에서 이명 박 후보가 ‘욕쟁이 할머니’를 등장시켜 경제 대통령으로서의 이미지를 부각시켰던 것 등을 주요 사례로 들 수있다. 미국 등 외국에서는 TV광고에 대한 제한이 없어 국내보다도 그 영향력이 더 절대적이라 할 수 있다. 실제로 미국에서 대선후보들은 각각 우리 돈으로 수천 억원의 정치헌금을 받는데 이 중 가장 큰 지출내역이 되는것이 바로 경합지역에서의 TV광고에 사용되고 있다.

TV광고의 효과를 측정하기 위해 다양한 측도들이 사용되고 있는데 우리 분석에 사용된 광고 다이얼 기법은 광고뿐 아니라 모든 영상물의 평가에 활용되고 있다 (Iyengar와 Vavreck, 2011). 실제로 미국의 CNN등에서는 대선 TV토론에서 본 연구에서 활용한 온라인 다이얼과 같은 원리의 다이얼을 이용, 스 튜디오에서 방청객들이 후보자들의 토론내용을 실시간으로 평가하며 이 점수를 방송하고 있다.

본 연구에서는 광고의 효과를 분석하기 위해 기존의 방식처럼 광고를 본 참여자들에게 설문을 실시하 여 후보자에 대한 평가를 하도록 유도하는 대신 ‘온라인 광고 다이얼’을 사용하여 광고를 보면서 후보 자를 평가하게 하였다. 즉, 모든 참여자는 실시간으로 30여초동안 광고를 시청하면서 받는 느낌에 따라 비디오 아래에 위치한 다이얼을 움직여 후보자를 평가하도록 하였다. 본 분석에 사용된 광고 다이얼은 왼쪽 (부정적 평가: -100)에서 오른쪽 (긍정적 평가: +100)으로 움직일 수 있도록 하여 총 200개의 구 간으로 평가하게 하였다. 그리고 약 30여초동안의 광고를 0.5초 간격으로 나눠 다이얼의 점수를 측정하 였고 각 광고가 시작할 때 다이얼은 항상 중립 (0)에 위치하도록 디지인 하였다.

본 논문에 사용된 자료는 2008년 10월 21일에서 27일 사이에 미국 Polimetrix-YouGov의 온라인 패널 중 추출된 1,100명의 참여자들을 대상으로 한 온라인 실험을 통해 수집되었다. 참여자들은 우선 2008년 미국 대선에 출마한 민주당 버락 오바마 후보와 공화당 존 메케인 후보의 광고를 보면서 두 후 보자에 대한 선호를 점수로 광고 다이얼을 활용하여 기록하였다. 이 중 본 논문에서는 ‘Fix the Econ- omy’라는 제목의 오바마 후보의 광고를 본 참여자들의 자료를 분석했다.

이 광고에서는 첫 3초정도 오바마 후보의 얼굴사진을 삽입했고 이 얼굴의 피부톤을 실험 처치하여 ‘아 프로센트릭 (afrocentric)’한 오바마와 ‘유로센트릭 (Eurocentric)’한 오바마가 등장하는 두 실험 그룹을 만들었다 (Blair 등, 2002; Golby 등, 2001). ‘아프로센트릭’ 오바마 후보의 경우 좀 더 흑인적 특징을

(3)

주기 위하여 원래 오바마 사진에서 피부톤을 검게하고 콧잔등을 좀 더 넓게 만드는 처치를 하였다. 반면

‘유로센트릭’ 오바마를 만들기 위해서 원래 오바마의 얼굴을 밝게 만들고 콧잔등을 약간 좁게 만들었다 (Figure 2.1 참조). 즉, ‘아프로센트릭’ 오바마 그룹은 상대적으로 흑인적 특징이 두드러지는 오바마 후 보의 얼굴을 보았고 ‘유로센트릭’ 오바마 그룹은 상대적으로 흑인적 특징이 적은 오바마 후보의 얼굴을 보았다. 두 그룹이 본 광고는 다른 모든 면에서는 동일했다.

Figure 2.1 Photos of Obama

Figure 2.2, Figure 2.3와 Figure 2.4은 각각 민주당, 공화당, 그리고 무당파 유권자들의 다이얼 점 수를 보여준다. 각 Figure에서 첫 두 그림은 두 실험 그룹에서 개별 참여자들의 점수를 시간별로 찍어 놓은 그림이다. 마지막 그림은 각 시간대에서의 해당 실험 그룹의 참여자들의 평균 커브 (굵은 선)와 95%신뢰구간 (가는 선)을 나타낸 것인데, 실선은 ‘유로센트릭’ 그룹, 그리고 점선은 ‘아프로센트릭’ 그 룹을 나타낸다.

0 50

−100

−50 0 50 100

Eurocentric

Score

time

0 50

−100

−50 0 50 100

Afrocentric

Score

time

0 50

−100

−50 0 50 100

95% Confidence Interval

Score

time

Figure 2.2 Scores of Democrats

(4)

0 50

−100

−50 0 50 100

Eurocentric

Score

time

0 50

−100

−50 0 50 100

Afrocentric

Score

time

0 50

−100

−50 0 50 100

95% Confidence Interval

Score

time Figure 2.3 Scores of Republicans

0 50

−100

−50 0 50 100

Eurocentric

Score

time

0 50

−100

−50 0 50 100

Afrocentric

Score

time

0 50

−100

−50 0 50 100

95% Confidence Interval

Score

time Figure 2.4 Scores of Independents

3. 적응-네이만-검정

3.1. 단순한 접근법들

함수적 자료의 유의성검정을 위하여 몇 가지의 단순한 접근법들을 생각할 수 있다. 첫 번째로 각각 의 관측 시간에서 점 이표본 t 검정 (pointwise two sample t test)을 하는 방법이 있다. 여기서 민주당 지지 유권자 집단과 무당파 유권자 집단에 대한 검정 결과 모두 모든 시간에서 p값이 0.05보다 커 차이 가 있다고 할 수 없다. 그러나 이것은 Figure 2.2와 Figure 2.4에서 시각적으로는 두 집단 간에 차이를 보이는 것과 상반되는 결과를 나타낸다. 공화당 지지 유권자 집단에 대한 검정 결과 또한 모든 관측 시

(5)

간에서 p값이 0.05보다 커 차이가 있다고 할 수 없으며 Figure 2.3에서 두 집단의 평균 커브가 교차되는 것으로 보아 타당한 결과로 보인다. 그러나 이러한 결과는 대체로 그림에서 볼 수 있는 차이를 반영하지 못한 것으로 다른 검정 방법을 찾아볼 필요성이 있다.

두 번째 접근법으로 각각의 표본 커브를 다변량 벡터로 취급하여 호텔링의 T² 검정 (Hotelling T² test) 등의 다변량 기법을 사용할 수 있다. 그러나 이 접근법은 근접한 시간에서의 점수의 연속성을 무 시하며 차원수가 표본수보다 크면 사용할 수 없다는 단점을 가진다. 실제로 공화당 지지 유권자 집단에 서는 차원수와 표본수가 65로 같아 호텔링의 T² 검정을 사용할 수 없었으며 민주당 지지 유권자와 기타 유권자 집단에서도 p값이 각각 0.367과 0.757이 나와 두 처리간에 유의한 차이가 있다고 할 수 없다. 그 러나 이 접근법은 시간에 대한 변화와 연속성 등을 모두 무시하였으므로 적합한 검정 방법이 될 수 없다.

마지막으로각 개인의 점수에 대하여 평균을 구하여 이표본 t 검정을 적용할 수 있다. 이 결과 민주당 지지 유권자와 무당파 유권자의 경우 각각의 p값이 0.0001보다 훨씬 작으므로 두 처리 간에 굉장히 유의 한 차이가 있다고 할 수 있다. 반면 공화당 지지 유권자의 검정 결과 p값이 0.461으로 두 처리 간에 유 의한 차이가 있다고 할 수 없다. 그러나 이러한 결과들은 각각의 관측치가 가진 연속하는 시간대에서의 종속성을 무시하는 것으로 앞의 두 접근법과 마찬가지로 왜곡된 결과를 가져올 수 있다.

정치행동자료에서 인접한 시간대의 점수가 서로 연관되어 있다는 것은 분명하다. 이것을 연관되지 않고 정상성을 가지는 자료로 만들기 위해 흔히 이용하는 방법으로 푸리에 변환 (Fourier transforma- tion)이 있다. 각각의 커브에 푸리에 변환을 적용하여 얻어진 주파수 영역 (frequency domain)에서의 자료는거의 독립이고 가우시안 분포를 따른다. 따라서 3.2절에서와 4절에서 각각 적응-네이만-검정과 두 집단의 비교검정을 언급한 뒤 5절에서는 푸리에 변환을 통하여 변환된 자료를 이용하여 적응-네이 만-검정을 적용하여 두 처리 간에 유의한 차이가 있는지 검정하겠다.

3.2. 적응-네이만-검정

X가 N (θ, IT)을 따르는 T 차원의 정규확률벡터라고 하자. 이때 검정하고자 하는 것은 H0: θ = 0 대 H1: θ ̸= 0

이며 최대우도비 검정 통계량은 ∥X∥²에 기초한다. 이 때 검정 통계량 ∥X∥²은 H0 하에서 χ²_T의 분포 를 따르며 H1 하에서는 λ = θ^′θ/2인 χ²T(λ)의 분포를 따르므로 대립가설 θ = θ1 하에서 근사적검정 력은

1 − Φ





z1−α− ∥θ1∥²/√ 2T q

1 + 2∥θ1∥²/√ T





이다. 만약 ∥θ∥²= o(T )이면 근사적으로 1 − Φ

z1−α− ∥θ1∥²/√ 2T

의검정력을 가진다. 여기서 α는 유의수준이며 z1−α= Φ⁻¹(1 − α)이다 (Fan, 1996).

최대우도비 검정에서 사용된 통계량을 구하기 위해서는 θ1의 모든 성분을 사용한다. 그러나 θ의 성 분의 큰값이 주로 처음 m개의 성분까지 있다는 사전정보가 주어진다면 m 차원만 고려해도 검정이 가 능하게 되며 Pm

j=1X_j²과 같이 처음 m성분만을 검정 통계량으로 사용할 수 있게 된다. 또한 이 통계량 의 표준화된 형태는 (2m)^−1/2Pm

j=1(Xj²− 1)으로 모수 m은 반드시 사전에 결정되어져야 한다.

m을 결정하는데 있어 Fan (1996)은 검정력을 고려하는 방법을 제안하였다. 통계량Pm

j=1Xj²이 H0

하에서 χ²_m분포를 따르며 H1 하에서 비중심성모수 (noncentrality parameter), λ =Pm

j=1θ_j²/2인 비 중심 χ²m(λ) 분포를 따른다. 따라서 검정력은

(6)

β(θ1) =P_θ1 Pm

j=1Xj²− m

√2m > z1−α

!

=1 − Φ





z1−α−Pm

j=1θ²_1,j/√ 2m q

1 + 2Pm

j=1θ²_1,j/m





이다. 여기서 Pm

j=1θ²_1,j = o(m)이라는 조건이 만족된다면, 검정력은 근사적으로 1 − Φ(z1−α − Pm

j=1θ²_1,j/√

2m)이 된다. 검정력을 최대로 하기 위해서Pm j=1θ_1,j² /√

2m의 불편 추정량인 (Pm

j=1X_j²−m) /√

2m을 최대로 하는 m을 결정하게 된다.:

ˆ

m = arg max_m:1≤m≤T ( Pm

j=1(Xj²− 1)

√2m )

.

이로부터 적응-네이만-검정 통계량을 이끌어낼 수 있으며 그 수식은 다음과 같다.

TAN^∗ = Pmˆ

j=1(X_j²− 1)

√2 ˆm

= maxm:1≤m≤T

( Pm

j=1(Xj²− 1)

√2m )

이검정은

TAN=p

2 log log T T_AN^∗ − {2 log log T + 0.5 log log log T − 0.5 log(4π)}

이 매우 클 때, H0를기각하는 것과 동일하다. 또한 H0 하에서의 TAN의 분포는 근사적으로 P {TAN≤ x} → exp{− exp(−x)}

을 따른다 (Darlin과 Erd¨os, 1956).

4. 두 집단의 차이 검정

관측된 자료가 각각 다음의 모형을 따르는 확률표본이라고 하자.

Xj(t) = f1(t) + ϵj(t), t = 1, · · · , T, j = 1, 2, · · · , n1, Yj(t) = f2(t) + ϵ^′j(t), t = 1, · · · , T, j = 1, 2, · · · , n2.

(4.1)

여기서 확률변수 ϵj(t)와 ϵ^′j(t)의 평균은 0이며 이 검정의 목적은 H0: f1(t) = f2(t) for all t vs. H1 : not H0

이다.

(7)

4.1. 독립인 이분산 오차

모든 j와 t에 대하여 확률변수 ϵj(t) ∼ N (0, σ1²(t))와 ϵ^′j(t) ∼ N (0, σ2²(t))가 독립이라고 가정하자.

이때우리는 다음과 같은 통계량들을 고려할 수 있다.:

X(t) =¯ Pn1

j=1Xj(t) n1

와 Y (t) =¯ Pn2

j=1Yj(t) n2

σˆ₁²(t) = Pn₁

j=1{Xj(t) − ¯X(t)}²

n1− 1 와 σˆ₂²(t) = Pn₂

j=1{Yj(t) − ¯Y (t)}² n2− 1 . 이로부터 표준화된 차이를

Z(t) =

X(t) − ¯¯ Y (t) rσˆ₁²(t)

n₁ +^σ^ˆ²_n²^(t)

2

라 하고 Z = (Z(1),· · ·, Z(T ))^′라 두자. 만약 n1과 n2가 충분히 크다면 Z(t)는 근사적으로 N (d(t), 1)인 분포를 따르게 되며 d(t) = (f1(t) − f2(t))/pσ₁²(t)/n1+ σ₂²(t)/n2이다. 또한 σ1²(t) = σ²2(t)이면 합동 분산통계량

σˆ²(t) = n1− 1 n1+ n2− 2

σˆ₁²(t) + n2− 1 n1+ n2− 2

σˆ²₂(t)

을 사용할 수 있으며 이 방법은 n1과 n2가 작을 때 특히 유용하다.

4.2. 오차의 독립성 검정

시계열 자료 분석 (예, 통합공정관리 자료; Lee와 Kim, 2010)에서 오차의 독립성을 검정하기 위해 포 트맨토 검정 (Portmanteau test)을 사용한다. 포트맨토 검정에서 귀무가설은 r1 = · · · = rK = 0이며 여기서 rk는 lag = k인 자기상관계수이다. 포트맨토 검정 중 χ² 분포를 따르는 Ljung-Box 검정 통계 량은 다음과 같다.:

Q = T (T + 2)

K

X

k=1

r²_k T − k.

여기서 T 는 관측치의 수이며 K는 검정을 위한 자기상관계수의 갯수이며 또한 χ² 분포의 자유도이다 (Cho와 Son, 2002). 우리는 앞 절에서 사용된 {d(t)}를 이용, ARIMA모형을 적합한 후 잔차를 이용하 여 오차의 독립성을 검정 할 수 있다.

4.3. 정상성을 가지는 오차

ϵj(t)와 ϵ^′_j(t)가 독립성을 만족하지 않고 정상성을 가진 경우에는 각각을 푸리에 변환을 통하여 독립성 을 만족시킬 수 있다. 두 그룹의 각 커브 {Xj(k)}^T_k=1, {Yj(k)}^T_k=1의 이산 퓨리에 변환을 다음과 같이 표현하자.:

JX_j λ = T^−1/2

T

X

k=1

Xj(k) exp

− iλ k − 1

.

JY_j λ = T^−1/2

T

X

k=1

Yj(k) exp

− iλ k − 1

.

(8)

ωl= 2πl/T, l = 1, 1, . . . , [T /2]에서

JX_j ωl = Jf₁ ωl + Jϵ_j ωl JY_j ωl = Jf₂ ωl + Jϵ′_j ωl

Xj^∗ l T

l=1와 Yj^∗ l T

l=1는각각JX_j ωl 과 JY_j ωl 의 이산 퓨리에 변환의 실수와 허수부분이 라고 하자. Brockwell과 Davis (1991)의 정리 10.3.1.에 의해 다음이 성립한다.

X_j^∗ l = f₁^∗ lϵ^∗_j l + Op T^−1/2 Yj^∗ l = f2^∗ lϵ^∗∗j l + Op T^−1/2

여기서 f₁^∗ l와 f₂^∗ l는 Jf₁ ωl와 Jf₂ ωl실수와 허수부분을 포함하고 있고 ϵ^∗_j l ∼ N (0, σ²₁(l)) 이고 ϵ^∗_j l ∼ N (0, σ²1(l)) 그리고 모든 l에 대하여 독립이다. 주파수 영역에서 표본평균의 차의 표준화를 고 려하여보자.

Z(l) =

1 n₁

Pn₁

j=1X_j^∗(l) −_n¹

2

Pn₂ j=1Y_j^∗(l) n 1

n₁σˆ₁²(l) +_n¹

2σˆ₂²(l)o1/2

여기서 ˆσ₁²(l)과 ˆσ₁²(l)는 σ₁²(l)과 σ₁²(l)의 추정량이다. 이 Z(l)을 이용하면 앞절에서 언급된 적응-네이만 검정 통계량과 표준 적응-네이만 검정통계량은 다음과 같이 된다.:

TAN^∗ = max

m:1≤m≤T

√1 2m

m

X

l=1

|Z(l)|²− 1 TAN = p

2 log log T TAN^∗ − {2 log log T + 0.5 log log log T − 0.5 log(4π)}.

5. 광고 다이얼 자료 분석

이 절에서는 위에서기술된 방법론을 적용하여 광고 다이얼 자료를 분석해 본다. 우선 명시할 점은 오 차의 독립성이가정될 수 있는 경우와 그렇지 못 한 경우로 나눠 접근방식을 달리 해야 한다는 것이다.

앞서 밝힌 바와 같이 오차의 독립성이 가정될 수 있는 경우라면 먼저 각 시간대에서 커브의 표준화된 차 이를 구한 후 푸리에 변환 (R에서 ‘fft’ 사용)을 적용한다.

반면 앞서 밝힌 바와 같이 오차의 독립성이 만족되기 어려운 경우라면 푸리에 변환을 통해서 자료를 사전 처리해야 한다. Figure 5.1, Figure 5.2, Figure 5.3에서는 오차의 독립성을 만족하지 못한다고 가 정한 것으로 상단의 그림은 각 커브를 푸리에 변환한 결과이며 하단은 푸리에 변환한 자료의 표준화된 차이를 나타낸것이다. Figure에서 파란 실선은 ‘유로센트릭’ 오바마 그룹, 붉은 실선은 ’아프로센트릭’

오바마 그룹의 결과를 보여준다.

실험에 사용된 광고가 오바마후보의 광고였기 때문에 지지정당에 따라 서로 다른 반응을 보였으리라 는예상이 가능하다. 본 분석에서는 민주당과 공화당 지지자, 그리고 무당파 유권자들로 나눠 두 실험 그룹간의 차이가 유의한지 검정한다. 따라서, 광고에 대한 반응을 측정할 때 지지정당에 따라 나눠 분석 할 필요가 있다. 좀 더 구체적으로는 양당의 지지자들에서는 실험처치의 영향이 미약할 것이라 예상했 다. 확실한 지지정당을 가지고 있는 유권자들은 지지정당에 따라 후보를 평가하는 경향이 강해 광고 속 오바마 후보의 피부톤의 영향이 미미할 것이다. 반면 무당파 유권자들은 지지정당이 없어 정치적 선호 가 그다지 강하지 않아 광고 속 오바마 후보의 피부톤에 영향을 받을 여지가 상대적으로 많을 것으로 예 상했다.

우선 민주당 지지성향의 유권자들에 대한 결과를 살펴 보았다. 먼저 오차의 독립성을 검정하기 위해 Ljung-Box 검정을 실시하였다. 그 결과 Ljung-Box 검정 통계량이 χ² = 200.16 (d.f. = 10)이고 p값

(9)

이 0.001보다 작았으므로 오차가 독립적이라는 귀무가설이 기각되었다. 따라서, 오차의 독립성을 가정 한검정은 왜곡된 결과를 보이게 되므로 오차의 정상성을 가정한 검정을 통해 두 실험 그룹간의 차이의 유의성을검정했다.

우선 푸리에 변환을 통하여 오차가 독립성을 가지는 가우시안 분포를 따르는 커브를 생성했다. 따라 서, 3절에서 설명한 바와 같이 최대 우도비 검정과 적응-네이만 검정을 적용할 수 있다. 민주당의 경우 최대우도비 검정 통계량은 38.077이었고 p값은 0.997이므로 두 실험 그룹간의 차이가 있다고 볼 수 없 었다. 마찬가지로 적응-네이만-검정을 적용한 결과 m = 2, T AN = −0.152 (p값 = 0.688)이어서 역시 두 실험그룹간의 차이를 발견할 수 없었다. 즉, 민주당 지지자들은 오바마 후보의 피부톤에 상관없이 오 바마 후보에 대해 일관되게 긍정적인 평가를 했다는 것을 알 수 있다.

Table 5.1 Comparing two groups of Democrats

Test methods Results

Ljung-Box χ

²

= 200.16, Degree of freedom = 10

Test p-value < 0.0001

Maximum Likelihood Ratio Test Statistic = −5448.54, p-value < 0.0001 Under assumption of independency Adaptive Neyman m = 1, T

AN

= 5889.824

Test p-value ≈ 0

Maximum Likelihood Ratio Test Statistic= 38.077, p-value = 0.977 Under assumption of stationarity Adaptive Neyman m = 2, T

_AN

= −0.152

Test p-value= .688

0 10 20 30 40 50 60

05001500

Fourier Transform

0 10 20 30 40 50 60

−2−101

Standarized Difference of Fourier Transform

Figure 5.1 Fourier transformed scores of Democrats (under assumption of stationarity)

(10)

공화당 지지성향의 유권자들의 경우에도 Ljung-Box 검정 통계량이 χ² = 210.51 (d.f. = 10)이고 p값이 0.001보다 작아 오차의 독립성이 성립한다는 귀무가설이 기각되었다. 따라서, 오차의 독립성을 가정한 검정은 왜곡된 결과를 보이게 되므로 오차의 정상성을 가정한 검정을 통해 두 실험그룹간의 차이 가 유의한지 검정하였다.

그 결과 최대 우도비 검정 통계량이 43.992로서 p값은 0.979에 불과했다. 따라서, 두 실험그룹간의 차이가 유의하지 않았다. 적응-네이만-검정을 적용한 결과도 m = 12, T AN = −1.688로서 p값이 0.966이므로 최대 우도비 검정의 적용결과와 대동소이했다. 이러한 결과는 예상했던 바와 같이 공화당 지지성향의 유권자들은 실험처치와 관계없이 오바마 후보에 대해 부정적인 평가를 했다는 것을 알 수 있 다. 즉, 이미 강한 정당지지성향을 가지고 있는 유권자들에게는 TV광고의 컨텐츠의 효과가 매우 미미 하다는것을 보여주는 결과라 할 수 있다.

Table 5.2 Comparing two groups of Republicans

Test methods Results

Ljung-Box χ

²

= 210.51, Degree of freedom = 10

Test p-value < 0.0001

Maximum Likelihood Ratio Test Statistic = 90.74, p-value < 0.0001 Under assumption of independency Adaptive Neyman m = 4, T

_AN

= 397.155

Test p-value < 0.0001

Maximum Likelihood Ratio Test Statistic= 43.992, p-value = 0.979 Under assumption of stationary Adaptive Neyman m = 12, T

_AN

= −1.688

Test p-value= .996

0 10 20 30 40 50 60

−2500−10000

Fourier Transform)

0 10 20 30 40 50 60

−1012

Figure 5.2 Fourier transformed scores of Republicans (under assumption of stationarity)

(11)

앞서 밝힌 바와 같이 무당파 유권자들의 경우 뚜렷한 지지정당이 없어 광고 속 오바마 후보의 피부톤 의 영향을 상대적으로 많이 받을 것으로 예상했다. 우선 오차의 독립성을 검정한 결과 검정 통계량이 χ² = 59.40 (d.f. = 10)이고 p값이 0.001보다 작아 오차가 독립적이라는 귀무가설이 기각되었다. 이는 공화당, 민주당 지지자들의 자료와 유사했다. 따라서, 앞선 분석에서와 마찬가지로 오차의 정상성을 가 정한 검정을 통해 두 실험그룹간의 차이가 유의한지 검정했다.

무당파 유권자들의 경우 지지정당을 가지고 있는 유권자들과는 달리 광고 속 오바마 후보의 피부톤에 영향을 받는 것으로 나타났다. 최대 우도비 검정 통계량은 113.34로서 p값이 0.001보다 작았다. 또 적 응-네이만 검정의 적용 결과에서도 m = 65, T AN = 5.4으로서 p값이 0.005였다. 이러한 결과들은 두 실험 그룹간의 차이가 통계적으로 유의하다는 것을 보여준다. 두 실험 그룹의 커브를 살펴 본 결과 무당 파 유권자들은 ‘유로센트릭’한 오바마 후보가 나온 광고를 보았을 때 ‘아프로센트릭’한 오바마 후보가 나 온 광고를 보았을 때 보다 오바마 후보를 긍정적으로 평가한 것을 알 수 있다. 이러한 결과는 인종적 태 도가 오바마 후보의 평가에 유의미한 변수가 될 수 있음을 보여준다.

Table 5.3 Comparing two groups of Independents

Test methods Results

Ljung-Box χ

²

= 59.40, Degree of freedom = 10

Test p-value < 0.0001

Maximum Likelihood Ratio Test Statistic = 4095.962, p-value < 0.0001 Under assumption of independency Adaptive Neyman m = 1, T

AN

= 3674.2

Test p-value < 0.0001

Maximum Likelihood Ratio Test Statistic= 113.34, p-value = 0.008 Under assumption of stationary Adaptive Neyman m = 65, T

_AN

= 5.4

Test p-value= 0.005

0 10 20 30 40 50 60

−600−2000

Fourier Transform

0 10 20 30 40 50 60

−2012

Figure 5.3 Fourier transformed scores of Independents (under assumption of stationarity)

(12)

6. 결론

커브 자료의 유의성검정을 위해 최대 우도비 검정을 적용하고자 하였다. 그러나 각 커브의 자료들이 서로 연관되어 있어 푸리에 변환을 통한 전처리가 요구되어진다. 푸리에 변환을 통하여 자료를 변환하 면 오차가 독립인 가우시안 분포를 따르게 되므로 최대 우도비 검정을 적용할 수 있다. 또한 유용한 정 보를 낮은 주파수 영역으로 요약할 수 있으므로 Fan (1996)이 제안한 적응-네이만-검정을 적용할 수 있 게 된다.

본 논문에서 사용한 정치행동 자료에 적응-네이만-검정을 적용하여 유의성 검정을 실시한 결과 특정 한 정치적 성향이 없는 무당파 집단에서만 대선 광고의 사진에서 피부색의 밝기에 따른 광고 점수 간에 차이를보였다. 이는 민주당 출마자인 오바마에 대한 어떠한 정치적 견해나 선입견이 없기 때문인 것으 로보인다.

반면 민주당 지지 유권자를 대상으로 한 유의성 검정에서는 광고 조건에 상관 없이 대체로 높은 점수 를보였으며 공화당 지지 유권자를 대상으로 한 유의성 검정에서는 대체로 낮은 점수를 보여 두 처리 간 에 유의한 차이를 보이지는 않았다. 이것은 무당파 집단에서만 유의한 차이를 보인 것과 같은 이유로 민 주당과 공화당을 지지하는 유권자들에게는 이미 민주당 후보인 오바마에 대한 정치적 견해와 선입견이 형성되었기 때문인 것으로 보인다.

참고문헌

Blair, I. V., Judd, C. M., Sadler, M. S. and Jenkins, C. (2002). The role of Afrocentric features in person perception: Judging by features and categories. Journal of Personality and Social Psychology, 83, 5–25.

Brockwell, P. J. and Davis, R. A. (1991). Time series: Theory and method, 2nd ed., Springer, New York.

Cho, S. S. and Son, Y. S. (2002). Time series analysis using SAS/ETS, Yulgok, Seoul.

Darling, D. A. and P. Erd¨ os (1956). A limit theorem for the maximum of normalized sums of independent random variables. Duke Mathematical Journal, 23, 143–155.

Detenber, B. H., Simons, R. F. and Reiss, J. E. (2000). The emotional significance of color in television presentations. Media Psychology, 2, 331–355.

Fan, J. and Lin, S. K. (1998). Test of significance when data are curves. Journal of the American Statistical Association, 93, 1007–1021.

Iyengar, S. and Vavreck, L. (2011). The future of political communication research: Online panels and experimentation. In The Oxford Handbook of American Public Opinion and the Media, edited by R.

Shapiro and L. Jacobs, Oxford University Press, Cambridge, MA.

Katosh, J. P. and Traugott, M. W. (1981). The consequences of validated and self-Reported voting measures.

Public Opinion Quarterly, 45, 519–535.

Lee, J. H. and Kim, M. J. (2010). Procedure for monitoring special causes and readjustment in ARMA(1,1) noise model. Journal of the Korean Data & Information Science Society, 21, 841–852.

Wattenberg, M. P. (1991). The rise of candidate-centered politics: Presidential elections of the 1980s, Harvard University Press, Cambridge, MA.

West, D. M. (1994). Television advertising in election campaigns. Political Science Quarterly, 109, 789–

809.

(13)

2013, 24

(

2)

,

289–301

Politics behavior data analysis using the adaptive Neyman test

^†

Myo Jeong Kim

¹

· Kyu S. Hahn

²

· Johan Lim

³

· Kyeong Eun Lee

⁴

1Biostatistics Collaboration Unit, Yonsei University

2Department of Communication, Seoul National University

3Department of Statistics, Seoul National University

4Department of Statistics, Kyungpook National University

Received 25 December 2012, revised 12 February 2013, accepted 7 March 2013

Abstract

We analyze respondents’ reaction to Obama’s advertisement, titled ‘Fix the Econ- omy’. These respondents are divided into three groups of democratic party, republican party and independent group. By manipulating the skin complexion of the Obama photo, participants were either exposed to the dark or light version of the Obama pho- tograph. In order to obtain decorrelated stationary data, we have applied the discrete Fourier transform to each curve and then we have applied Fan (1998)’s adaptive Ney- man test to the discrete Fourier transformed data. As a result, a significant difference is found out only in the independent group.

Keywords: Ad-dial data, adaptive Neyman test, political behavior data.

†

This reserach was supported by Kyungpook National University Research Fund, 2012.

1

Research assistant, Biostatistics Collaboration Unit, Yonsei University, Seoul 120-752, Korea.

2

Assistant professor, Department of Communication, Seoul National University 151-746, Korea.

3

Associate professor, Department of Statistics, Seoul National University, Seoul 151-747, Korea.

4