2018, 29
(1)
,27–36
로버스트 베이지안 베타회귀분석
†
ᄌ
ᅡᆼ은진
1
·최성미2
· 김달호3
1안동대학교 정보통계학과 · 23경북대학교 통계학과
ᄌ ᅥ
ᆸᄉ ᅮ 2017ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 20ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 7ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 8ᄋ ᅵ ᆯ
요 약
ᄋ
ᅧ ᆫᄉ ᅩ ᆨᄒ ᅧ ᆼ ᄇ ᅡ ᆫᄋ ᅳ ᆼᄇ ᅧ ᆫᄉ ᅮᄋ ᅴ ᄇ ᅮ ᆫ ᄑ ᅩᄀ ᅡ ᄎ ᅵᄋ ᅮᄎ ᅧ ᄋ ᅵ ᆻᄀ ᅩ ᄋ ᅵᄇ ᅮ ᆫ ᄉ ᅡ ᆫᄋ ᅵ ᄋ ᅵ ᆻᄋ ᅳᄆ ᅧ, ᄇ ᅵᄋ ᅲ ᆯ ᄀ ᅪ ᄀ ᅡ ᇀᄋ ᅵ 0ᄀ ᅪ 1 ᄉ ᅡᄋ ᅵᄋ ᅴ ᄃ ᅡ ᆫᄋ ᅱᄀ ᅮᄀ ᅡ ᆫᄋ ᅳ ᄅ
ᅩ ᄌ ᅮᄋ ᅥᄌ ᅵᄂ ᅳ ᆫ ᄀ ᅧ ᆼᄋ ᅮ ᄇ ᅦᄐ ᅡᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄇ ᅦᄐ ᅡᄒ ᅬᄀ ᅱᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅦᄐ ᅡᄒ ᅬᄀ ᅱᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆫ ᄇ ᅦᄐ ᅡᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅳ ᆯ ᄑ ᅧ ᆼ ᄀ
ᅲ ᆫ ᄀ ᅪ ᄌ ᅥ ᆼᄆ ᅵ ᆯᄃ ᅩ ᄆ ᅩᄉ ᅮᄅ ᅩ ᄑ ᅭᄒ ᅧ ᆫᄒ ᅡ ᆫ ᄒ ᅮ ᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄀ ᅪ ᄌ ᅥ ᆼᄆ ᅵ ᆯᄃ ᅩᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄒ ᅡᄋ ᅱᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡ. ᄋ ᅵ ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄇ ᅵᄉ ᅥ ᆫ ᄒ ᅧ
ᆼ ᄒ ᅩ ᆫ ᄒ ᅡ ᆸᄒ ᅭᄀ ᅪᄆ ᅩᄒ ᅧ ᆼᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄅ ᅢ ᆫᄃ ᅥ ᆷᄒ ᅭᄀ ᅪᄅ ᅳ ᆯ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅩ ᄀ ᅡᄌ ᅥ ᆼᄒ ᅡ ᆫᄃ ᅡ. ᄒ ᅡᄌ ᅵᄆ ᅡ ᆫ ᄋ ᅵᄉ ᅡ ᆼᄎ ᅵᄀ ᅡ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄀ ᅧ ᆼᄋ ᅮ ᄎ ᅮᄅ ᅩ ᆫ ᄋ ᅵ ᄅ ᅩᄇ ᅥᄉ ᅳ ᄐ
ᅳ ᄒ ᅡᄌ ᅵ ᄋ ᅡ ᆭᄋ ᅳᄆ ᅳᄅ ᅩ, ᄋ ᅧᄅ ᅥ ᄒ ᅧ ᆼᄐ ᅢᄋ ᅴ ᄃ ᅢᄎ ᅵ ᆼᄋ ᅵ ᆫ ᄋ ᅧ ᆫᄉ ᅩ ᆨᄒ ᅧ ᆼ ᄒ ᅪ ᆨᄅ ᅲ ᆯᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅴ ᄎ ᅥ ᆨᄃ ᅩᄒ ᅩ ᆫ ᄒ ᅡ ᆸ ᄋ
ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄅ ᅩᄇ ᅥᄉ ᅳᄐ ᅳᄒ ᅡ ᆫ ᄎ ᅮᄅ ᅩ ᆫᄋ ᅳ ᆯ ᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡ. ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅴ ᄎ ᅥ ᆨᄃ ᅩᄒ ᅩ ᆫ ᄒ ᅡ ᆸᄋ ᅳ ᆫ ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ t-ᄇ ᅮ ᆫ ᄑ ᅩ, ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄉ ᅳ ᆯ ᄅ
ᅢᄉ ᅱ ᄇ ᅮ ᆫ ᄑ ᅩ ᄃ ᅳ ᆼ ᄋ ᅴ ᄁ ᅩᄅ ᅵᄀ ᅡ ᄃ ᅮᄁ ᅥᄋ ᅮ ᆫ ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄇ ᅦᄋ ᅵᄌ ᅵᄋ ᅡ ᆫ ᄒ ᅩ ᆫ ᄒ ᅡ ᆸ ᄇ ᅦᄐ ᅡᄒ ᅬᄀ ᅱ ᄆ
ᅩᄒ ᅧ ᆼᄋ ᅦᄉ ᅥ ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄇ ᅩᄃ ᅡ ᄃ ᅮᄁ ᅥᄋ ᅮ ᆫ ᄁ ᅩᄅ ᅵᄅ ᅳ ᆯ ᄀ ᅡᄌ ᅵᄂ ᅳ ᆫ ᄅ ᅢ ᆫᄃ ᅥ ᆷᄒ ᅭᄀ ᅪᄅ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅡᄋ ᅧ ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅴ ᄎ
ᅥ ᆨᄃ ᅩᄒ ᅩ ᆫ ᄒ ᅡ ᆸᄋ ᅳ ᆯ ᄅ ᅢ ᆫᄃ ᅥ ᆷᄒ ᅭᄀ ᅪᄋ ᅴ ᄉ ᅡᄌ ᅥ ᆫᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅩ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅦᄋ ᅵᄌ ᅵᄋ ᅡ ᆫ ᄀ ᅨᄎ ᅳ ᆼᄌ ᅥ ᆨ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡᄀ ᅩ, ᄋ ᅵᄅ ᅳ ᆯ ᄉ ᅵ ᆯᄌ ᅦ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄌ ᅥ ᆨ ᄋ
ᅭ
ᆼ ᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄇ ᅦᄐ ᅡᄇ ᅮ ᆫ ᄑ ᅩ, ᄇ ᅦᄐ ᅡᄒ ᅬᄀ ᅱᄆ ᅩᄒ ᅧ ᆼ, ᄋ ᅵᄇ ᅮ ᆫ ᄉ ᅡ ᆫ, ᄎ ᅥ ᆨᄃ ᅩᄒ ᅩ ᆫ ᄒ ᅡ ᆸ, ᄒ ᅩ ᆫ ᄒ ᅡ ᆸᄆ ᅩᄒ ᅧ ᆼ.
1. 서론 이
ᆯ반적으로 연속형 반응변수에 대한 선형회귀모형은오차들이 독립이며 분산이 동일한 정규분포를따 ᄅ
ᅳ
ᆫ다고 가정한다. 만일 연속형 반응변수의 분포가 치우쳐 있고 이분산 (heteroskedasticity)이 있으며, ᄇ
ᅵ율과 같이 0과 1 사이의 단위구간으로 주어지는 경우 베타분포를 이용한 베타회귀모형을 적용할 수 이
ᆻ다. 베타회귀모형은 Paolino (2001)이 베타확률밀도함수를형태모수 대신 평균과 산포 모수로 표현 ᄒ
ᅡᆫ 후 단위구간 또는최대, 최소값이 있는제한된구간 내 자료에 대해 적용되고 있다.
Ferrari와 Cribari-Neto (2004)는 정밀도 모수가 상수라고 가정하고 최대우도법을 이용하여 평균에 ᄃ
ᅢ한 베타회귀모형을제안하였으며, Smithson과 Verkuilen (2006)은 평균에 대한 위치 하위모형과 정 미
ᆯ도에 대한 산포 하위모형을 가지는 베타회귀모형을 최대우도법을 이용하여 추정하였다. Branscum ᄃ
ᅳᆼ (2007)은 평균에 대한 베이지안 베타회귀모형을 제안하였으며, Figueroa-Z´u˜niga 등 (2013)은평균 ᄀ
ᅪ 정밀도에 대한 하위모형에서 정규분포를 따르는 랜덤효과를 고려한 베이지안 혼합 베타회귀모형을 ᄌ
ᅦ안하였다. 최근베타회귀모형은의학, 유전학, 교육학, 경제학 등다양한 분야에서 비율, 분수 (frac- tion) 등의 자료에 적용되고 있다 (Peplonska 등, 2012; Branscum 등, 2007; Buntain, 2011; Gallardo ᄃ
ᅳᆼ, 2012; Jang, 2017).
†
ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2015 ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄋ ᅡ ᆫᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅧ ᆫᄀ ᅮᄇ ᅵᄋ ᅦ ᄋ ᅴᄒ ᅡᄋ ᅧ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ.
1
(36729) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄋ ᅡ ᆫᄃ ᅩ ᆼ ᄉ ᅵ ᄀ ᅧ ᆼᄃ ᅩ ᆼ ᄅ ᅩ 1375, ᄋ ᅡ ᆫᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄌ ᅩᄀ ᅭᄉ ᅮ.
2
(41566) ᄃ ᅢᄀ ᅮ ᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅡ ᆼᄋ ᅴᄎ ᅩᄇ ᅵ ᆼᄀ ᅭᄉ ᅮ.
3
ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (41566) ᄃ ᅢᄀ ᅮ ᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
이
ᆯ반적으로 혼합효과모형에서는 랜덤효과를정규분포로 가정한다 (Lim 등, 2014; Lee와 Huh, 2017).
ᄒ
ᅡ지만 이상치가 있는경우 추론이 로버스트 하지 않으므로, 여러 형태의 대칭인 연속형확률분포를포 ᄒ
ᅡᆷ하고 있는 다변량 정규분포의 척도혼합 (scale mixture)을 이용하여 로버스트한 추론을 할 수 있다 (Ryu와 Kim, 2015). 다변량 정규분포의 척도혼합은다변량 t-분포, 다변량 슬래쉬 (slash) 분포 등의 ᄁ
ᅩ리가 두꺼운다변량 분포를포함하고 있다 (Rosa 등, 2004; Arslan과 Genc, 2009; Cruz, 2014).
ᄇ
ᅩᆫ 논문에서는베이지안 혼합 베타회귀모형에서 다변량 정규분포보다 두꺼운 꼬리를 가지는 랜덤효 ᄀ
ᅪ를고려하기 위하여 다변량 정규분포의 척도혼합을 랜덤효과의 사전분포로 이용하는베이지안 계층적 ᄆ
ᅩ형을제안하고, 이를 실제 자료에 적용하고자 한다.
2. 베이지안 베타회귀분석
2.1. 베타분포 ᄇ
ᅦ타분포를따르는확률변수 Y 에 대한확률밀도함수는
f (y|a, b) = Γ(a + b)
Γ(a)Γ(b)ya−1(1 − y)b−1, 0 < y < 1 ᄋ
ᅪ 같으며, 여기서 형태 모수는 a > 0, b > 0이고 Γ(·)은감마함수를 나타낸다. 베타분포는형태모수 ᄋ
ᅦ 따라 분포의 형태를 다양하게 나타낼 수 있는확률분포로 평균 E(y) = a/(a + b), 분산 V ar(y) = ab/(a + b)2(a + b + 1) 를가진다.
ᄒ
ᅬ귀분석에서는 일반적으로 평균에 대해 모형화를하는것이 더 유용하므로 회귀모형의 구조를평균 ᄀ
ᅪ 정밀도로 나타내기 위해 µ = a/(a + b), ϕ = a + b로 두면, E(y) = µ, V ar(y) = µ(1 − µ)/(1 + ϕ)이 ᄀ
ᅩ, 베타분포 Y ∼ Beta(µϕ, (1 − µ)ϕ)의확률밀도함수는다음과 같이된다 (Paolino, 2001).
f (y|µ, ϕ) = Γ(ϕ)
Γ(µϕ)Γ((1 − µ)ϕ)yµϕ−1(1 − y)(1−µ)ϕ−1, 0 < y < 1, ᄋ
ᅧ기서 0 < µ < 1, ϕ > 0이다. 만일 y가 구간 (a, b)로 제한되어 있는경우 z = (y − a)/(b − a)로 변환 ᄒ
ᅡ여 베타분포를적용할 수 있다.
2.2. 베이지안 혼합 베타회귀모형
y1, · · · , ym은 서로 독립인 확률벡터이며, 여기서 yi = (yi1, · · · , yini)′는 i번째 표본단위에서 관측 되
ᆫ반응벡터이며 yij는 (0, 1)구간내의 값이라고 할 경우, 혼합 베타회귀모형은다음과 같다 (Figueroa- Z´u˜niga 등, 2013).
G(E(yi|bi)) = Xiβ + Zibi, (2.1) ᄋ
ᅧ기서 i = 1, · · · , m이며 G(·)은 조건부 평균반응벡터 E(yi|bi)와 선형혼합모형 ηi = Xiβ + Zibi을 ᄋ
ᅧᆫ결시키는연결 벡터함수, Xi는 ni× p차원의 설계행렬, β = (β1, · · · , βp)′는고정효과에 대한 회귀계 ᄉ
ᅮ, Zi는 랜덤효과 bi= (bi1, · · · , biq)′에 대한 ni× q차원의 설계행렬을나타낸다.
시
ᆨ (2.1)에서 연결함수로 로짓 연결함수를고려하면, 식 (2.1)의 j번째 성분은
ln
µij
1 − µij
= ηij= x′ijβ + z′ijbi (2.2) ᄀ
ᅡ된다. 여기서 µij = E(yij|bi), xij = (xij1, · · · , xijp)′, zij = (zij1, · · · , zijq)′이며, 랜덤효과 bi는 bi|Σb
iid∼ Nq(0, Σb)로 다변량 정규분포를따른다고 가정한다.
ᄎ
ᅮ가로 반응변수의 분산이 동일하지 않는경우, 정밀도 ϕ는 yij에 따라 다른 ϕij로 나타낼 수 있고, 정 미
ᆯ도 ϕij에 대한 혼합모형은로그 연결함수를고려하여 다음과 같이 나타낼 수 있다.
ln(ϕij) = τij= w′ijδ + h′ijdi, (2.3) ᄋ
ᅧ기서 wij= (wij1, · · · , wijp∗)′, hij= (hij1, · · · , hijq∗)′이며, di는 di|Σd
iid∼ Nq∗(0, Σd)로 다변량 정 ᄀ
ᅲ분포를따른다고 가정한다. 설계행렬 Wi = (wi1, · · · , wini)′와 Hi = (hi1, · · · , hini)′는 Xi와 Zi와 ᄀ
ᅡ
ᇀ이 반드시 동일한 설명변수를포함할 필요는없다.
ᄄ
ᅡ라서 위 (2.1)-(2.3)의 모형을계층적 베이지안 모형으로 표현하면 다음과 같다.
(i) yij|β, δ, Σb, Σd
ind.∼ Beta(µijϕij, (1 − µij)ϕij), (i = 1, · · · , m; j = 1, · · · , ni).
(ii) logit(µij) = ηij= x′ijβ + z′ijbi, bi|Σb
iid∼ Nq(0, Σb), (2.4) ln(ϕij) = τij= w′ijδ + h′ijdi, di|Σd
iid∼ Nq∗(0, Σd).
ᄋ
ᅱ 모형에서 랜덤효과 bi와 di가 다변량 정규분포를 따른다고 가정하는데, 반응값에 이상치가 있는 겨
ᆼ우 랜덤효과가 정규분포를따른다고 가정하는것은부적절할 수 있다. 이런 경우 랜덤효과에 대해 정 ᄀ
ᅲ분포 보다 꼬리가 두꺼운 분포를고려하는것이 더 적절하다.
2.3. 다변량 정규분포의 척도혼합 저
ᆼ규분포 보다 꼬리가 더 두꺼운 분포로 다변량 정규분포의 척도혼합을 고려할 수 있다. Z ∼ Nd(0, I)이고, V 가 누적분포함수 H(v|α)와 확률밀도함수 p(v|α)를 가지는 [0, ∞)에서 정의되는 확 류
ᆯ변수이며, Z와 V 는 독립이라고 가정한다. 여기서 α는스칼라 또는 벡터로 정의될 수 있다. d-차원 ᄋ
ᅴ 다변량 정규분포의 척도혼합분포를따르는확률변수 Y 는다음과 같이 정의할 수 있다 (Andrews와 Mallows, 1974).
Y = µ + V−1/2Σ1/2Z, (2.5) ᄋ
ᅧ기서 µ ∈ Rd, Σ1/2는양정치 대칭 행렬의 제곱근을나타낸다. 위 식 (2.5)의 다변량 정규분포의 척도 호
ᆫ합을계층적으로 표현하면 다음과 같다 (Cruz, 2014).
Y |V = v ∼ Nd(µ, v−1Σ), V ∼ H(α).
ᄃ
ᅡ변량 정규분포의 척도혼합은주로 로버스트 추론에 이용되는데, 다변량 t-분포, 슬래쉬 분포 등이 이
ᆻ다.
(1)다변량 t-분포 : 만일 V ∼ Gamma(α/2, α/2)로 다음과 같은확률밀도함수를가질 경우,
f (v|α) = (α/2)α/2vα/2−1exp{−vα/2}, v > 0, α > 0, Y 는자유도가 α인 다변량 t-분포를가지며, Std(µ, Σ, α)로 나타낸다.
(2)다변량 슬래쉬 분포 : 만일 V ∼ Beta(α, 1)로 다음과 같은확률밀도함수를가질 경우,
f (v|α) = αvα−1, 0 < v ≤ 1, α > 0,
Y 는자유도가 α인 다변량 슬래쉬 분포를가지며, SL(µ, Σ, α)로 나타낸다. 다변량 슬래쉬 분포의확률 미
ᆯ도함수는다음과 같다 (Pinheiro 등, 2001).
f (y) = |2πΣ|−1/2 Z 1
0
tα+d2−1e−ts2dt
=
α|Σ|−1/22α+ d2γ(α+d2;s/2) (2π)d/2sα+ d2
, y ̸= µ,
|Σ|−1/2 (2π)d/2
2α
2α+d, y = µ, ᄋ
ᅧ기서 γ(α; z) =Rz
0 tα−1e−tdt로 불완전 감마함수를나타내며, s = (y − µ)′Σ−1(y − µ)를나타낸다.
2.4. 로버스트 베이지안 베타회귀분석 ᄃ
ᅡ변량 정규분포의 척도혼합을적용하여 식 (2.1)-(2.3)의 베이지안 혼합 베타회귀분석 모형을계층적 ᄋ
ᅳ로 나타내면 다음과 같다.
(i) yij|β, δ, Σb, Σd
ind.∼ Beta(µijϕij, (1 − µij)ϕij), (i = 1, · · · , m; j = 1, · · · , ni).
(ii) logit(µij) = ηij= x′ijβ + z′ijbi, bi|Σb
ind.∼ Nq(0, vi−1Σb), (2.6) ln(ϕij) = τij= w′ijδ + h′ijdi, di|Σd
ind.∼ Nq∗(0, u−1i Σd).
(iii) vi와 ui는서로 독립이며, vi
iid∼ H(α1), ui
iid∼ H(α2).
ᄇ
ᅩᆫ 논문에서는 혼합분포 H(·)로 다음두가지 사전분포를이용하여, 다변량 t-분포와 다변량 슬래쉬 분 ᄑ
ᅩ를고려한 로버스트 베이지안 베타회귀분석 모형을적용하고자 한다.
(iiia) vi∼ Gamma(α1/2, α1/2), ui∼ Gamma(α2/2, α2/2). (2.7) (iiib) vi∼ Beta(α1, 1), ui∼ Beta(α2, 1).
(2.6)의 베이지안 혼합 베타회귀분석 모형에서 모수 β, Σb, δ, Σd에 대한 사전분포로 다음과 같은 공 애
ᆨ사전분포를고려할 수 있는데, 여기서 IW 는역위샤트 분포를나타낸다.
β ∼ Np(µβ, Σβ), Σb∼ IWq(νb, Λ−1b ), δ ∼ Np∗(µδ, Σδ), Σd∼ IWq∗(νd, Λ−1d ).
ᄇ
ᅩᆫ 논문에서는 모수 β, Σb, δ, Σd, v, u를 추정하기 위해 마르코프 연쇄 몬테칼로 방법 (Markov Chain Monte Carlo; MCMC)을 사용하여 사후분포를 생성하고 사후평균과 신용구간을 구하고자 한 ᄃ
ᅡ. (2.6)의 베이지안 혼합 베타회귀분석 모형에서 y = (y′1, · · · , y′m)′, η = (η′1, · · · , η′m)′, τ = (τ′1, · · · , τ′m)′라고 하자. 여기서 ηi = (ηi1, · · · , ηini)′, τi = (τi1, · · · , τini)′이다. 따라서 깁스 표집 으
ᆯ사용하기 위한 사후결합확률분포는다음과 같다.