2018, 29
(6)
,1353–1363
뇌영상 fMRI 데이터에 대한 통계적 분석
기 ᆷ재희
1
1덕성여자대학교 정보통계학과
ᄌ ᅥ
ᆸᄉ ᅮ 2018ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 10ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 9ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 14ᄋ ᅵ ᆯ
요 약
ᄎ
ᅬ ᄀ ᅳ ᆫ ᄂ ᅬᄋ ᅧ ᆼᄉ ᅡ ᆼ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄑ ᅩ ᆨ ᄇ ᅡ ᆯᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄌ ᅳ ᆼ ᄀ ᅡᄅ ᅳ ᆯ ᄇ ᅩᄋ ᅵᄀ ᅩ ᄋ ᅵ ᆻᄋ ᅳᄆ ᅧ ᄀ ᅵᄂ ᅳ ᆼᄌ ᅥ ᆨ ᄂ ᅬᄋ ᅧ ᆼᄉ ᅡ ᆼ ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ
ᅡ ᆫ ᄋ ᅧ ᆫᄀ ᅮ ᄄ ᅩᄒ ᅡ ᆫ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅴ ᄌ ᅳ ᆼ ᄀ ᅡᄋ ᅪ ᄃ ᅥᄇ ᅮ ᆯ ᄋ ᅥ ᄋ ᅧ ᆫᄀ ᅮᄀ ᅡ ᄆ ᅢᄋ ᅮ ᄒ ᅪ ᆯ ᄇ ᅡ ᆯᄒ ᅵ ᄌ ᅵ ᆫᄒ ᅢ ᆼᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. fMRI ᄃ ᅦᄋ ᅵᄐ ᅥᄂ ᅳ ᆫ ᄂ ᅬᄀ ᅪᄒ ᅡ ᆨ, ᄂ ᅬ ᄀ
ᅩ
ᆼ ᄒ ᅡ ᆨ, ᄉ ᅵ ᆷᄅ ᅵᄒ ᅡ ᆨ, ᄆ ᅮ ᆯ ᄅ ᅵᄒ ᅡ ᆨ, ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨ ᄃ ᅳ ᆼ ᄋ ᅴ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥᄋ ᅴ ᄋ ᅧ ᆫᄀ ᅮᄌ ᅡᄃ ᅳ ᆯ ᄋ ᅵ ᄒ ᅡ ᆨᄌ ᅦᄀ ᅡ ᆫᄌ ᅥ ᆨ ᄋ ᅧ ᆫᄀ ᅮᄀ ᅡ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡᄋ ᅧ ᄂ ᅬ ᄒ ᅪ ᆯᄃ ᅩ ᆼ(brain activity) ᄒ ᅧ ᆫᄉ ᅡ ᆼᄋ ᅦ ᄀ ᅪ ᆫ ᄒ ᅡ ᆫ ᄀ ᅮ ᆼᄀ ᅳ ᆨᄌ ᅥ ᆨ ᄌ ᅥ ᆼᄇ ᅩᄅ ᅳ ᆯ ᄋ ᅥ ᆮᄀ ᅵᄋ ᅱᄒ ᅢ ᄉ ᅥ ᆫᄌ ᅵ ᆫᄀ ᅮ ᆨ ᄋ ᅦᄉ ᅥ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄌ ᅵᄋ ᅯ ᆫ ᄀ ᅪ ᄃ ᅥᄇ ᅮ ᆯ ᄋ ᅥ ᄋ ᅧ ᆫᄀ ᅮᄌ ᅡᄃ ᅳ ᆯᄋ ᅳ ᆫ ᄂ ᅬ ᄋ
ᅧ ᆫᄀ ᅮᄋ ᅦ ᄇ ᅡ ᆨᄎ ᅡᄅ ᅳ ᆯ ᄀ ᅡᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ fMRI ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅴ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄉ ᅥ ᆯᄆ ᅧ ᆼᄒ ᅡᄀ ᅩ ᄂ ᅬᄃ ᅦᄋ ᅵᄐ ᅥ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨ ᄀ
ᅪ ᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆨ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄉ ᅥ ᆯᄆ ᅧ ᆼᄒ ᅡᄀ ᅩ ᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆨ ᄆ ᅮ ᆫ ᄌ ᅦᄅ ᅳ ᆯ ᄃ ᅡᄅ ᅮᄋ ᅥ ᄋ ᅡ ᇁᄋ ᅳᄅ ᅩ ᄂ ᅬ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄋ ᅴ ᄑ ᅵ ᆯᄋ ᅭᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄃ ᅥᄋ ᅮ ᆨ ᄀ ᅡ ᆼᄌ ᅩᄒ ᅡᄀ ᅩ ᄌ
ᅡ ᄒ ᅡ ᆫᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄂ ᅬᄂ ᅦᄐ ᅳᄋ ᅯᄏ ᅳ, ᄂ ᅬᄋ ᅧ ᆫᄀ ᅧ ᆯᄉ ᅥ ᆼ, ᄂ ᅬᄋ ᅧ ᆼᄉ ᅡ ᆼ fMRI ᄃ ᅦᄋ ᅵᄐ ᅥ, ᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆨ ᄂ ᅬᄀ ᅪᄒ ᅡ ᆨ ᄋ ᅧ ᆫᄀ ᅧ ᆯᄎ ᅦᄒ ᅡ ᆨ.
1. 서론 ᄀ
ᅵ능적 뇌영상 (functional Magnetic Resonance Imaging; fMRI) 데이터는기술적 분류에 따라 여러 혀
ᆼ태가 있다. 전기뇌파 기록법 (electrocenphalography: EEG)와 뇌자도 (magnetoencephalography;
MEG)는뇌의 전기적이고 자기적인활동에 대한 이미지 측정 데이터이다. fMRI와 양전자방출단층촬영 ᄉ
ᅮᆯ (positron emission tomography; PET)은뇌 영역과 시간에 따라 변하는 뉴런의활동에 따른혈류 (blood flow)의 변화를나타낸다. 각 방법은장단점을가지며 뇌기능에 대한 특유의 정보를제공하며 각 ᄃ
ᅦ이터 마다 통계적 분석 이슈를가지고 있으며 해결해야 할 과제가 많이 있다. 여기서는 특히 fMRI 데 ᄋ
ᅵ터 분석에관련된 통계적 문제를언급하고자 하며 통계연구자들의 역할이 더욱 중요함을강조하고자 ᄒ
ᅡᆫ다.
저
ᆼ신과적 문제를포함한 뇌장애관련하여 인간 두뇌의 내부 작용을 이해하려는 문제는 통계학 등 여 ᄅ
ᅥ 융합과학적 접근을 통해서 시도되고 있는 문제이다. 최근 MRI, fMRI, EEG, PET 등 여러 뇌영 ᄉ
ᅡᆼ기술에 의해 다양한 데이터가 발생되고 있으며 이러한 뇌영상데이터를 통해 질병진단 및 예측, 인 ᄀ
ᅡᆫ의 경험에 대한 특성화, 뇌 영역과 인지적 (cognitive) 결과와의 연관성 등을 알아내고자하는 요구 ᄀ
ᅡ 증가하고 있다. 그러나 의학적 뇌 이미지 데이터에 대한 통계적 분석은 기존의 고전적 통계 방법으 ᄅ
ᅩ 해결할 수 없는 복잡한 문제를 가지고 있다. 뇌연구에서의 체계적 통계적 데이터 분석은뇌정보학 (Neuroinformatics), 뇌통계학 (Neurostatistics)와 같은합성어에서도 알 수 있듯이 매우 의미 있으면 ᄉ
ᅥ도 해결해야 할 과제가 매우 많은 분야인 것이다.
ᄂ
ᅬ에관한 정보를제공하는 fMRI데이터 기반하여 뇌관련 질병연구는활발이 진행되어왔다. 파킨슨 벼
ᆼ (Parkinson’s disease) 연구에서 Ceballos-Baumann (2003)은 fMRI데이터가 강력한 분석도구가될
1
(01369) ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵ ᄃ ᅩᄇ ᅩ ᆼ ᄀ ᅮ ᄉ ᅡ ᆷᄋ ᅣ ᆼᄅ ᅩ 144ᄀ ᅵ ᆯ 33, ᄃ ᅥ ᆨᄉ ᅥ ᆼᄋ ᅧᄌ ᅡᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
ᄉ
ᅮ 있으며 PET 데이터와 같이 연구되어 치료방법 개발에 대한 가능성을알렸다. Fornito 등 (2012)은 ᄂ
ᅬ이상 (brain disorder) 질병으로 조현병 (schizophrenia)에 대해 뇌영상데이터와 연결성에 대한 연구 ᄅ
ᅳᆯ정리하였다. Wang 등 (2013)은 fMRI데이터 기반 뇌연결성 연구를 통해 우울증환자들의 휴면 상 ᄐ
ᅢ 기능연결 (resting state functional connectivity: RSFC)에 특성이 있음을설명하였다. 뇌데이터 ᄀ
ᅵ반으로 의학분야외에도 여러 분야에서활용되고 있다. Kwon (2009)은피험자 개인별 영어능력 검사 ᄌ
ᅥᆷ수에 대한 뇌파지표를도출하여 단계적 변수선택법에 의한 다중회귀분석을 통해 정량뇌파분석을보여 ᄌ
ᅮ었다. 또한 Kwon (2015)은 SMR 뇌파 데이터를이용하여 효과적인 통합뇌 학습이 높은청각학습과 ᄉ
ᅵ각학습에 밀접하게관련되어 있다는것을보였다.
ᄀ
ᅵ능적 MRI 방법은 뇌활동을 측정하는데 해가 없는 (noninvasive) 방법으로 각 개체(개인)에 대해 시
ᆯ험을 하는 동안 일련의 뇌영상 이미지를 얻게 된다. 지난 10 여년간 fMRI 데이터는 인간 뇌의 내 ᄇ
ᅮ 활동에 대한 새로운 정보를 제공했다. 대부분 fMRI 데이터 분석의 공통적인 목적은 주어진 과제 (task)에 대해 기능적 역할을하는뇌활동영역 위치를찾고 심리학적 상태 또는 질병의 상태에 대해 추 ᄅ
ᅩᆫ하고 예측하고자 한다. 이러한 문제를해결하기 위해서는뇌활성화영역에 대한 추정 및 검정, 뇌 연 겨
ᆯ성 추정, 뇌 네트워크 (brain network) 분포 문제 등을포함한 통계적 분석 문제가 대두되며 통계학자 ᄋ
ᅴ 중요한 역할을기대하게된다.
2. fMRI 데이터와 특성 ᄂ
ᅬ에 대한 연구가 특히 어려운 이유는 직접적인 실험이 불가능하고 데이터가 비체계적 (unsystem- atic)인 특성을가지고 있다는것이다. 뇌관련 데이터는생물학적인 조직, 종,발달단계 등에 따라 다르 ᄆ
ᅧ 여러 개체에 대해 여러 상황에서 달리 발생되는가변성을포함하고 있다. 뇌이미지 데이터를얻기위 ᄒ
ᅢ 피실험자는 1.5 ∼ 7.0 Telsa 정도의 강력한 전자기장 (electromagnetic field)에 놓여 MR 신호데이 ᄐ
ᅥ를 얻게된다. fMRI 데이터는 시공간상 (spatial-temporal)에서 비선형 비정상 다변량시계열 (non- stationary nonlinear multivariate time series)이며 변동성 (volatility)과 상호변동성 (co-volatility)을 ᄂ
ᅡ타내며 공간상 연결성을 가진 잡음이 많은 데이터이며 내재된 연결성은 네트워크를 형성하므로 매 ᄋ
ᅮ 많은모수를가지는 고차원 데이터의 성격을 지닌다. 각 스캐닝 세션에서 각 복셀에 대해 혈류산소 ᄉ
ᅮ준 (Blood-Oxygen-Level Dependent: BOLD) fMRI 반응을 측정하여 데이터를얻게된다 (Aguirre ᄃ
ᅳᆼ, 1998). BOLD이미지는산소화된헤모글로빈 (oxygenated hemoglobin)과 탈산소화된헤모글로빈 (deoxygenated hemoglobin)의 차이를나타내며 각각 반자기성 (diamagnetic)과 상자기성 (paramag- netic) 특성을 반영하여 국소적인 자기장 강도 차이로 신호를 준다. BOLD 반응데이터는 신경과 혈관 ᄋ
ᅦ관련한 (neuronal and vascular) 변화의 복합적이고 비선형 함수로 표현될수 있어 이러한 함수를모 혀
ᆼ화하기 쉽지않다. 반응함수 자체도 자극과 실험조건에 따라 다르게 나타나며 생리학적 비선형 모형과 ᄀ
ᅮ별해야하는경우도 있다. 참고로 Lindquist (2008)는 fMRI데이터에 대한 통계적 분석이슈와 모형을 ᄌ
ᅡ
ᆯ 설명한다.
ᄐ ᅩ
ᆼ계분석을위한 최종 fMRI데이터를얻기위해서는 일련의 전처리 과정이 필수적이다. Figure 2.1은 fMRI데이터를얻은후 전처리 (preprocessing) 과정을거치는 파이프라인을보여준다. 전처리과정을 ᄐ
ᅩ
ᆼ해 얻은데이터에 대해 Figure 2.2는한 개 복셀 (voxel)에서의 fMRI 데이터 예를보여준다.
화
ᆨ률표본은 랜덤벡터 y1, . . . , yT로 구성되며 yi는시계열 데이터벡터이다. 뇌영상 fMIR데이터는다 ᄋ
ᅳ
ᆷ과 같은데이터 구조을갖는다. 각 개인(개체)에 대해 스캔(53 × 63 × 46), 또는 (64 × 64 × 30)한 데이 ᄐ
ᅥ로 복셀을요소로 가지는 3차원 격자를형성하는데이터 (x, y, z)를얻는다. 각 복셀은 BOLD fMRI ᄇ
ᅡᆫ응값으로 국소적 뇌활동에관한 시계열적 측정값이다. 시간에 따라 변화하는 복셀간 상호작용, 관심 여
ᆼ역 (region of interest: ROI)간 상호작용을포함한 영역간 연결성 분석을위한 통계적 모형과 방법
ᄀ
ᅢ발을연구하고자 한다. 랜덤벡터 y1, . . . , yT들의 시간별, 개체별, 영역별 그리고 그룹별 동적인 움직 이
ᆷ에 대한 통계적 정보를얻고자한다. 반응값 yi(v, t)는 i번째 개체가 v번째 복셀에서 t 시점에서 얻은 과
ᆫ측값이다. 여기서 i = 1, . . . , N는개체에 대한 번호, v = 1, . . . , V 는 복셀 또는관심영역인 ROI에 ᄃ
ᅢ한 번호, t = 1, . . . , T 는시점 (time point)에 대한 일련번호이다.
Figure 2.1 fMRI data process pipeline
Figure 2.2 fMRI data example with TR=0.06s in one voxel
3. fMRI 데이터 분석
fMRI데이터에 대한 분석은자연적으로 통계적 문제가 되므로 통계학자들의 연구 영역이된다. 시공 ᄀ
ᅡᆫ성 복잡 데이터이며 잡음이 많은대량 데이터에 대한 분석이라는 측면에서 효율적인 통계적 모형 구축 으
ᆯ위해서는 통계적 이론과 방법 문제와 더불어 계산적 문제를포함하게 되며 이러한 문제들을 균형있게 ᄒ
ᅢ결해야한다.