책임저자: 신호철, 서울시 종로구 평동 108번지
110-746, 강북삼성병원 가정의학과
Tel: 02-2001-2277, E-mail: [email protected] 접수: 2011년 10월 7일, 심사: 2011년 12월 3일
게재승인: 2011년 12월 17일
일차의료에서 주요우울장애 선별을 위한 PHQ-2/PHQ-9 연속선별검사의 유용성
*성균관대학교 의과대학 강북삼성병원 가정의학교실, †연세대학교 의과대학 세브란스병원 가정의학교실
김 성 래 *
,†
ㆍ신 호 철 *ㆍ이 덕 철†
ㆍ김 철 환 *ㆍ성 은 주 *ㆍ이 계 화 *ㆍ김 자 영 *Use of the PHQ-2/PHQ-9 Serial Screening Instrument for Detecting Major Depressive Disorder in Primary Care
Seong-Rai Kim*
,†, Ho-Cheol Shin*, Duk-Chul Lee
†, Cheol-Hwan Kim*, Eun-Ju Sung*, Kye-Hwa Lee*, Ja-Young Kim*
Department of Family Medicine, *Kangbuk Samsung Hospital, Sungkyunkwan University School of Medicine, †Severance Hospital, Yonsei University College of Medicine, Seoul, Korea
In Primary care, many screening tools to detect depression are used. Patient health questionnaires (PHQ)-2/PHQ-9 serial screening is reported to be more efficient than other questionnaires in primary setting in western country. Therefore, we identified the efficacy of PHQ-2/PHQ-9 serial screening in primary care setting in Korea. We compared PHQ-2/PHQ-9 serial screening with other screening tools in terms of diagnostic accuracy and time required to detect Major depressive disorder (MDD). Total 201 ambulatory patients completed questionnaires in a family practice center at one university hospital. Then, the subjects were interviewed by family doctors according to DSM-IV criteria. The reliability, sensitivity, specificity and the time required to finish PHQ-2/PHQ-9 serial screening were examined and compared to other screening tools (PHQ-2, PHQ-9, BDI). There were 27 patients in the MDD group and 174 in the non-MDD group. The Cronbach’s alpha of PHQ-2, PHQ-9, and BDI was 0.730, 0.863, and 0.905, respectively. The diagnostic accuracy of PHQ-2/PHQ-9 serial screening was 87.0%, which is superior to those of PHQ-2, PHQ-9, and BDI (69.2%, 81.6% and 72.6%, respectively) The estimated time required of PHQ-2/PHQ-9 serial screening, about 132.9±6.1 seconds, was less than those of BDI, about 224.17±11.9 seconds. PHQ-2/PHQ-9 serial screening had a better diagnostic accuracy and took less time than the other screening tools for depression. Therefore, PHQ-2/PHQ-9 serial screening is the most useful measure for detecting depression in primary care. (Korean J Str Res 2011;19:405∼410)
Key Words: Depression, Screening, PHQ, BDI
서 론
우울증은 일차 의료에서 매우 흔하게 접하게 되는 질환 으로, 국내 유병률 또한 계속 증가하는 추세이다. 2006년 한 국내 역학조사(Cho MJ et al., 2009)에서 주요우울장애의
평생유병률은 5.6%, 1년 유병률은 2.5%로 이전 연구에 비 해 증가하는 양상을 보였다. 세계 보건기구(WHO)의 보고 에 따르면 우울증으로 인한 사회, 경제적 부담은 계속 증 가해서 2020년에는 모든 질병들 가운데 2위를 차지할 것으 로 전망된다(Sartorius et al., 1996).
일차 진료의를 방문하는 성인환자에서 우울증의 유병률 은 지역사회 유병률의 약 2배인 것으로 보고되고 있다. 대 부분의 환자들이 정신과 환자로 낙인찍히기(stigmatized)를 두려워하여 정신과에 의뢰를 기피하고 일차 진료에서 치 료 받는 경우가 많으므로 일차의료에서 우울증의 선별과 진단은 매우 중요하다(Kim DH et al., 2006).
하지만 일차 진료의를 찾는 우울증 환자들은 정서적 증 상보다는 통증이나 신체 기능 저하와 같은 신체적인 증상 을 주로 호소하는 경향이 있으며(Beck AT et al., 1961), 일차 의료의 바쁜 외래 특성상 진단에 충분한 면담이 어렵기 때 문에 약 50%의 환자들이 발견되지 못하고 있다(Whooley et
al., 1997).
이러한 측면에서, 일차 진료에서의 우울증에 대한 효율 적인 선별이 중요하다고 볼 수 있다. 2002년 미국질병예방 위원회(USPSTF)에서도 우울증의 간파와 환자의 예후를 향 상시키기 위해 성인에서 우울증 선별검사를 권고하였으 나, 어떤 선별도구를 사용해야 하는지에 대해서는 제시를 하지 않았다(Pignone et al., 2002).
현재 일차의료 영역에서 우울증에 대한 다양한 선별검 사 도구들이 사용되고 있다. 가장 많이 사용되는 도구로는 Beck Depression Inventory (BDI), Zung의 Self-rating Depression Scale (SDS), Hamilton Depression Rating Scale (HDRS), Center for Epidemiologic Studies Depression Scale (CES-D), Patient Health Questionnaire-2 (PHQ-2)와 PHQ-9 등이 있다. 특히 최 근 PHQ-2와 PHQ-9의 연속선별검사(serial screening)는 문항 수가 적어 시간이 덜 걸리면서도 우울증을 보다 더 정확하 게 진단할 수 있다는 보고가 나오면서 주목을 받고 있다 (Thibault et al., 2004).
국내에서는 BDI (Hahn HM et al., 1986; Shin HC et al., 2000), SDS (Yang JG, 1982; Shin HC et al., 2000), HDRS (Kim CY et al., 2002), CES-D (Shin SC et al., 1991) 등에 대한 표준 화 작업이 이루어 졌으나 이 평가 도구들은 문항 수가 너 무 많아서 바쁜 외래 진료 환경 및 일차진료 영역에서는 사용하기 불편한 면이 있다(Lim KH et al., 2009).
일차의료 환경에서 사용하기에 가장 적합해 보이는 PHQ-2와 PHQ-9에 대한 국내 표준화 연구는 미흡한 편이
다. Myung SK et al.(2000)에 의한 PHQ-2의 표준화 연구는 청소년들만을 대상으로 하였고, Choi HS et al.(2007)에 의한 PHQ-9의 표준화 연구는 다른 선별도구와 비교를 하지 않 았으며, 연속선별검사의 유용성은 평가하지 않았다.
Thibault et al.(2004)은 연속적인 두 가지 설문을 이용하는 것이 하나의 설문을 이용하는 것보다 더 정확하므로, PHQ-2와 PHQ-9의 연속선별검사로 우울증을 보다 더 정확 하게 진단할 수 있다고 제시하였다. 하지만, 국내에서 이 연속선별검사를 다른 선별도구들과 비교한 연구는 없다.
본 연구에서는 PHQ-2/PHQ-9 연속선별검사(serial screen- ing)가 다른 우울증 선별검사 도구인 BDI 및 PHQ-2, PHQ-9 단독시행보다 진단 정확도가 높고, 소요되는 시간에 있어 서도 이득이 있어 가장 유용한 선별검사가 될 수 있는지 확인해 보고자 한다.
재료 및 방법
1. 연구대상 및 기간
2010년 2월 1일부터 6월 30일까지 5개월 동안 일개 대학 병원 가정의학과 외래를 방문한 성인 환자 중 우울증에 대 한 설문에 참여하기를 동의한 201명을 대상으로 하였다.
2. 연구 도구
1) PHQ-2: PHQ-2는 흥미상실과 우울과 관련된 두 가 지 항목만을 묻는 2항목 선별검사로, 환자들은 이에 대해 예/아니오로 답하도록 이루어진 설문이다. 즉, 자기보고형 이 아닌 임상가-평가형 우울증 선별도구이며, 두 질문 중 어느 하나라도 양성을 보인 경우 검사 양성으로 판정한다.
본 연구에서는 Myung SK et al.(2000)이 번안한 PHQ-2 설문 을 사용하였으며, 그 내용은 다음과 같다.
① 지난 한 달 동안 당신은 자주 기분이 쳐지거나 우울 하거나 희망이 없다는 느낌으로 고민하고 있습니까?
② 지난 한 달 동안 당신은 자주 일상적인 활동에 흥미 나 즐거움의 감소 때문에 고민하고 있습니까?
2) PHQ-9: DSM-IV의 우울증 진단기준에 해당하는 9가 지 항목으로 구성되고, 최근 2주 동안 얼마나 이러한 문제 를 자주 겪었는지 알아보는 도구이다. 반응은 “전혀 그렇 지 않다.”, “수일 정도”, “1주일 이상”, “거의 매일”의 4점 척도로 평가하며, 점수의 범위는 0∼27점이다. 본 연구에 서는 최홍석 등의 연구(Choi HS et al., 2007)에서 제시한 절 단점수(10점)와, 이 연구에서 번안한 설문을 사용하였다.
Table 1. Sociodemographic characteristics of study populations.
a CharacteristicsMDD groupd (n=27)
Non-MDD groupd (n=174)
Total
(n=201) p-valueb
Age (y)
∼30 31∼40 41∼50 51∼60 61∼
Female sex Education level
Elementary school Middle school High schiool College and higher Marriage
Single Married Divorced No response Income (104 won/month)
∼99 100∼199 200∼299 300∼
Smoking Non-smoking Ex-smoking Current smoking Alcohol drinking
None 1∼2/w 3∼4/w 5∼/w
10 (37) 7 (25.9) 3 (12.5) 2 (7.4) 5 (18.5) 15 (55.6)
2 (7.4) 2 (7.4) 8 (29.6) 15 (55.6)
13 (48.1) 12 (44.4) 1 (3.7) 1 (3.7)
6 (22.2) 4 (14.8) 8 (29.6) 9 (33.3)
16 (59.3) 6 (22.2) 5 (15.6)
13 (48.1) 13 (48.1) 1 (3.7) 0 (0)
43 (24.7) 29 (16.7) 35 (20.1) 39 (22.4) 28 (16.1) 104 (59.8)
16 (9.2) 17 (9.8) 45 (25.9) 96 (55.2)
49 (24.4) 106 (60.9) 5 (2.9) 14 (8.0)
20 (11.5) 21 (12.1) 43 (24.7) 90 (51.7)
114 (65.5) 26 (14.9) 34 (19.5)
100 (57.5) 61 (35.1) 8 (4.6) 5 (2.9)
53 (26.4) 36 (17.9) 38 (18.9) 41 (20.4) 33 (16.4) 119 (59.2)
18 (9.0) 19 (9.5) 53 (26.4) 111 (55.2)
62 (30.8) 118 (58.7) 6 (3.0) 15 (7.5)
26 (12.9) 25 (12.4) 51 (25.4) 99 (49.3)
130 (64.7) 32 (15.9) 39 (19.4)
113 (56.2) 74 (36.8) 9 (4.5) 5 (2.5)
nsc
0.678 nsc
nsc
nsc
nsc
nsc
MDD: major depressive disorder.
aData are presented as number (%). bp-value from χ2 test comparing a difference between any of the 2 study groups. cNot significant. dMDD group and Non-MDD group classified by DSM-IV.
3) BDI: 일차 의료에서 가장 흔하게 사용되고 있는 선별 검사 도구 중 하나로서, 총 21문항으로 구성되어 있다. 반 응은 각 문항당 0∼3점으로 평가하며, 점수의 범위는 0∼
63점이다. 본 연구에서는 Hahn HM et al.(1986)에서 제시한 절단점수(13점)와, 이 연구에서 번안한 설문을 사용하였다.
4) PHQ-2/PHQ-9 연속 선별검사: 한 환자에게 PHQ-2 와 PHQ-9 설문을 연속적으로 시행하여 우울증을 선별하는 것이다. PHQ-2와 PHQ-9 두 설문에 모두 양성인 경우만을 검사 양성으로 판정하며, 나머지 경우는 음성으로 판정한 다.
3. 연구 방법
외래 진료 중 주치의가 연구 대상들에게 PHQ-2에 해당 하는 2항목의 질문을 하였고, PHQ-2의 결과와 관계 없이 모든 대상자들에게 설문지를 작성하도록 하였다. 설문에 는 연령, 성별, 결혼상태, 교육, 가계수입, 흡연, 음주 등과 관련된 사회인구학적 특성 및 PHQ-9, BDI의 설문 내용과 각 설문의 소요시간이 포함되어 있었다. 연구 대상이 직접 자기 기입식으로 설문을 작성하도록 하여 자료를 수집하 였다.
이후 설문을 모두 작성한 환자들에 대해 주치의가 직접 주요우울장애의 DSM-IV 진단기준에 의거하여 면접을 시 행하였고, 이 기준을 우울증 진단의 황금기준(Gold stand- ard)으로 삼았다.
이를 통해 PHQ-2/PHQ-9 연속 선별검사의 정확도 및 소 요시간을 PHQ-2, PHQ-9, BDI 각각의 설문과 비교하였다.
4. 통계분석
연구 대상 중 우울증 환자와 비우울증 환자의 사회인구 학적 특성 비교를 위해 Chi-square 검정을 이용하였으며, PHQ-2, PHQ-9, BDI 각 설문의 신뢰도 분석을 위해 Cron- bach’s alpha 값을 산출하였다.
또한 어떤 설문도구가 주요우울장애에 대해 가장 유용 한지를 알아보기 위해, PHQ-2, PHQ-9, BDI, PHQ-2/PHQ-9 연속 선별검사 각각의 DSM-IV 진단기준에 대한 정확도 및 소요시간을 비교하였다.
통계적 유의 수준은 0.05 미만으로 하였으며, 모든 자료 분석에는 통계 프로그램인 PASW Statistics 17.0 (SPSS Inc.
Chicago, IL, USA)를 사용하였다.
결 과
1. 대상자의 사회 인구학적 특성
총 201명의 조사 대상 중 DSM-IV 진단기준에 의한 우울 증 환자는 27명(13.4%), 비우울증 환자는 174명(86.6%)이었 다. 연구대상의 사회인구학적 특성 즉, 연령, 성별, 결혼상 태, 교육, 가계수입, 흡연, 음주 등은 우울증 환자군과 비우 울증 환자군 사이에 통계적으로 유의한 차이를 보이지 않
Table 2. The result of screening tools for major depressive disorder.
a Test positive result Disease statusp-valueb
MDD No MDD
PHQ-2 PHQ-9 BDI
PHQ-2/PHQ-9 serial screening
27/27 (100%) 23/27 (85.2%) 22/27 (81.5%) 23/27 (85.2%)
62/174 (35.6%) 33/174 (19%) 50/174 (28.7%) 22/174 (15.5%)
<0.001
<0.001
<0.001
<0.001
aBased on the number of true-positive and true-negative test resultsin each screening tool. bp-value from χ2 test comparing a difference between any of the 2 study groups.
Table 3. Accuracy of screening tools in identifying major depressive
disorder.aPHQ-2 PHQ-9 BDI PHQ-2/PHQ-9
serial screening Sensitivity (%)
Specificity (%) Overall accuracy (%)
100 64.4 69.2
85.2 81.0 81.6
81.5 71.3 72.6
85.2 87.4 87.0
aBased on the number of true-positive and true-negative test resultsin each screening tool.
았다(Table 1).
2. 각 설문도구의(PHQ-2, PHQ-9, BDI) 신뢰도 본 연구에서 사용한 PHQ-2, PHQ-9, BDI 설문 각각의 신 뢰도를 알아보기 위한 내적 일치도는 Cronbach’s alpha 값이 각각 0.730, 0.863, 0.905의 결과를 보였다.
3. PHQ-2/PHQ-9 연속 선별검사와 기타 설문도구 와의 정확도 및 소요시간 비교
DSM-IV 진단기준을 황금 기준으로 하였을 때 연구 대상 자 중 우울증 환자는 201명 중 27명으로 13.4%이었다. 각 각의 설문 도구에 따른 결과는 Table 2와 Table 3에 나타난 바와 같았으며, 설문도구 중 PHQ-2/PHQ-9 연속선별 검사 의 정확도(87.06%)가 가장 높았다.
각 설문 도구를 작성하는데 소요된 시간은 PHQ-9이 102.9±6.1초(Mean±SEM; Standard Error Deviation)이었고, BDI 는 224.17±11.9초(Mean±SEM)이었다.
고 찰
우울증은 환자들의 사회적, 신체적 장애를 일으키며 특 히 자살의 위험을 증가시키는 것으로 알려져 있으므로 조 기 발견을 통한 적절한 치료가 매우 중요한 질환이다. 현 재 우울증을 조기에 발견하여 적절한 치료를 제공하기 위 한 많은 선별검사들이 일차의료에서 사용되고 있다. DSM- IV의 주요우울장애의 진단기준이 있음에도 이렇게 일차의 료에서 선별검사를 사용하는 이유는 바쁜 외래 특성상 환 자와 충분한 면담이 어렵기 때문이다. 따라서 빠른 시간 내에 보다 정확하게 우울증 진단을 보조할 수 있는 선별검 사가 일차의료에서 가장 도움이 될 것이다(Nease et al.,
2002).
일차의료 영역에서 우울증 진단에 대한 가장 효율적인 선별검사를 찾기 위하여 본 연구를 시행하였다. 정확도와 시간적인 측면에서 우울증의 진단에 어떤 선별도구가 가 장 좋은지를 보기 위하여, PHQ-2/PHQ-9 연속선별검사를 현재 일차진료에서 많이 사용하고 있는 BDI 및 PHQ-2, PHQ-9 각각의 단독 시행과 비교하였다.
설문도구들의 신뢰도를 측정하기 위한 방법으로 Cron- bach’s alpha 값을 사용하였다. Cronbach’s alpha 값은 집단 수 준인 경우에는 alpha 값이 0.6 이상, 개인 수준에서는 0.9 이 상이면 높다고 할 수 있다. 본 연구에서 사용한 PHQ-2, PHQ-9, BDI의 Cronbach’s alpha 값은 각각 0.730, 0.863, 0.905로서 모두 집단 수준에서는 높은 신뢰도를 보여주었 다.
타당도를 알아보기 위해 각 설문도구들의 민감도, 특이 도, 예측도를 각각 계산하였고, 어떤 검사가 더 정확도가 높은지 비교하였다. PHQ-2/PHQ-9 연속 선별검사의 정확 도가 87% (민감도 85.2%, 특이도 87.4%)로 다른 선별도구 들(PHQ-2, PHQ-9, BDI)의 정확도보다 높았다.
설문도구를 작성하는데 소요되는 시간은 PHQ-9이 102.9±
6.1초, BDI는 224.17±11.9초였다. PHQ-2의 두 항목을 환자 에게 물어보는데 소요되는 시간은 대부분 30초 미만이었 으므로, 선별검사를 시행하는데 있어 PHQ-2/PHQ-9 연속 선별검사가 BDI에 비해 시간적 이득이 있었다.
결론적으로, PHQ-2/PHQ-9 연속선별검사는 정확도가 가 장 높고 소요되는 시간도 BDI보다 적어 가장 좋은 선별검 사임을 입증할 수 있었다.
PHQ-2/PHQ-9 연속선별검사를 실제 임상에 적용할 때 고려해야 할 사항이 있다. DSM-IV의 주요우울장애 진단기 준(American Psychiatric Association, 1994)에는 특징적 9가지 증상을 나타내는 항목과 배제하기 위한 항목 4가지가 있 다. 배제하는 기준항목 4가지는 (1) 혼재성 삽화의 배제 (2)
증상이 기능 영역에서 심각한 고통이나 장해를 일으켜야 함 (3) 물질 및 일반적 의학적 상태에 의한 것 배제 (4) 사별 반응 배제 이다. 즉, DSM- IV 진단기준에 의하면 특징적인 증상 9가지 중 5가지 이상을 만족해도, 배제하는 항목 4가 지 중 하나라도 해당하면 우울증 진단을 내릴 수 없다.
본 연구의 선별검사에서 사용한 PHQ-2와 PHQ-9는 모두 우울증의 특징적인 증상만을 다루고 있고 배제하기 위한 기준은 포함되어 있지 않다. 실제로, 본 연구대상에게 DSM-IV를 사용하여 우울증 진단을 내릴 때, 201명 중 10명 의 환자들은 특징적인 증상 항목에서 우울증 진단을 만족 하였음에도 불구하고 배제하는 항목에 의해 우울증이 아 닌 것으로 나타났다. PHQ-2/PHQ-9 선별검사를 우울증을 확진하는데 사용하기 위해서는, 이러한 배제하는 항목에 대한 고려가 필요할 것이다. 이러한 배제 기준에 대한 고 려가 필요한 점은 비단 PHQ-2/PHQ-9 연속선별검사뿐 아 니라 모든 우울증 선별검사에 해당되는 내용이다.
본 연구의 제한점은 다음과 같다. 우선, 모집된 연구대상 이 일개 병원 가정의학과를 방문한 환자여서 교육수준이 평균보다 훨씬 높은 등 우리나라 전체 일차의료환자를 대 표하기에는 미흡할 수 있다. 또한 설문도구들의 신뢰도 검 증에 있어 내적일치도만 구하고 검사-재검사법에 의한 안 정성을 평가하지 못하였다.
본 연구는 일차의료환경에서 PHQ-2/PHQ-9 연속선별검 사의 유용성을 확인한 데 의의가 있다. 향후 본 연구의 제 한점을 극복하여 일차 의료 환자를 대상으로 보다 대규모 의 연구가 이루어진다면, 우울증 선별검사로서 PHQ-2/
PHQ-9 연속선별검사의 의의를 보다 명확하게 파악할 수 있을 것이다.
참 고 문 헌
American Psychiatric Association (1994) Diagnostic and statistical manual of mental disorders. 4th ed. P327. American Psychiatric Association, Washington, D.C.
Beck AT, Ward CH, Mendelson M et al. (1961) Inventory for measuring depression. Arch. Gen. Psychiatry 4:561-571.
Cho MJ, Chang SM, Hahm BJ et al. (2009) Prevalence and correlates of major mental disorders among Korean adults: a 2006 national epidemiologic survey. J. Korean Neuropsychiatr Assoc. 48:143-152.
Choi HS, Choi JH, Park KH et al. (2007) Standardization of the
Korean version of patient health questionnaire-9 as a screening instrument for major depressive disorder. Korean J. Fam. Med.
28:114-119.
Hahn HM, Yum TH, Shin YW et al. (1986) A standardization study of beck depression inventory in Korea. J. Korean Neuropsychiatr Assoc. 25:487-502.
Kim CY, Goh JK, Ro EY (2002) Item Characteristics of the hamilton rating scale for depression-self-report inventory. J.
Korean Neuropsychiatr Assoc. 41:905-911.
Kim DH, Kim JB (2006) Screening for depression in primary care.
J. Korean Acad. Fam Med. 27:163-169.
Lim KH, Park YN, Kim DH et al. (2009) A preliminary study of the standardization of the Korean version of the patient health questionnaire-9. J. Health Promot Dis. Prev. 9:275-281.
Myung SK, Jeong B, Lee WJ et al. (2000) Standardization of the two - question case finding instrument as a screening instrument for the adolescent's depression Korean. J. Fam. Med. 21:100-106.
Nease DE, Klinkman MS, Volk RJ (2002) Improved detection of depression in primary care through severity evaluation. J. Fam.
Pract. 51:1065-1070.
Pignone MP, Gaynes BN, Rushton JL et al. (2002) Screening for depression in adults: a summary of the evidence for the U.S.
preventive services task force. Ann. Intern Med. 136:765-776.
Sartorius N, Ustun TB, Lecrubier Y et al. (1996) Depression comorbid with anxiety: results from the WHO study on psychological disorders in primary health care. Br. J. Psychiatry.
168(Suppl 30):S38-43.
Shin HC, Kim CH, Park YW et al. (2000) Validity of beck depression inventory (BDI): detection of depression in primary care. Korean J. Fam. Med. 21:1451-1465.
Shin HC, Kim CH, Park YW et al. (2000) Validity of Zung's self-rating depression scale: detection of depression in primary care. Korean J. Fam. Med. 21:1317-1329.
Shin SC, Kim MK, Yun KS et al. (1991) The center for epidemiologic studies-depression scale (CES-D): its use in Korea.
J. Korean Neuropsychiatr Assoc. 30:752-767.
Thibault JM, Steiner RW (2004) Efficient identification of adults with depression and dementia. Am. Fam. Physician. 70:1101- 1110.
Whooley MA, Avins AL, Miranda J et al. (1997) Casefinding instruments for depression. two questions are as good as many.
J. Gen. Intern Med. 12:439-445.
Yang JG (1982) The self-rating depression scale on psychiatric
patients. J. Korean Neuropsychiatr Assoc. 21:217-227.
= 국문초록 =
일차의료에서 우울증을 조기에 진단하기 위해 많은 선별검사도구들이 사용되고 있다. 두 가지 설문을 이용한 연속 선별검사가 한 가지 설문을 이용하는 것보다 우울증 선별에 있어서 더 효율적인 방법이지만, 아직까지 국내에서는 이를 비교한 연구가 없다. 본 연구는 PHQ-2/PHQ-9 연속선별검사가 현재 일차진료에서 많이 사용하고 있는 BDI 및 PHQ-2, PHQ-9 각각의 단독 시행보다 효율적인 선별도구임을 확인해 보고자 하였다. 본 연구는 2010년 2월부터 6월 까지 5개월 동안 일개 대학병원을 대상으로 5개월간 실시되었다. 환자들에게 PHQ-2, PHQ-9, BDI 설문조사를 시행하 고 각각 소요되는 시간을 측정하였다. 이후 주치의가 면담을 통하여 DSM-IV 진단기준으로 우울증을 진단하였다.
각 설문도구들에 대한 신뢰도 및 타당도를 측정하였고, PHQ-2/PHQ-9 연속선별검사와 다른 선별검사도구의 진단 정확도 및 소요시간을 비교하였다. 연구대상자 201명 중 우울증 환자군을 27명(13.4%), 비우울증 환자군은 174명 (86.6%)이었다. PHQ-2, PHQ-9, BDI의 Cronbach’s alpha 값은 각각 0.730, 0.863, 0.905이었다. PHQ-2/PHQ-9 연속선별검 사의 진단 정확도는 87.06%로 PHQ-2 (69.2%), PHQ-9 (81.6%), BDI (72.7%)보다 높았다. 평균소요시간은 PHQ-2가 30 초 미만, PHQ-9는 102.9±6.1초로 측정되었고, 따라서 PHQ-2/PHQ-9 연속선별검사가 BDI (224.17±11.9초)보다 소요되 는 시간이 적었다. PHQ-2/PHQ-9 연속선별검사는 PHQ-2, PHQ-9의 단독 시행 및 BDI 보다 진단 정확도가 높고 시간 이 적게 소요되므로, 일차진료에서 우울증에 대한 매우 유용한 선별검사도구이다.
중심단어: 우울증, 선별검사, PHQ, BDI