Use of the PHQ-2/PHQ-9 Serial Screening Instrument for Detecting Major Depressive Disorder in Primary Care

(1)

책임저자: 신호철, 서울시 종로구 평동 108번지

󰂕 110-746, 강북삼성병원 가정의학과

Tel: 02-2001-2277, E-mail: [email protected] 접수: 2011년 10월 7일, 심사: 2011년 12월 3일

게재승인: 2011년 12월 17일

일차의료에서 주요우울장애 선별을 위한 PHQ-2/PHQ-9 연속선별검사의 유용성

*성균관대학교 의과대학 강북삼성병원 가정의학교실, ^†연세대학교 의과대학 세브란스병원 가정의학교실

김 성 래 *

^,†

ㆍ신 호 철 *ㆍ이 덕 철

^†

ㆍ김 철 환 *ㆍ성 은 주 *ㆍ이 계 화 *ㆍ김 자 영 *

Use of the PHQ-2/PHQ-9 Serial Screening Instrument for Detecting Major Depressive Disorder in Primary Care

Seong-Rai Kim*

^,†

**, Ho-Cheol Shin*, Duk-Chul Lee**

^†

**, Cheol-Hwan Kim, Eun-Ju Sung, Kye-Hwa Lee*,** Ja-Young Kim*

Department of Family Medicine, *Kangbuk Samsung Hospital, Sungkyunkwan University School of Medicine, ^†Severance Hospital, Yonsei University College of Medicine, Seoul, Korea

In Primary care, many screening tools to detect depression are used. Patient health questionnaires (PHQ)-2/PHQ-9 serial screening is reported to be more efficient than other questionnaires in primary setting in western country. Therefore, we identified the efficacy of PHQ-2/PHQ-9 serial screening in primary care setting in Korea. We compared PHQ-2/PHQ-9 serial screening with other screening tools in terms of diagnostic accuracy and time required to detect Major depressive disorder (MDD). Total 201 ambulatory patients completed questionnaires in a family practice center at one university hospital. Then, the subjects were interviewed by family doctors according to DSM-IV criteria. The reliability, sensitivity, specificity and the time required to finish PHQ-2/PHQ-9 serial screening were examined and compared to other screening tools (PHQ-2, PHQ-9, BDI). There were 27 patients in the MDD group and 174 in the non-MDD group. The Cronbach’s alpha of PHQ-2, PHQ-9, and BDI was 0.730, 0.863, and 0.905, respectively. The diagnostic accuracy of PHQ-2/PHQ-9 serial screening was 87.0%, which is superior to those of PHQ-2, PHQ-9, and BDI (69.2%, 81.6% and 72.6%, respectively) The estimated time required of PHQ-2/PHQ-9 serial screening, about 132.9±6.1 seconds, was less than those of BDI, about 224.17±11.9 seconds. PHQ-2/PHQ-9 serial screening had a better diagnostic accuracy and took less time than the other screening tools for depression. Therefore, PHQ-2/PHQ-9 serial screening is the most useful measure for detecting depression in primary care. (Korean J Str Res 2011;19:405∼410)

Key Words: Depression, Screening, PHQ, BDI

서 론

우울증은 일차 의료에서 매우 흔하게 접하게 되는 질환 으로, 국내 유병률 또한 계속 증가하는 추세이다. 2006년 한 국내 역학조사(Cho MJ et al., 2009)에서 주요우울장애의

(2)

평생유병률은 5.6%, 1년 유병률은 2.5%로 이전 연구에 비 해 증가하는 양상을 보였다. 세계 보건기구(WHO)의 보고 에 따르면 우울증으로 인한 사회, 경제적 부담은 계속 증 가해서 2020년에는 모든 질병들 가운데 2위를 차지할 것으 로 전망된다(Sartorius et al., 1996).

일차 진료의를 방문하는 성인환자에서 우울증의 유병률 은 지역사회 유병률의 약 2배인 것으로 보고되고 있다. 대 부분의 환자들이 정신과 환자로 낙인찍히기(stigmatized)를 두려워하여 정신과에 의뢰를 기피하고 일차 진료에서 치 료 받는 경우가 많으므로 일차의료에서 우울증의 선별과 진단은 매우 중요하다(Kim DH et al., 2006).

하지만 일차 진료의를 찾는 우울증 환자들은 정서적 증 상보다는 통증이나 신체 기능 저하와 같은 신체적인 증상 을 주로 호소하는 경향이 있으며(Beck AT et al., 1961), 일차 의료의 바쁜 외래 특성상 진단에 충분한 면담이 어렵기 때 문에 약 50%의 환자들이 발견되지 못하고 있다(Whooley et

al., 1997).

이러한 측면에서, 일차 진료에서의 우울증에 대한 효율 적인 선별이 중요하다고 볼 수 있다. 2002년 미국질병예방 위원회(USPSTF)에서도 우울증의 간파와 환자의 예후를 향 상시키기 위해 성인에서 우울증 선별검사를 권고하였으 나, 어떤 선별도구를 사용해야 하는지에 대해서는 제시를 하지 않았다(Pignone et al., 2002).

현재 일차의료 영역에서 우울증에 대한 다양한 선별검 사 도구들이 사용되고 있다. 가장 많이 사용되는 도구로는 Beck Depression Inventory (BDI), Zung의 Self-rating Depression Scale (SDS), Hamilton Depression Rating Scale (HDRS), Center for Epidemiologic Studies Depression Scale (CES-D), Patient Health Questionnaire-2 (PHQ-2)와 PHQ-9 등이 있다. 특히 최 근 PHQ-2와 PHQ-9의 연속선별검사(serial screening)는 문항 수가 적어 시간이 덜 걸리면서도 우울증을 보다 더 정확하 게 진단할 수 있다는 보고가 나오면서 주목을 받고 있다 (Thibault et al., 2004).

국내에서는 BDI (Hahn HM et al., 1986; Shin HC et al., 2000), SDS (Yang JG, 1982; Shin HC et al., 2000), HDRS (Kim CY et al., 2002), CES-D (Shin SC et al., 1991) 등에 대한 표준 화 작업이 이루어 졌으나 이 평가 도구들은 문항 수가 너 무 많아서 바쁜 외래 진료 환경 및 일차진료 영역에서는 사용하기 불편한 면이 있다(Lim KH et al., 2009).

일차의료 환경에서 사용하기에 가장 적합해 보이는 PHQ-2와 PHQ-9에 대한 국내 표준화 연구는 미흡한 편이

다. Myung SK et al.(2000)에 의한 PHQ-2의 표준화 연구는 청소년들만을 대상으로 하였고, Choi HS et al.(2007)에 의한 PHQ-9의 표준화 연구는 다른 선별도구와 비교를 하지 않 았으며, 연속선별검사의 유용성은 평가하지 않았다.

Thibault et al.(2004)은 연속적인 두 가지 설문을 이용하는 것이 하나의 설문을 이용하는 것보다 더 정확하므로, PHQ-2와 PHQ-9의 연속선별검사로 우울증을 보다 더 정확 하게 진단할 수 있다고 제시하였다. 하지만, 국내에서 이 연속선별검사를 다른 선별도구들과 비교한 연구는 없다.

본 연구에서는 PHQ-2/PHQ-9 연속선별검사(serial screening)가 다른 우울증 선별검사 도구인 BDI 및 PHQ-2, PHQ-9 단독시행보다 진단 정확도가 높고, 소요되는 시간에 있어 서도 이득이 있어 가장 유용한 선별검사가 될 수 있는지 확인해 보고자 한다.

재료 및 방법

1. 연구대상 및 기간

2010년 2월 1일부터 6월 30일까지 5개월 동안 일개 대학 병원 가정의학과 외래를 방문한 성인 환자 중 우울증에 대 한 설문에 참여하기를 동의한 201명을 대상으로 하였다.

2. 연구 도구

1) PHQ-2: PHQ-2는 흥미상실과 우울과 관련된 두 가 지 항목만을 묻는 2항목 선별검사로, 환자들은 이에 대해 예/아니오로 답하도록 이루어진 설문이다. 즉, 자기보고형 이 아닌 임상가-평가형 우울증 선별도구이며, 두 질문 중 어느 하나라도 양성을 보인 경우 검사 양성으로 판정한다.

본 연구에서는 Myung SK et al.(2000)이 번안한 PHQ-2 설문 을 사용하였으며, 그 내용은 다음과 같다.

① 지난 한 달 동안 당신은 자주 기분이 쳐지거나 우울 하거나 희망이 없다는 느낌으로 고민하고 있습니까?

② 지난 한 달 동안 당신은 자주 일상적인 활동에 흥미 나 즐거움의 감소 때문에 고민하고 있습니까?

2) PHQ-9: DSM-IV의 우울증 진단기준에 해당하는 9가 지 항목으로 구성되고, 최근 2주 동안 얼마나 이러한 문제 를 자주 겪었는지 알아보는 도구이다. 반응은 “전혀 그렇 지 않다.”, “수일 정도”, “1주일 이상”, “거의 매일”의 4점 척도로 평가하며, 점수의 범위는 0∼27점이다. 본 연구에 서는 최홍석 등의 연구(Choi HS et al., 2007)에서 제시한 절 단점수(10점)와, 이 연구에서 번안한 설문을 사용하였다.

(3)

Table 1. Sociodemographic characteristics of study populations.

^a Characteristics

MDD group^d (n=27)

Non-MDD group^d (n=174)

Total

(n=201) p-value^b

Age (y)

∼30 31∼40 41∼50 51∼60 61∼

Female sex Education level

Elementary school Middle school High schiool College and higher Marriage

Single Married Divorced No response Income (10⁴ won/month)

∼99 100∼199 200∼299 300∼

Smoking Non-smoking Ex-smoking Current smoking Alcohol drinking

None 1∼2/w 3∼4/w 5∼/w

10 (37) 7 (25.9) 3 (12.5) 2 (7.4) 5 (18.5) 15 (55.6)

2 (7.4) 2 (7.4) 8 (29.6) 15 (55.6)

13 (48.1) 12 (44.4) 1 (3.7) 1 (3.7)

6 (22.2) 4 (14.8) 8 (29.6) 9 (33.3)

16 (59.3) 6 (22.2) 5 (15.6)

13 (48.1) 13 (48.1) 1 (3.7) 0 (0)

43 (24.7) 29 (16.7) 35 (20.1) 39 (22.4) 28 (16.1) 104 (59.8)

16 (9.2) 17 (9.8) 45 (25.9) 96 (55.2)

49 (24.4) 106 (60.9) 5 (2.9) 14 (8.0)

20 (11.5) 21 (12.1) 43 (24.7) 90 (51.7)

114 (65.5) 26 (14.9) 34 (19.5)

100 (57.5) 61 (35.1) 8 (4.6) 5 (2.9)

53 (26.4) 36 (17.9) 38 (18.9) 41 (20.4) 33 (16.4) 119 (59.2)

18 (9.0) 19 (9.5) 53 (26.4) 111 (55.2)

62 (30.8) 118 (58.7) 6 (3.0) 15 (7.5)

26 (12.9) 25 (12.4) 51 (25.4) 99 (49.3)

130 (64.7) 32 (15.9) 39 (19.4)

113 (56.2) 74 (36.8) 9 (4.5) 5 (2.5)

ns^c

0.678 ns^c

ns^c

MDD: major depressive disorder.

aData are presented as number (%). ^bp-value from χ² test comparing a difference between any of the 2 study groups. ^cNot significant. ^dMDD group and Non-MDD group classified by DSM-IV.

3) BDI: 일차 의료에서 가장 흔하게 사용되고 있는 선별 검사 도구 중 하나로서, 총 21문항으로 구성되어 있다. 반 응은 각 문항당 0∼3점으로 평가하며, 점수의 범위는 0∼

63점이다. 본 연구에서는 Hahn HM et al.(1986)에서 제시한 절단점수(13점)와, 이 연구에서 번안한 설문을 사용하였다.

4) PHQ-2/PHQ-9 연속 선별검사: 한 환자에게 PHQ-2 와 PHQ-9 설문을 연속적으로 시행하여 우울증을 선별하는 것이다. PHQ-2와 PHQ-9 두 설문에 모두 양성인 경우만을 검사 양성으로 판정하며, 나머지 경우는 음성으로 판정한 다.

3. 연구 방법

외래 진료 중 주치의가 연구 대상들에게 PHQ-2에 해당 하는 2항목의 질문을 하였고, PHQ-2의 결과와 관계 없이 모든 대상자들에게 설문지를 작성하도록 하였다. 설문에 는 연령, 성별, 결혼상태, 교육, 가계수입, 흡연, 음주 등과 관련된 사회인구학적 특성 및 PHQ-9, BDI의 설문 내용과 각 설문의 소요시간이 포함되어 있었다. 연구 대상이 직접 자기 기입식으로 설문을 작성하도록 하여 자료를 수집하 였다.

이후 설문을 모두 작성한 환자들에 대해 주치의가 직접 주요우울장애의 DSM-IV 진단기준에 의거하여 면접을 시 행하였고, 이 기준을 우울증 진단의 황금기준(Gold standard)으로 삼았다.

이를 통해 PHQ-2/PHQ-9 연속 선별검사의 정확도 및 소 요시간을 PHQ-2, PHQ-9, BDI 각각의 설문과 비교하였다.

4. 통계분석

연구 대상 중 우울증 환자와 비우울증 환자의 사회인구 학적 특성 비교를 위해 Chi-square 검정을 이용하였으며, PHQ-2, PHQ-9, BDI 각 설문의 신뢰도 분석을 위해 Cron- bach’s alpha 값을 산출하였다.

또한 어떤 설문도구가 주요우울장애에 대해 가장 유용 한지를 알아보기 위해, PHQ-2, PHQ-9, BDI, PHQ-2/PHQ-9 연속 선별검사 각각의 DSM-IV 진단기준에 대한 정확도 및 소요시간을 비교하였다.

통계적 유의 수준은 0.05 미만으로 하였으며, 모든 자료 분석에는 통계 프로그램인 PASW Statistics 17.0 (SPSS Inc.

Chicago, IL, USA)를 사용하였다.

결 과

1. 대상자의 사회 인구학적 특성

총 201명의 조사 대상 중 DSM-IV 진단기준에 의한 우울 증 환자는 27명(13.4%), 비우울증 환자는 174명(86.6%)이었 다. 연구대상의 사회인구학적 특성 즉, 연령, 성별, 결혼상 태, 교육, 가계수입, 흡연, 음주 등은 우울증 환자군과 비우 울증 환자군 사이에 통계적으로 유의한 차이를 보이지 않

(4)

Table 2. The result of screening tools for major depressive disorder.

^a Test positive result Disease status

p-value^b

MDD No MDD

PHQ-2 PHQ-9 BDI

PHQ-2/PHQ-9 serial screening

27/27 (100%) 23/27 (85.2%) 22/27 (81.5%) 23/27 (85.2%)

62/174 (35.6%) 33/174 (19%) 50/174 (28.7%) 22/174 (15.5%)

＜0.001

aBased on the number of true-positive and true-negative test resultsin each screening tool. ^bp-value from χ² test comparing a difference between any of the 2 study groups.

Table 3. Accuracy of screening tools in identifying major depressive

disorder.^a

PHQ-2 PHQ-9 BDI PHQ-2/PHQ-9

serial screening Sensitivity (%)

Specificity (%) Overall accuracy (%)

100 64.4 69.2

85.2 81.0 81.6

81.5 71.3 72.6

85.2 87.4 87.0

aBased on the number of true-positive and true-negative test resultsin each screening tool.

았다(Table 1).

2. 각 설문도구의(PHQ-2, PHQ-9, BDI) 신뢰도 본 연구에서 사용한 PHQ-2, PHQ-9, BDI 설문 각각의 신 뢰도를 알아보기 위한 내적 일치도는 Cronbach’s alpha 값이 각각 0.730, 0.863, 0.905의 결과를 보였다.

3. PHQ-2/PHQ-9 연속 선별검사와 기타 설문도구 와의 정확도 및 소요시간 비교

DSM-IV 진단기준을 황금 기준으로 하였을 때 연구 대상 자 중 우울증 환자는 201명 중 27명으로 13.4%이었다. 각 각의 설문 도구에 따른 결과는 Table 2와 Table 3에 나타난 바와 같았으며, 설문도구 중 PHQ-2/PHQ-9 연속선별 검사 의 정확도(87.06%)가 가장 높았다.

각 설문 도구를 작성하는데 소요된 시간은 PHQ-9이 102.9±6.1초(Mean±SEM; Standard Error Deviation)이었고, BDI 는 224.17±11.9초(Mean±SEM)이었다.

고 찰

우울증은 환자들의 사회적, 신체적 장애를 일으키며 특 히 자살의 위험을 증가시키는 것으로 알려져 있으므로 조 기 발견을 통한 적절한 치료가 매우 중요한 질환이다. 현 재 우울증을 조기에 발견하여 적절한 치료를 제공하기 위 한 많은 선별검사들이 일차의료에서 사용되고 있다. DSM- IV의 주요우울장애의 진단기준이 있음에도 이렇게 일차의 료에서 선별검사를 사용하는 이유는 바쁜 외래 특성상 환 자와 충분한 면담이 어렵기 때문이다. 따라서 빠른 시간 내에 보다 정확하게 우울증 진단을 보조할 수 있는 선별검 사가 일차의료에서 가장 도움이 될 것이다(Nease et al.,

2002).

일차의료 영역에서 우울증 진단에 대한 가장 효율적인 선별검사를 찾기 위하여 본 연구를 시행하였다. 정확도와 시간적인 측면에서 우울증의 진단에 어떤 선별도구가 가 장 좋은지를 보기 위하여, PHQ-2/PHQ-9 연속선별검사를 현재 일차진료에서 많이 사용하고 있는 BDI 및 PHQ-2, PHQ-9 각각의 단독 시행과 비교하였다.

설문도구들의 신뢰도를 측정하기 위한 방법으로 Cron- bach’s alpha 값을 사용하였다. Cronbach’s alpha 값은 집단 수 준인 경우에는 alpha 값이 0.6 이상, 개인 수준에서는 0.9 이 상이면 높다고 할 수 있다. 본 연구에서 사용한 PHQ-2, PHQ-9, BDI의 Cronbach’s alpha 값은 각각 0.730, 0.863, 0.905로서 모두 집단 수준에서는 높은 신뢰도를 보여주었 다.

타당도를 알아보기 위해 각 설문도구들의 민감도, 특이 도, 예측도를 각각 계산하였고, 어떤 검사가 더 정확도가 높은지 비교하였다. PHQ-2/PHQ-9 연속 선별검사의 정확 도가 87% (민감도 85.2%, 특이도 87.4%)로 다른 선별도구 들(PHQ-2, PHQ-9, BDI)의 정확도보다 높았다.

설문도구를 작성하는데 소요되는 시간은 PHQ-9이 102.9±

6.1초, BDI는 224.17±11.9초였다. PHQ-2의 두 항목을 환자 에게 물어보는데 소요되는 시간은 대부분 30초 미만이었 으므로, 선별검사를 시행하는데 있어 PHQ-2/PHQ-9 연속 선별검사가 BDI에 비해 시간적 이득이 있었다.

결론적으로, PHQ-2/PHQ-9 연속선별검사는 정확도가 가 장 높고 소요되는 시간도 BDI보다 적어 가장 좋은 선별검 사임을 입증할 수 있었다.

PHQ-2/PHQ-9 연속선별검사를 실제 임상에 적용할 때 고려해야 할 사항이 있다. DSM-IV의 주요우울장애 진단기 준(American Psychiatric Association, 1994)에는 특징적 9가지 증상을 나타내는 항목과 배제하기 위한 항목 4가지가 있 다. 배제하는 기준항목 4가지는 (1) 혼재성 삽화의 배제 (2)

(5)

증상이 기능 영역에서 심각한 고통이나 장해를 일으켜야 함 (3) 물질 및 일반적 의학적 상태에 의한 것 배제 (4) 사별 반응 배제 이다. 즉, DSM- IV 진단기준에 의하면 특징적인 증상 9가지 중 5가지 이상을 만족해도, 배제하는 항목 4가 지 중 하나라도 해당하면 우울증 진단을 내릴 수 없다.

본 연구의 선별검사에서 사용한 PHQ-2와 PHQ-9는 모두 우울증의 특징적인 증상만을 다루고 있고 배제하기 위한 기준은 포함되어 있지 않다. 실제로, 본 연구대상에게 DSM-IV를 사용하여 우울증 진단을 내릴 때, 201명 중 10명 의 환자들은 특징적인 증상 항목에서 우울증 진단을 만족 하였음에도 불구하고 배제하는 항목에 의해 우울증이 아 닌 것으로 나타났다. PHQ-2/PHQ-9 선별검사를 우울증을 확진하는데 사용하기 위해서는, 이러한 배제하는 항목에 대한 고려가 필요할 것이다. 이러한 배제 기준에 대한 고 려가 필요한 점은 비단 PHQ-2/PHQ-9 연속선별검사뿐 아 니라 모든 우울증 선별검사에 해당되는 내용이다.

본 연구의 제한점은 다음과 같다. 우선, 모집된 연구대상 이 일개 병원 가정의학과를 방문한 환자여서 교육수준이 평균보다 훨씬 높은 등 우리나라 전체 일차의료환자를 대 표하기에는 미흡할 수 있다. 또한 설문도구들의 신뢰도 검 증에 있어 내적일치도만 구하고 검사-재검사법에 의한 안 정성을 평가하지 못하였다.

본 연구는 일차의료환경에서 PHQ-2/PHQ-9 연속선별검 사의 유용성을 확인한 데 의의가 있다. 향후 본 연구의 제 한점을 극복하여 일차 의료 환자를 대상으로 보다 대규모 의 연구가 이루어진다면, 우울증 선별검사로서 PHQ-2/

PHQ-9 연속선별검사의 의의를 보다 명확하게 파악할 수 있을 것이다.

참 고 문 헌

American Psychiatric Association (1994) Diagnostic and statistical manual of mental disorders. 4th ed. P327. American Psychiatric Association, Washington, D.C.

Beck AT, Ward CH, Mendelson M et al. (1961) Inventory for measuring depression. Arch. Gen. Psychiatry 4:561-571.

Cho MJ, Chang SM, Hahm BJ et al. (2009) Prevalence and correlates of major mental disorders among Korean adults: a 2006 national epidemiologic survey. J. Korean Neuropsychiatr Assoc. 48:143-152.

Choi HS, Choi JH, Park KH et al. (2007) Standardization of the

Korean version of patient health questionnaire-9 as a screening instrument for major depressive disorder. Korean J. Fam. Med.

28:114-119.

Hahn HM, Yum TH, Shin YW et al. (1986) A standardization study of beck depression inventory in Korea. J. Korean Neuropsychiatr Assoc. 25:487-502.

Kim CY, Goh JK, Ro EY (2002) Item Characteristics of the hamilton rating scale for depression-self-report inventory. J.

Korean Neuropsychiatr Assoc. 41:905-911.

Kim DH, Kim JB (2006) Screening for depression in primary care.

J. Korean Acad. Fam Med. 27:163-169.

Lim KH, Park YN, Kim DH et al. (2009) A preliminary study of the standardization of the Korean version of the patient health questionnaire-9. J. Health Promot Dis. Prev. 9:275-281.

Myung SK, Jeong B, Lee WJ et al. (2000) Standardization of the two - question case finding instrument as a screening instrument for the adolescent's depression Korean. J. Fam. Med. 21:100-106.

Nease DE, Klinkman MS, Volk RJ (2002) Improved detection of depression in primary care through severity evaluation. J. Fam.

Pract. 51:1065-1070.

Pignone MP, Gaynes BN, Rushton JL et al. (2002) Screening for depression in adults: a summary of the evidence for the U.S.

preventive services task force. Ann. Intern Med. 136:765-776.

Sartorius N, Ustun TB, Lecrubier Y et al. (1996) Depression comorbid with anxiety: results from the WHO study on psychological disorders in primary health care. Br. J. Psychiatry.

168(Suppl 30):S38-43.

Shin HC, Kim CH, Park YW et al. (2000) Validity of beck depression inventory (BDI): detection of depression in primary care. Korean J. Fam. Med. 21:1451-1465.

Shin HC, Kim CH, Park YW et al. (2000) Validity of Zung's self-rating depression scale: detection of depression in primary care. Korean J. Fam. Med. 21:1317-1329.

Shin SC, Kim MK, Yun KS et al. (1991) The center for epidemiologic studies-depression scale (CES-D): its use in Korea.

J. Korean Neuropsychiatr Assoc. 30:752-767.

Thibault JM, Steiner RW (2004) Efficient identification of adults with depression and dementia. Am. Fam. Physician. 70:1101- 1110.

Whooley MA, Avins AL, Miranda J et al. (1997) Casefinding instruments for depression. two questions are as good as many.

J. Gen. Intern Med. 12:439-445.

Yang JG (1982) The self-rating depression scale on psychiatric

patients. J. Korean Neuropsychiatr Assoc. 21:217-227.

(6)

= 국문초록 =

일차의료에서 우울증을 조기에 진단하기 위해 많은 선별검사도구들이 사용되고 있다. 두 가지 설문을 이용한 연속 선별검사가 한 가지 설문을 이용하는 것보다 우울증 선별에 있어서 더 효율적인 방법이지만, 아직까지 국내에서는 이를 비교한 연구가 없다. 본 연구는 PHQ-2/PHQ-9 연속선별검사가 현재 일차진료에서 많이 사용하고 있는 BDI 및 PHQ-2, PHQ-9 각각의 단독 시행보다 효율적인 선별도구임을 확인해 보고자 하였다. 본 연구는 2010년 2월부터 6월 까지 5개월 동안 일개 대학병원을 대상으로 5개월간 실시되었다. 환자들에게 PHQ-2, PHQ-9, BDI 설문조사를 시행하 고 각각 소요되는 시간을 측정하였다. 이후 주치의가 면담을 통하여 DSM-IV 진단기준으로 우울증을 진단하였다.

각 설문도구들에 대한 신뢰도 및 타당도를 측정하였고, PHQ-2/PHQ-9 연속선별검사와 다른 선별검사도구의 진단 정확도 및 소요시간을 비교하였다. 연구대상자 201명 중 우울증 환자군을 27명(13.4%), 비우울증 환자군은 174명 (86.6%)이었다. PHQ-2, PHQ-9, BDI의 Cronbach’s alpha 값은 각각 0.730, 0.863, 0.905이었다. PHQ-2/PHQ-9 연속선별검 사의 진단 정확도는 87.06%로 PHQ-2 (69.2%), PHQ-9 (81.6%), BDI (72.7%)보다 높았다. 평균소요시간은 PHQ-2가 30 초 미만, PHQ-9는 102.9±6.1초로 측정되었고, 따라서 PHQ-2/PHQ-9 연속선별검사가 BDI (224.17±11.9초)보다 소요되 는 시간이 적었다. PHQ-2/PHQ-9 연속선별검사는 PHQ-2, PHQ-9의 단독 시행 및 BDI 보다 진단 정확도가 높고 시간 이 적게 소요되므로, 일차진료에서 우울증에 대한 매우 유용한 선별검사도구이다.

중심단어: 우울증, 선별검사, PHQ, BDI

Use of the PHQ-2/PHQ-9 Serial Screening Instrument for Detecting Major Depressive Disorder in Primary Care

일차의료에서 주요우울장애 선별을 위한 PHQ-2/PHQ-9 연속선별검사의 유용성

,†

†

Use of the PHQ-2/PHQ-9 Serial Screening Instrument for Detecting Major Depressive Disorder in Primary Care

Seong-Rai Kim*

, Ho-Cheol Shin*, Duk-Chul Lee

, Cheol-Hwan Kim*, Eun-Ju Sung*, Kye-Hwa Lee*, Ja-Young Kim*

Key Words: Depression, Screening, PHQ, BDI

서 론

al., 1997).

재료 및 방법

Table 1. Sociodemographic characteristics of study populations.

결 과

Table 2. The result of screening tools for major depressive disorder.

Table 3. Accuracy of screening tools in identifying major depressive

고 찰

참 고 문 헌

American Psychiatric Association (1994) Diagnostic and statistical manual of mental disorders. 4th ed. P327. American Psychiatric Association, Washington, D.C.

Beck AT, Ward CH, Mendelson M et al. (1961) Inventory for measuring depression. Arch. Gen. Psychiatry 4:561-571.

Cho MJ, Chang SM, Hahm BJ et al. (2009) Prevalence and correlates of major mental disorders among Korean adults: a 2006 national epidemiologic survey. J. Korean Neuropsychiatr Assoc. 48:143-152.

Choi HS, Choi JH, Park KH et al. (2007) Standardization of the

Korean version of patient health questionnaire-9 as a screening instrument for major depressive disorder. Korean J. Fam. Med.

28:114-119.

Hahn HM, Yum TH, Shin YW et al. (1986) A standardization study of beck depression inventory in Korea. J. Korean Neuropsychiatr Assoc. 25:487-502.

Kim CY, Goh JK, Ro EY (2002) Item Characteristics of the hamilton rating scale for depression-self-report inventory. J.

Korean Neuropsychiatr Assoc. 41:905-911.

Kim DH, Kim JB (2006) Screening for depression in primary care.

J. Korean Acad. Fam Med. 27:163-169.

Lim KH, Park YN, Kim DH et al. (2009) A preliminary study of the standardization of the Korean version of the patient health questionnaire-9. J. Health Promot Dis. Prev. 9:275-281.

Myung SK, Jeong B, Lee WJ et al. (2000) Standardization of the two - question case finding instrument as a screening instrument for the adolescent's depression Korean. J. Fam. Med. 21:100-106.

Nease DE, Klinkman MS, Volk RJ (2002) Improved detection of depression in primary care through severity evaluation. J. Fam.

Pract. 51:1065-1070.

Pignone MP, Gaynes BN, Rushton JL et al. (2002) Screening for depression in adults: a summary of the evidence for the U.S.

preventive services task force. Ann. Intern Med. 136:765-776.

Sartorius N, Ustun TB, Lecrubier Y et al. (1996) Depression comorbid with anxiety: results from the WHO study on psychological disorders in primary health care. Br. J. Psychiatry.

168(Suppl 30):S38-43.

Shin HC, Kim CH, Park YW et al. (2000) Validity of beck depression inventory (BDI): detection of depression in primary care. Korean J. Fam. Med. 21:1451-1465.

Shin HC, Kim CH, Park YW et al. (2000) Validity of Zung's self-rating depression scale: detection of depression in primary care. Korean J. Fam. Med. 21:1317-1329.

Shin SC, Kim MK, Yun KS et al. (1991) The center for epidemiologic studies-depression scale (CES-D): its use in Korea.

J. Korean Neuropsychiatr Assoc. 30:752-767.

Thibault JM, Steiner RW (2004) Efficient identification of adults with depression and dementia. Am. Fam. Physician. 70:1101- 1110.

Whooley MA, Avins AL, Miranda J et al. (1997) Casefinding instruments for depression. two questions are as good as many.

J. Gen. Intern Med. 12:439-445.

Yang JG (1982) The self-rating depression scale on psychiatric

patients. J. Korean Neuropsychiatr Assoc. 21:217-227.

= 국문초록 =

^,†

^†

**, Ho-Cheol Shin*, Duk-Chul Lee**

**, Cheol-Hwan Kim, Eun-Ju Sung, Kye-Hwa Lee*,** Ja-Young Kim*