• 검색 결과가 없습니다.

Cross-Cultural Adaptation of Korean Language Versions of Neck Pain<br /> and Disability Questionnaires and Their Psychometric Testing

N/A
N/A
Protected

Academic year: 2021

Share "Cross-Cultural Adaptation of Korean Language Versions of Neck Pain<br /> and Disability Questionnaires and Their Psychometric Testing"

Copied!
14
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

한글 경추 통증 및 기능장애 측정 도구의 개발과 타당도 및 신뢰도 검사

이해정1

1부산 신라대학교 의생명과학대학 물리치료학과

Cross-Cultural Adaptation of Korean Language Versions of Neck Pain and Disability Questionnaires and Their Psychometric Testing

Hae-Jung Lee

1

1

Dept. of Physical Therapy, College of Medical Life Science, Silla University Abstract

Objectives :

It was to translate three neck and spinal pain disability questionnaires - the Neck Disability Index (NDI), the Neck Pain and Disability Scale (NPDS), and the Functional Rating Index (FRI) – into Korean language, and evaluate the psychometric properties of Korean versions of questionnaires to achieve a good cross-cultural adaptation.

Methods :

Forty (23 males, 17 females) subjects aged from 15 to 64 years old, participated to examine test-retest reliability. One hundred and eighty (76 males, 104 females) subjects with a primary diagnosis of non-specific neck pain and 81 healthy volunteers were undertaken to examine internal consistency, discriminative validity and longitudinal construct validity. Versions of each questionnaire in idiomatic modern Korean were developed using a procedure proposed by Beaton et al. (2000). To assess reliability, the Intraclass Correlation Coefficient (ICC (2,1)) was calculated.

Internal consistency was evaluated by Cronbach’s alpha. Discriminative validity was examined with independent-group t-tests. Responsiveness was tested by calculating the effect size and standardized response mean for each questionnaire and using Pearson’s r and the area under the receiver operating characteristic curve analysis.

Results :

Test-retest reliability ofthe translated versions of the three disability questionnaires was excellent (ICC (2,1) = 0.86-0.90). High internal consistency was found in the three disability questionnaires (Cronbach’s alpha ranged from α=0.88 for the FRI to α=0.96 for the NPDS and 0.82 for the Short Form McGill Pain Questionnaire(SFMPQ)). The VAS subscale of the SFMPQ was found to be the most responsive of the subscales (ES=1.44, SRM=1.37). The VAS was also the most responsive pain and disability index in internal responsiveness analysis, although disability indices showed marginally better responsiveness when compared with external standards. No floor or ceiling effects were observed.

Conclusions :

It is concluded that the questionnaires were successfully translated and exhibit acceptable measurement properties, and may suggest that they are suitable for use in clinical and research applications.

Key words :

reliability, responsiveness, neck disability questionnaires, Short Form McGill Pain Questionnaire

⋅교신저자 : 이해정, 부산시 사상구 괘법동 산1-1 신라대학교 의생 명과학대학 물리치료학과, Tel. 051-999-5407, E-mail:

[email protected]

⋅투고 : 2007/05/07 심사 : 2007/06/08 채택 : 2007/06/14

(2)

Ⅰ. 서 론

최근 환자의 기능에 초점을 맞춘 치료 후 결과 측정은 전통적인 측정 즉, 임상증상과 징후에 초점을 둔 측정과는 다른 정보를 제 공하고, 기능 측정에 대한 개념은 임상가와 임상 연구가들에게 보편적으로 받아들여지 고 있다. 기능 측정은 질환/질병이 매일 행 해지는 활동 즉, 일상생활동작 수행에 미치 는 영향을 측정한다. 발표된 여러 논문들에 서 볼 수 있듯이 임상증상과 징후와는 달리 기능은 독립된 다양한 요소들에 의해, 예를 들면 나이, 질병에 대한 저항력, 직업활동 등, 영향을 받기 때문에 두 가지의 개념은 서로 많은 차이가 있다1-3). 기능은 보건상태 정도를 나타냄에 있어서 가장 중요한 척도 가 되고4), 환자의 자가 평가 시 임상가들이 전통적으로 신뢰하고 사용해온 임상적, 생 역학적 또는 생리학적 지표들 보다 더 정확 하게 반영한다고 보고되고 있다5).

경추 질환을 측정하는 기능 척도로는 현 재 7가지가 개발되어 영어로 발표되었다:

목 장애 지수 (Neck Disability Index, 이하 NDI)6), 목통증과 장애 측정 (Neck Pain and Disability Scale, 이하 NPDS)7), 노스윅 파크 목통증 설문지 (Northwick Park Neck Pain Questionnaire, 이하 NPQ)8), 기능장애 등급 지표 (Disability Rating Index)9), 코펜 하겐 목 기능 장애 척도(Copenhagen Neck Functional Disability Scale)10), 경추 결과측 정도구 (Cervical Spine Outcome Questionnaire)11), 기능적 등급 지수 (Functional Rating Index, 이하 FRI)12). NDI와 NPQ는 오스

웨스트리 요통 기능 설문지에 근거를 두고 개발되었으며6,8), 특히 NDI는 경부 통증 연 구에서 가장 보편적으로 많이 사용되는 도구 이다13). NPDS는 바스척도 (Visual Analogue Scale, 이하 VAS)를 사용하며 여러 관점에 서 측정하는 도구이며, FRI는 척추 전체 즉 요추와 경추의 질환을 모두를 측정할 수 있 게 가장 최근에 개발된 도구이다.

영어로 개발된 도구를 한글로 바꾸어 사 용하려고 할 때 측정도구의 번역과정은 중 요하다. 단순히 언어의 번역은 큰 의미를 가지지 못한다. 예를 들면, 미국에서는 식사 시 포크와 칼을 사용하지만, 우리나라는 숟 가락과 젓가락을 사용한다. 우리나라의 생활 습관이나 환경 등 문화가 영어권 나라들과 다르기 때문에 측정도구의 번안은 반드시 국제적으로 인정된 가이드라인, 즉 단순한 글의 번역이 아니라 각 나라의 문화에 맞추 어 비교문화 번안이 이루어지는 져야 한다.

현존하는 자가 측정도구의 비교문화 번안은 여러 가지 면에서 중요하다. 첫째는 전 세 계의 모든 사람이 영어를 사용하지는 않는 다. 특히 호주, 영국, 미국과 같은 영어권 국 가에서도 모든 국민이 영어를 사용하는 것 은 아니다. 둘째는 번역된 설문지의 이용도 는 영어권국가에서 이뤄지는 임상적 연구에 서 보편적으로 행해지고 있는 비영어권 피 험자들을 제외하는 바람직하지 않은 관례를 멈출 수 있다. 셋째는 번역된 설문지가 있다 면, 체계적인 고찰연구 시 비 영어권 언어로 나온 자료도 통합 자료화하는 데 중요한 몫 으로 참여 될 수 있다. 마지막으로 번안된 도구는 비영어권 국가에서 새로운 자가 측

(3)

정도구를 개발하는 것보다 잠재적으로 간단 하고 효과적이다.

컴퓨터 사용자들의 경추부 통증은 여러 연구에서 보고된 바가 있다. 국내 학생들의 컴퓨터사용은 보편화되고 필수화 되면서 사 용시간이 많아지고 있으며, 이는 잠정적으로 경추부 통증을 가지고 있다고 볼 수 있다.

척추 문제는 의사들을 찾는 가장 흔한 근골 격계 질환중의 하나이나14), 유효한 도구의 접근이 많이 부족한 실정이다. SF-36 과 오 스웨스트리 요통 설문지의 한글판이 최근에 출판되었지만15,16), 경추 통증과 기능측정도 구는 아직 한글로 번안된 자료가 없는 상태 이다. 따라서 이 연구에서는 임상가와 연구 가들이 치료 후 결과를 보다 객관적으로 측 정할 수 있고, 임상연구의 통계적 검정력을 높일 수 있도록 경추 통증과 기능에 관련 된 도구, 즉 현재 가장 많이 사용되는 4개의 경추 통증과 기능도구를 한글로 비교문화 절충 번안하여 개발하고, 번안된 도구들의 신뢰성과 타당성을 검사하고자 한다.

Ⅱ. 재료 및 방법

1. 번역과 비교문화 절충 번안

본 연구에서의 비교문화 번안 절차는 비 튼과 동료들이 제시한 지침에 따랐다17). 목 적은 경추 통증과 기능 측정도구의 영어 원 본을 객관적인 비교문화 절충 번안과정을 거쳐서 한글 도구를 만드는 것이었다. 번역 자들은 모두 양국어를 할 수 있는 사람들로 서 4개의 그룹으로 구성되었다. 이중 두 개 의 그룹은 한국어를 모국어로 하는 사람들

로 구성이 되었으며, 두 그룹은 영어를 모국 어로 하는 사람들로 구성이 되었다. 번안 절 차는 다음과 같다.

1) 영어도구를 한국어로 번역: 번역은 한 국어를 모국어로 하는 사람들로 두 그룹으 로 나뉘어 이루어졌다. 그룹1에서는 물리치 료나 관련 전문분야의 사람들로 (재활의학 과 전문의 1명, 한의사 1명, 물리치료사 2 명) 구성이 되었으며, 그룹2에서는 보건, 의 료계통의 업무와는 상관이 없는 일반인들로 (컴퓨터 공학자 1명, 영문학전공 교수1명) 구성이 되었다. 도구의 한글 번역은 각 그룹 에서 하나씩 독립적으로 만들어 졌다. 번역 후 각 번역자들은 번역시의 문제점 즉, 모호 한 표현이나 한글로의 직접적인 번역이 어 려운 단어들, 서로 일치하지 않은 단어, 응 답에 대한 선택, 지시내용 등을 모아서 서로 의 의견을 수렴하여 하나의 한글 합의본을 만들었다.

2) 한글도구를 영어로 역번역: 원본 도구 의 의미가 보전되었는지를 확인하기 위하여 역번역이 이루어 졌다. 역번역 또한 두개의 그룹으로 이루어 졌으며, 번역자들은 영어를 모국어로 하는 사람들로 구성이 되었다. 역 번역은 한글 합의본을 사용하였으며, 영어 원본은 번역자들에게 공개하지 않았다.

3) 위원회 재검토: 기능 측정 도구를 연 구하고 임상에 적용하는 전문가들로 위원회 가 구성이 되었고, 위원회에서 영어 원본과 역번역 된 도구들을 비교하고, 앞의 과정에 서 나온 모든 번역본들을 검사하여 번역시 의 어려움, 관용어구의 차이, 문화의 차이 등을 고려하여 최종 전 단계의번역본 (베타

(4)

번역본)을 개발하였다. 단어 선택의 수준은 15세의 교육수준으로 맞추었다.

4) 최종 한글도구 개발을 위하여 베타 번 역본으로 예비검사 즉 파일럿 테스트를 하 였다.

2. 계량심리적 검사

1) 검사 - 재검사 신뢰도 검사 (1) 피험자

한국어를 모국어로하는 15세와 64세 사이 의 40명의 지원자들로 (23 남자, 17 여자) 구성이 되었으며, 연구기간 동안 요통이나 경추 통증 또는 이의 문제로 치료를 받고 있는 피험자와, 문맹자는 본 연구에서 제외 되었다. 초등학교부터 대학 졸업까지 학력의 범위를 다양하게 하였으며, 직업의 범위도 육체적 노동을 주로 하는 직업, 일반 사무 직, 보건 의료전문가, 가정주부를 포함한 미 취업자를 포함하여 피험자들을 구성하였다.

(2) 연구 절차

번안된 측정도구들의 검사-재검사 신뢰도 검사를 위하여 각 피험자들로부터 두 번씩 측정하였다. 피험자들을 각 도구를 사용하여 측정하였고, 처음 측정한 날로부터 7일 내에 다시 재측정을 하였다. 모든 피험자와 두 번 째 측정 후 각 도구들의 항목에 대한 그들 이 한 답에 대한 이유, 도구들 사용의 편리 함이나 측정 시 문제점 등을 듣기위하여 면 담을 하였다. 한 항목에 여러 개로 답을 하 였거나 답을 하지 않은 항목에 대한 분포도 검사도 하였다.

(3) 분석

번안된 도구의 신뢰도를 검사하기 위하여 Shrout and Fleiss18) 가 묘사한 한글판 경부 통증과 기능 측정 도구들의 두 측정값간의 급간 상관 계수 (Intraclass Correlation Coefficient (ICC (2,1)))를 계산하였다.

2) 내적 일치도, 종적 구성 타당도와 식 별 타당도 검사

(1) 피험자

현재 치료를 받고 있는 임상 환자들로 이 루어진 임상군과 증상이 없는 건강한 사람 들로 이루어진 정상군으로 나누어 피험자들 을 모집하여 각 도구들을 검사하였다. 경추 통증과 기능 측정도구들의 내적 일치도, 종 적 구성 타당도를 위하여 경추 통증을 가진 임상환자들은 검사 하였으며, 증상이 없는 정상군은 임상군과의 식별력을 위한 타당도 검사를 위하여 모집하였다. 임상군 피험자들 은 부산, 경남, 대구, 경북에 소재하는 3개의 종합병원과 7개의 개인 의원에서 경추 통증 으로 물리치료를 요하는 환자를 대상으로 모집되었다. 임상군은 18세에서 69세 사이의 특이성 경추 통증으로 진단을 받고 물리치 료를 요하는 성인 남녀 180명 (76 남자, 104 여자)이 본 연구에 참여 하였다. 정상 피험 자들은 지난 6개월 동안 경추부위 통증으로 치료를 받은 경험이 없거나 경추 부위 통증 으로 일상생활동작이나 직장 생활에 지장을 초래한 경험이 없는 18세와 32세 사이 81명 으로 구성이 되었다.

(5)

(2) 연구 절차

임상군의 피험자들은 그들의 치료 첫날 (치료전)과 치료 마지막 날 (치료후) 각 도 구들을 사용하여 총 2번 측정에 참여하였다.

측정 도구로는 기능 측정도구인 NDI, NPDS, FRI 와 통증 측정도구인 Short Form McGill Pain Questionnaire (이하 SFMPQ)를 사용하였다. 만약 물리치료를 장기간으로 요하는 경우는 각 임상환경에 따라 7번째나 8번째 치료 후 측정하였다. 또 한 치료 후 측정 시는 환자 스스로가 느끼

는 전반적인 치료 효과에 대하여, 7개의 항 목으로 이루어진 ‘글로벌 퍼시브드 이펙트 (Global Perceived Effect, 이하 GPE)’도 측 정하였고, 이는 임상의 중요한 변화를 측정 하는 외부 표준지표로 사용하기 위함이었다.

반응 선택의 7개 항목은 ‘완전히 회복되었 다, 많이 회복 되었다, 약간 회복 되었다, 변 화가 없다, 약간 악화 되었다, 많이 악화되 었다, 대단히 많이 악화 되었다’로 구성이 되었다. 정상군 피험자들로부터는 각 도구를 한 번씩 측정하여 값을 구하였다(Fig. 1).

Fig. 1. Study Procedure.

각 도구들의 사용, 즉 측정 전에 모든 피 험자들에게 본 연구에 대한 설명이 이루어 졌고, 실험에 대한 자발적 동의를 구하였다.

(3) 분석

내적 일치도는 임상군 피험자 180명의 치

료 전 측정 데이터로 크론바크 알파값을 구 하여 검사하였다. 식별 타당도, 즉 도구가 경추 통증으로 치료를 받는 사람과 건강한 사람을 얼마나 잘 구분하는 가를 검사하기 위하여 독립군 t 검정을 사용하였다. 각 항 목과 전체 값의 반응 분포 검사를 위하여

(6)

천정과 바닥효과, 빠진 항목 값을 측정하였 다. 80%이상의 피험자들이 최솟값이나 최댓 값에 반응을 했거나 전체 값이 최솟값이나 최댓값으로 나왔다면 바닥과 천정의 효과가 있다고 보고 이는 측정도구로서 적합하지 않다고 볼 수 있다19). 다항목 척도는 어려움 의 정도에 따른 다양한 항목을 포함하는 것 이 바람직하다고 보고된 자료에 근거하여, 항목의 어려움에 대한 척도는 각 항목의 평 균값을 계산하여 측정하였다20).

종적 구성 타당도는 내적 반응력, 외적 반 응력 두 가지로 검사하였다. 내적 반응력은 각 도구의 효과 크기 (Effect Size, 이하 ES) 와 표준화 반응 평균값 (Standardized Response Mean, 이하 SRM)을 구하여 검사 하였다. 내적 반응력을 비교하기 위하여 84% 신뢰구간을 측정하였다. 84% 신뢰구간 은 평균값의 Z 테스트에서 0.05 유의수준과 같다21). 외적 반응력도 두 가지로 측정하였 다. 첫째는 치료 전과 치료 후 측정값의 변 화 값을 GPE 값에 피어슨 상관 계수를 사 용하여 95% 신뢰구간으로 상관관계 분석을 하였다. 둘째는 GPE 척도값을 기준으로 각 도구들이 회복이 된 피험자들과 회복이 되 지 않은 피험자들을 얼마나 잘 구분해 내는 지를 검사하기 위하여 수령검사특성곡선 범 위 (Area Under the receiver operating characteristic Curve 이하 AUC)를 계산하였 다. 계산을 위하여 GPE 척도값을 ‘완전히 회복되었다, 많이 회복되었다’ 를 회복 항목 으로 하고, 나머지 항목 ‘약간 회복되었다, 변화가 없다, 약간 악화되었다, 많이 악화되 었다, 대단히 많이 악화되었다’를 무회복항

목으로 이분화 하였다. 짝 AUC 값을 디롱 테스트 (Delong’s test)로 비교하였다22).

Ⅲ. 결 과 1. 번역과 비교문화 절충 번안

15세와 64세 사이의 성인 40명 (남 22, 여 18)이 베타번역본을 사용하여 측정하였으며, 도구에 대한 번역으로 의미에서 벗어났거나 잘못 이해 된 부분을 점검하였다. 번역의 몇 부분은 본 연구에서 나온 자료를 검사하여 전문가 위원회의 의견을 거쳐 수정되었다.

수정된 항목은 일(전문적인 직업과 관련된 일에서 가사일까지), 운전(NDI와 FRI), 약 물사용(NPDS)과 관련된 항목, 거리를 나타 내는 항목에서 영국식 계량법으로 표현된 부분을 미터법(FRI)으로 바꾸었다. 여가 활 동과 사회 활동에 관한 항목에서는 개념적 으로 우리나라에서 뚜렷하게 표현이 되지 않아서 환자가 항목에 답을 할 때 이해를 돕기 위하여 추가 설명을 간략하게 덧붙였 다. 많은 환자들이 NPDS의 세분화된 VAS 눈금에서 해당 부분을 표시할 때 표기하는 방법에서 혼돈을 호소하여 세분화 되지 않 은 표준 VAS로 대처하였다. 바뀐 눈금을 사 용하면 각 항목(0부터 100사이)을 더한 전 체 값은 0에서 2000점 사이가 된다.

2. 검사 - 재검사 신뢰도

번역본 도구들의 검사 - 재검사 신뢰도 검사결과는 매우 우수하였다: FRI ICC

(2,1)=0.86 (95% CI: 0.75-0.92); NPDS ICC

(7)

(2,1)=0.90 (95% CI: 0.83-0.95 and NDI ICC (2,1) =0.90 (95% CI: 0.81-0.94)).

3. 내적 일치도

본 연구에서 조사한 결과 각 도구들의 내 적 일치도는 사용하기에 적합하게 높게 나 왔다. 크론바크 알파값은 1이 나올 수 있는 가장 높은 값으로 값이 높을수록 문항들이 측정하고자 하는 내용을 일관성 있게 측정 한다고 해석할 수 있다. 본 연구에서

SFMPQ는 0.82, FRI에서 0.88, NDI 0.92, NPDS 0.96으로 결과값이 나왔다.

4. 식별 타당도

각 도구들의 전체 점수의 평균값과 표준 편차 값은 Table 1에서 임상군과 정상군으 로 나누어 보고 하였다. 독립군 t 검정 결과 임상군과 정상군의 비교 시 모두 유의한 수 준으로 차이를 보였다 (전체 p <0.01 단, SFMPQ의 감성척도 p=0.04).

Table 1. Discriminative Validity of Scales.

Outcome

Clinical group Normal group

t-test (p value) Pre-treatment

(N=180)

Post-treatment

(N=171) (N=81)

NDI (SD) 32.76 (16.27) 15.00 (13.44) 9.11 (7.08) <0.01 NPDS (SD) 43.74 (18.66) 23.79 (17.81) 15.18 (12.73) <0.01 FRI (SD) 39.97 (17.58) 20.05 (16.43) 13.97 (11.73) <0.01

SFMPQ

SEN (SD) 21.75 (15.44) 10.24 (11.07) 15.64 (13.53) <0.01 AFF (SD) 15.74 (19.30) 6.67 (12.19) 10.80 (13.54) 0.04 VAS (SD) 58.74 (21.97) 25.82 (20.93) 27.90 (23.17) <0.01

PPI (SD) 43.56 (18.33) 22.67 (14.56) 0 (0) <0.01 Total (SD) 18.75 (15.32) 8.45 (10.56) 13.22 (12.09) <0.01

AFF = affective descriptor score; PPI = present pain index; SEN = sensory descriptor score; Total = total descriptor score. Values are mean (SD) of scores standardized to a 0-100 scale.

5. 종적 구성 타당도

내외적 반응력 분석결과는 Table 2에 보 고되었다. 3개의 기능 도구를 서로 비교했을 때 반응력은 비슷하게 보였으나, 통증 측정 도구에서는 차이를 보였다. SFMPQ에서 전 체, 감각과 감성 척도에서 다른 통증과 기능

측정도구와의 비교 시 유의수준으로 반응력 이 낮게 나왔다. SFMPQ에서 세분화 되어 있는 항목 중 VAS 척도의 AUC 는 감각, 감성, 전체와 현재 통증 정도를 재는 척도들 의 AUC 와 비교했을 때 유의수준으로 높게 나왔다(p=0.001, <0.001, 0.001, 0.007 순서대

(8)

로). 현재 통증 척도는 감각 척도보다 결과 값이 크게 나왔지만, 통계적 유의수준에는

미치지 못하였다(p=0.096).

Table 2. Longitudinal Construct Validity Results Effect Sizes, Standardized Response Means, Pearson’s r, AUC.

Outcome ES (84% CI) SRM (84% CI) r with GPE (95% CI) AUC (95% CI) NDI (SD) 1.04 (0.94 to 1.13) 1.17 (1.06 to 1.28) -0.40 (-0.57 to -0.33) 0.79 (0.72 to 0.86) NPDS (SD) 1.07 (0.98 to 1.16) 1.34 (1.23 to 1.45) -0.42 (-0.53 to -0.28) 0.79 (0.72 to 0.86) FRI (SD) 1.07 (0.98 to1.16) 1.26 (1.15 to1.36) -0.46 (-0.52 to -0.27) 0.79 (0.72 to 0.86)

SFMPQ

VAS (SD) 1.44 (1.33 to 1.56) 1.37 (1.26 to 1.48) -0.41 (-0.53 to -0.28) 0.78 (0.71 to 0.85) PPI (SD) 1.09 (0.97 to 1.20) 1.04 (0.93 to 1.15) -0.36 (-0.49 to -0.22) 0.70 (0.61 to 0.78) SEN (SD) 0.72 (0.62 to 0.81) 0.81 (0.70 to 0.92) -0.23 (-0.37 to -0.08) 0.64 (0.56 to 0.73) AFF (SD) 0.44 (0.36 to 0.52) 0.62 (0.51 to 0.73) -0.10 (-0.24 to 0.06) 0.58 (0.49 to 0.67) Total (SD) 0.69 (0.60 to 0.78) 0.83 (0.72 to 0.94) -0.21 (-0.35 to -0.07) 0.63 (0.55 to 0.72)

Internal responsiveness is evaluated using Effect Sizes (ES) and Standardised Response Means (SRM). External responsiveness is evaluated by Pearson’s r and the Area Under the receiver operating characteristic Curve (AUC). CI

= Confidence interval.

6. 천정과 바닥효과, 빠진 값, 항목의 어려움

3가지 기능 측정 도구의 반응 분포는 Table 3-5에 보고되었다. 각 항목과 전체 점 수에서 어디에서도 천정과 바닥 효과는 보 여지지 않았다. NDI의 8번 항목 (64/180)과 NPDS의 20번 항목 (37/180)에서 많은 피험 자들이 응답을 하지 않았다. 이 두 항목은 피험자들이 운전을 하거나 약을 복용한다는 가정 하에 답을 하게 되어있어 이에 해당하 지 않은 피험자들은 답을 할 수 없는 항목 들이다. 예를 들면, NDI의 8번 항목은 피험 자가 운전을 한다는 가정하에 반응할 수 있

는 선택항목 첫 번째로서 ‘경추 통증 없이 운전할 수 있다’라고 되어있고, NPDS의 20 번 항목은 피험자가 약을 복용하고 있다는 가정하의 질문으로 ‘진통제 복용이 경추 통 증에 얼마나 도움이 됩니까?’이다.

각 항목들의 반응 평균값들은 NDI 에서 1.26에서 2.37사이 (가능 범위 0-5)였고, FRI 에서 1.14에서 2.19 (가능 범위 0-4), NPDS에서 1.35에서 3.57 (가능 범위 0-5) 이었다(Table 3-5). 본 연구에서 사용된 모 든 도구들은 아주 쉽거나 매우 어려운 항목 들 없이 대부분이 비슷한 수준의 어려움을 나타내는 항목들로 구성이 되어있어 다소 중복적인 면이 보여졌다.

(9)

Table 3. Distribution of Responses to NDI(range 0-5).

Item No Mean (SD) % of subjects using minimum response

% of subjects using maximum response

No of subjects with missing response to the item

1 2.37 (1.04) 0.56 0.56 0

2 1.26 (1.03) 24.44 0 0

3 1.71 (1.31) 15.00 3.33 1

4 2.06 (1.12) 5.56 1.11 1

5 1.50 (1.25) 21.67 2.78 0

6 1.57 (1.06) 8.33 0.56 0

7 1.56 (1.11) 14.44 1.67 0

8 1.96 (1.18) 3.89 1.67 64

9 1.47 (1.21) 3.89 1.67 1

10 1.65 (1.20) 25.00 0 1

Total score 32.76(16.27) 13.22 1.39 N/A

N/A = Not Applicable

Table 4. Distribution of Responses to NPDS (range 0-5).

Item No Mean (SD) % of subjects using minimum response

% of subjects using maximum response

No of subjects with missing response to the item

1 2.89 (1.12) 0 6.11 0

2 2.63 (1.07) 1.11 2.22 0

3 3.57 (1.01) 0 13.33 0

4 1.72 (1.37) 22.22 2.22 0

5 1.81 (1.25) 12.78 2.22 1

6 2.55 (1.28) 3.33 6.11 3

7 2.19 (1.28) 8.33 3.33 6

8 2.06 (1.40) 12.22 5.56 3

9 1.97 (1.44) 15.00 7.78 2

10 2.36 (1.40) 5.56 8.89 3

11 1.40 (1.22) 26.67 1.67 1

12 1.52 (1.39) 30 2.22 0

13 1.35 (1.33) 34.44 0.56 1

14 2.28 (1.38) 9.44 4.44 1

15 2.37 (1.41) 10 6.67 0

16 2.91 (1.01) 0.56 2.22 0

17 2.24 (1.32) 10 1.67 0

18 2.15 (1.44) 16.11 8.89 0

19 2.16 (1.44) 15.56 4.44 4

20 2.17 (1.34) 8.89 3.33 37

Total score 43.74(18.66) 12.11 4.47 N/A

N/A = Not Applicable

(10)

Table 5. Distribution of Responses to FRI (range 0-4).

Item No Mean (SD) % of subjects using minimum response

% of subjects using maximum response

No of subjects with missing response to the item

1 2.19 (0.76) 1.11 3.33 0

2 1.14 (0.97) 29.44 0.56 0

3 1.19 (0.90) 22.22 2.78 0

4 1.74 (0.96) 7.78 2.22 6

5 1.28 (0.93) 17.78 1.67 2

6 1.78 (1.12) 9.44 3.33 1

7 2.02 (0.95) 0.56 6.67 0

8 1.61 (1.14) 15.56 8.33 1

9 1.35 (1.24) 31.67 6.67 1

10 1.69 (1.16) 15.00 6.67 1

Total score 39.97(17.58) 15.72 4.56 N/A

N/A = Not Applicable

Ⅳ. 고 찰

영어로 된 도구들을 우리나라 언어와 문 화에 맞게 비교 문화번안을 하려면 표준화 된 번역과정, 즉 번역, 역번역과 뜻과 원본 에서 의미하는 것이 바로 전달이 되었는지 확인하는 절차가 거쳐 번역하고자 하는 언 어의 특색, 관용적인 표현을 사용하여 자연 스럽게 표현이 되었는지 확인하는 절차가 요구된다. 본 연구의 결과로 경추 통증과 기 능을 측정하는 한글 도구가 개발되었고, 이 는 국제적으로 표준화된 비교문화 번역 과 정을 거쳐 개발되어 영어 원본이 가지는 특 성을 잘 나타내었다고 보고되며, 이들을 또 한 잘 구성된 검사방법으로 각 도구들에 대 한 검증을 하였기 때문에 우리나라의 임상 이나 임상연구 분야에서 사용할 만한 가치 가 있다고 볼 수 있다.

지금까지 영어 개발된 경추 기능과 통증 측정도구들을 평가한 자료를 보면 질적으로

받아들일 수 있는 수준이다. 검사 - 재검사 신뢰도는 NDI에서 0.87, FRI에서 0.99로 보 고되었다6,12,23,24)

. 측정도구들의 내적일치도를 나타내는 크론바크 알파값은 0.80에서 0.93 으로 보고되었다6,12,23,25-27)

. 이는 본 연구의 결과와 비슷하다. 각 도구들의 반응력은 아 직 광범위하게 연구되지 않았으나, 임상연구 에서 치료(중재) 효과를 측정하는 도구들로 사용 되고 있다28,29). 여기서 반응력이란 임 상적으로 중요한 변화를 감지하는 측정도구 의 반응능력으로 정의된다30). 따라서 임상에 서나 임상연구에서나 치료 후 결과값을 측 정함에 있어서 각 측정도구의 반응력을 검 사하는 것은 필수적이다. 치료 후 결과값 측 정을 위한 반응력을 검사하기 위하여 여러 가지 전략들이 개발되어 왔다31). 그러나 어 떠한 것도 단 하나의 전략으로 다양한 연구 설계에 적합한 것은 없으며, 특정 연구 설계 에 적합한 특정 전략이 사용되어 왔다31). 각 기 다른 분석 전략을 다 같이 비교하게 되

(11)

면 각각 다른 순위를 보여주기 때문에, 여러 가지를 한 번에 다양하게 분석을 하여 결과 값을 비교하면 유용하다32). 즉 각각의 반응 력을 측정하는 색인이 같은 결과값을 보고 한다면 그 결과값에 좀 더 확신을 가질 수 있다. 본 연구에 사용된 경추 기능측정도구 와 VAS를 사용한 통증 측정도구는 여러 반 응력 검사에서 비슷한 결과를 보여주고 있 으며, 이는 임상에서나 관련 연구에서 사용 하기에 적합함으로 사용을 권장할 수 있다.

SFMPQ에서 전체, 감각, 감성 측정항목들 은 다른 통증측정 항목보다 유의수준으로 낮게 보고 되었는데, 이는 원본 MPQ에서 이미 같은 결과가 보고 된 바가 있다33). 전 세계적으로 보건 의료분야에서 광범위하게 많이 사용되는 SFMPQ를 고려할때, 이 결 과값은 임상에서나 임상 연구분야에서 흥미 있는 부분이다. 설명을 하자면, SFMPQ 에 서는 통증의 성질을 표현하는 형용사들이 모든 개개인에게 의미를 가지는 것은 아니 며, 평소의 통증 정도를 묻는 직접적인 질문 에서 증상이 있고 없고를 좀 더 분별력 있 게 나타내는 것으로 보인다. 따라서 단순 VAS 척도가 임상에서나 임상연구에서나 좀 더 효율적인 측정도구가 될 것으로 보인다.

그러나 SFMPQ 도구 사용 시 시각적인 항 목의 순서를 고려해볼 때, 감각과 감성 척도 항목들의 구성하는 형용사들은 VAS에 선행 하고, 이는 VAS 반응력에 대한 기폭제 역할 을 할 가능성도 있어 보인다. 만약 그렇다 면, 형용사를 먼저 거치지 않고 VAS에 먼저 답을 하게 될 때 그 반응력의 결과값은 같 은 정도로 나타내지 못할 수도 있을 것이다.

특이성 경부 통증의 치료는 관련 기능의 장애에 대한 치료보다 통증 감소에 중점을 둘 수 있다. 그러나 문제는 통증이 나아졌는 지, 기능이 좋아졌는지에 대한 질문은 환자 에게 뭐가 더 중요한 의미를 가지는가 하는 것이다. 환자의 GPE를 외부기준으로 사용 했을 때 기능 측정 도구들의 반응력이 통증 측정도구 보다 좀 더 높게 반응하여 보고되 었다. 이는 경부 통증에서는 환자의 주된 관 심사가 환자와 관련된 기능 수행능력으로 보여진다.

본 연구의 결과 본 연구에 사용 된 기능 측정도구들은 측정 도구의 특성에서 비슷한 결과값을 보였고 이는 본질적으로 같은 측 정 도구의 특성을 가졌다고 보여진다. 이 자 료만으로는 치료사나 임상 연구가들에게 경 추 기능 측정도구의 선택에서 지침이 될 수 없다. 그러나 여기에 더하여 사용의 편리함 과 다양함의 면에서 볼 때 FRI를 우선적으 로 추천할 수 있다. 환자가 사용하기가 간 단하고, 점수내기가 간단하며 경추 통증 환 자뿐만 아니라 요통 환자에도 적용할 수 있 기 때문이다.

V. 결 론

최근 증거에 입각한 치료에 집중적인 관 심이 증가되면서, 타당하고 신뢰가 높은 치 료 결과의 측정도구가 필요할 뿐만 아니라 표준 도구들의 타당하고 신뢰성 있는 비교 문화 번안도 이루어 져야 한다. 본 연구에서 4개의 한글 경부 통증과 기능 측정 도구가 개발되었고, 이들의 신뢰도와 타당도가 높았

(12)

다. 이는 경부 통증을 가진 환자를 측정하는 데 본 연구에서 개발된 한글 도구들을 사용 하기에 적합하다고 보여진다. 본 연구에 참 여한 임상군의 피험자들은 우리나라 내의 광역시와 중소 도시에 위치한 국립과 사립 의 물리치료 시설에서 모집되었으며 본 연 구의 피험자들은 특이성 경부 통증의 환자 군들의 다양함을 충족시키기에 적합하였다 고 본다. 도구의 필요조건들을 충족시켜준 경부 기능측정도구와 VAS의 사용을 강력하 게 추천한다.

참고문헌

1. Abdulwahab SS. Treatment based on H-reflexes testing improves disability status in patients with cervical radiculopathy. Int J of Rehabil Res.

1999 ; 22(3) : 207-14.

2. Deyo RA, Diehl AK. Psychosocial predictors of disability in patients with low back pain.

J Rheumatol. 1988 ; 15(10) : 1557-64.

3. Jette DU, Jette AM. Physical therapy and health outcomes in patients with knee impairments. Phys Ther. 1996 ; 76(11) : 1178-87.

4. Waddell G. The back pain revolutioned.

Edinburgh: Churchill Livingstone, 1998.

5. Deyo RA. Measuring the functional status of patients with low back pain. Arch Phys Med Rehabil. 1988 ; 69(12) : 1044-53.

6. Vernon H, Mior S. The Neck Disability

Index: a study of reliability and validity. J Manipulative Physiol Ther.

1991 ; 14(7) : 409-15.

7. Wheeler AH, Goolkasian P, Baird AC, Darden BV. Development of the Neck Pain and Disability Scale. Item analysis, face and criterion-related validity. Spine.

1999 ; 24(13) : 1290-4.

8. Leak AM, Cooper J, Dyer S, Williams KA, Turner-Stokes L, Frank AO. The Northwick Park Neck Pain Questionnaire, devised to measure neck pain and disability. Br J Rheumatol. 1994 ; 33(5) : 469-74.

9. Salen BA, Spangfort EV, Nygren AL, Nordemar R. The Disability Rating Index: an instrument for the assessment of disability in clinical settings. J Clin Epidemiol. 1994 ; 47(12) : 1423-35.

10. Jordan A, Manniche C, Mosdal C, Hindsberger C. The Copenhagen Neck Functional Disability Scale: a study of reliability and validity. J Manipulative Physiol Ther. 1998 ; 21(8) : 520-7.

11. BenDebba M, Heller J, Ducker TB, Eisinger JM. Cervical spine outcomes questionnaire: its development and psychometric properties. Spine. 2002 ; 27(19) : 2116-23.

12. Feise RJ, Michael Menke J. Functional rating index: a new valid and reliable instrument to measure the magnitude of clinical change in spinal conditions.

(13)

Spine. 2001 ; 26(1) : 78-86.

13. Pietrobon R, Coeytaux RR, Carey TS, Richardson WJ, DeVellis RF. Standard scales for measurement of functional outcome for cervical pain or dysfunction: a systematic review. Spine.

2002 ; 27(5) : 515-22.

14. Korea National Statistical Office. Korean Statistical Information System. Available from: URL:http://kosis.nso.go.kr. 2005.

15. Han C, Lee E, Iwaya T, Kataoka H, Kohzuki M. Development of the Korean Version of Short-Form 36-Item Health Survey: Health Related QOL of Healthy Elderly People and Elderly Patients in Korea. Tohoku J Exp Med.

2004 ; 203(3) : 189-94.

16. Kim DY, Lee SH, Lee HY, Lee HJ, Chang SB, Chung SK et al. Validation of the Korean Version of the Oswestry Disability Index. Spine. 2005 ; 30(5) : E123-E7.

17. Beaton DE, Bombardier C, Guillemin F, Ferraz MB. Guidelines for the process of cross-cultural adaptation of self-report measures. Spine. 2000 ; 25(24) : 3186-91.

18. Shrout PE, Fleiss JL. Intraclass correlations:

Uses in assessing rater reliability. Psychol Bull. 1979 ; 86(2) : 420-8.

19. Binkley JM, Stratford PW, Lott SA, Riddle DL. The Lower Extremity Functional Scale (LEFS): scale

development, measurement properties, and clinical application. North American Orthopaedic Rehabilitation Research Network. Phys Ther. 1999 ; 79(4) : 371-83.

20. Chansirinukor W, Maher CG, Latimer J. Evaluation of the multi-level Roland-Morris disability questionnaire.

Physiother Theory Pract. 2004 ; 20(1) : 1-15.

21. Tryon WW. Evaluating statistical difference, equivalence, and indeterminacy using inferential confidence intervals: an integrated alternative method of conducting null hypothesis statistical tests. Psychol Methods. 2001 ; 6(4) : 371-86.

22. DeLong ER, DeLong DM, Clarke -Pearson DL. Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. Biometrics. 1988 ; 44(3) : 837-45.

23. Stratford PW, Riddle DL, Binkley JM, Spadoni G, Westaway MD, Padfield B.

Using the Neck Disability Index to make decisions concerning individual patients. Physiother Can. 1999 ; 51(2) : 107-12, 19.

24. Goolkasian P, Wheeler AH, Gretz SS.

The neck pain and disability scale:

test-retest reliability and construct validity. Clin J Pain. 2002 ; 18(4) : 245-50.

(14)

25. Hains F, Waalen J, Mior S. Psychometric properties of the neck disability index. J Manipulative Physiol Ther. 1998 ; 21(2) : 75-80.

26. Wlodyka-Demaille S, Poiraudeau S, Catanzariti JF, Rannou F, Fermanian J, Revel M. The ability to change of three questionnaires for neck pain. Joint, Bone, Spine. 2004 ; 71(4) : 317-26.

27. Beattie PF, Dowda M, Feuerstein M.

Differentiating sensory and affective -sensory pain descriptions in patients undergoing magnetic resonance imaging for persistent low back pain. Pain. 2004

; 110(1-2) : 189-96.

28. White P, Lewith G, Prescott P, Conway J.Acupuncture versus placebo for the treatment of chronic mechanical neck pain - A randomized, controlled trial.

Ann Intern Med. 2004 ; 141(12) : 911-9.

29. Ozdemir F, Birtane M, Kokino S. The clinical efficacy of low-power laser therapy on pain and function in cervical osteoarthritis. Clin Rheumatol.

2001 ; 20(3) : 181-4.

30. Guyatt G, Walter S, Norman G. Measuring change over time: assessing the usefulness of evaluative instruments. J Chronic Dis.

1987 ; 40(2) : 171-8.

31. Stratford PW, Binkley FM, Riddle DL.

Health status measures: strategies and analytic methods for assessing change scores. Phys Ther. 1996 ; 76(10) : 1109-23.

32. Wright JG, Young NL. A comparison of different indices of responsiveness. J Clin Epidemiol. 1997 ; 50(3) : 239-46.

33. Scrimshaw SV, Maher C. Responsiveness of visual analogue and McGill pain scale measures. J Manipulative Physiol Ther.

2001 ; 24(8) : 501-4.

수치

Fig. 1. Study Procedure.
Table 1. Discriminative Validity of Scales.
Table 2. Longitudinal Construct Validity Results Effect Sizes, Standardized Response Means, Pearson’s r,  AUC.
Table 4.  Distribution of Responses to NPDS (range 0-5).
+2

참조

관련 문서

Basic aspects of AUTOSAR architecture and methodology Safety mechanisms supported by AUTOSAR.. Technical safety concepts supported by AUTOSAR Relationship to ISO

W You’re going to have back and neck pain, if you sit like that for a long time4. When you’re sitting, it’s very important to keep the back straight, knees bent, and head

Depending on Tennis Forehand Stroke with elbow pain and without elbow pain Kinematic Analysis of

Concentration-Dependent inhibition of cell viability by adenosine in human oral fibroblast and FaDu human head and neck squamous cell carcinoma · · ·

The purpose of this study was to investigate the effects of a disability awareness program on improving the attitudes of regular elementary school

Therefore, head and neck massage is an exercise program that is effective for brain function activation and stress factors in middle-aged women, and it is judged that it can be

This study analyzed how disability-related contents are included in the reorganized Korean language textbooks in accordance with the 2007 Revised

Results after 4 weeks showed that both deep neck bending muscle exercise+general neck strengthening exercise group showed decreased pain and improved functional status