1. 들어가며
보건의료에서 적응증(indication)은 ‘특정 치료나 검사가 필요한 증상 또는 임상 상황’으로 정의된다1). 적응증은 환자진료의 방향과 관련이 있다는 점에서 임상현 장에서 항상 만나는 주제이다. 의료가 전문분야로 인식될 때부터 적응증은 의료의 일부분이었다고 볼 수 있는데, 이러한 적응증을 체계적으로 정의하려는 시도는 비 교적 최근의 일이다(Chassin, 1988). 1980년대 이전만 하더라도 의학저널에 발표 되는 다양한 적응증들은 명시적인 방법이나 절차 없이 일부 문헌검토 결과와 저자 의 경험과 의견을 바탕으로 개발되는 것이 일반적이었다. 이렇게 개발된 적응증은 근거가 부족했고, 서로 모순되는 되거나 구체적이지 않아 진료에 적용하기 어려운 경우도 있었다. 적응증을 체계적으로 개발하려는 시도는 1980년대 전문학회, 공공기관, 보험자 등의 임상진료지침 개발 활동과 RAND 연구소와 UCLA 의과대학이 공동으로 개발 한 적절성 기준(appropriateness criteria, AC) 개발방법에서 확인할 수 있다(IOM, 1992). 당시 미국에서 적응증의 개발과 활용은 의료의 질은 높이고 비용은 낮출 수 있는 의료정책으로 다양한 이해관계자들의 관심을 받았다. 본 고에서는 적절성 기준 개발 방법를 중심으로 근거에 기반한 적응증 개발 방법 을 소개하고자 한다. 임상진료지침은 체계적 문헌고찰과 무작위 임상시험을 근거 로 비교적 좁은 범위의 적응증을 제시하는데 반해, 적절성 기준은 문헌고찰과 전문 가 합의를 바탕으로 포괄적인 적응증을 제공하기 때문에 진료의 적절성을 분석하 거나 다양한 임상상황에 대한 의사결정을 지원할 수 있다는 장점이 있다. 1) http://www.merriam-webster.com/dictionary/indication근거기반 적응증
개발 방법 소개
김교현 심사평가연구팀 주임연구원A ss es sm ent S ervi ce
2. 적절성 기준 개발 방법
가. RAND/UCLA의 적절성 기준 개발
1) 소개RAND 연구소는 1980년대 중반 UCLA 의과대학과 공동으로 ‘RAND/UCLA 적 절성 기준 개발방법(RAND/UCLA appropriateness method, RAM)’을 개발하였다 (Fitch, 2001). 합의개발 방법 중 수정된 델파이 방법으로 분류되는 RAM은 가상의 환자에 대한 특정 의료기술의 적절성 기준(적절, 불확실, 부적절)을 전문가 합의와 문헌고찰 자료를 근거로 개발한다. 개발된 적절성 기준은 당시 이슈가 되었던 의료 이용의 소지역 변이를 해석하고 평가하는데 유용한 도구가 될 것이라는 기대를 받 았다(Brook, 1984). RAM에서 적절한 시술은 ‘기대되는 건강 편익(기대여명의 증가, 통증의 감소, 불 안의 감소, 기능 개선)이 기대되는 부정적 결과(사망, 합병증, 시술에 대한 불안감, 시술에 의한 통증, 일을 하지 못하는 시간비용)를 충분히 넘어서는, 시행할 만한 가 치가 있는 시술’로 정의되었고, 이 정의는 시술의 적절성을 판단하는데 기초가 되 었다(Brook, 1986). RAND 연구소는 RAM을 적용하여 관상동맥 우회술, 담낭절제술, 경동맥 내막절 제술 등의 적절성 기준을 개발하였다. 1980년대에는 주로 진료의 적절성을 분석하 는데 적절성 기준이 활용 되었고, 1990년대에는 진료현장의 의사결정을 지원하는 데에도 활용되었다(Ballard, 1994). 2) 방법 1 단계 : 적응증 리스트 개발 및 문헌검토 자료 준비 RAM은 전문가 합의를 위한 기초 자료인 적응증(가상 임상시나리오)2) 리스트 개 발 및 문헌검토 자료 준비로 시작한다(그림 1). 적응증 리스트는 관련 임상문헌, 전 2) RAM에서 사용하는 적응증(indication)은 가상의 임상시나리오(clinical scenario)와 동일한 의미로 사용되기 때문에 우리가 일반적으로 사용 하는 적응증과 다른 의미를 갖는다. RAM을 거쳐서 적절한 것으로 분류된 적응증(임상시나리오)이 일반적인 의미의 적응증과 유사한 것 으로 볼 수 있다.
문가 의견, 학회 의견을 바탕으로 진료현장에서 만날 수 있는 모든 임상상황을 반 영하도록 개발되며3), 적응증에 대한 이해를 높이기 위하여 분류기준에 대한 정의 가 추가된다. 문헌검토 자료는 전문가들이 개발된 적응증 리스트에 대한 적절성 기준 판단시 참 고하는 자료로 주어진 시술 또는 수술의 효능, 합병증, 의료이용량, 비용에 대한 내 용이 포함된다. RAM 시행기관은 MEDLINE 검색 등을 통하여 참고문헌을 확인하고, 참고문헌별 내용, 출판연도, 연구설계 등을 검토하여 문헌검토 자료에 반영한다. 그림 1. RAND/UCLA 적절성 기준 개발 방법
자료 : Fitch K, et al, The RAND/UCLA appropriateness method user's manual(2001)에서 일부 수정
2단계 : 채점패널 구성 채점패널은 적응증 리스트에 대하여 적절성 점수를 채점하는 역할을 맡는다. 패 널의 채점결과가 적절성 기준 개발에 결정적이므로, 패널은 지역, 전문분야, 소속 기관의 성격을 고려하여 치우침(bias)을 최소화하는 방향으로 구성된다. 패널 후보 는 관련 학회로부터 추천을 받아 RAM 시행 기관이 선정한다. 패널의 규모는 의견 3) 1986년 개발된 6개 의료기술의 초기 적응증 리스트 개수는 관상동맥 조영술 205개, 관상동맥 우회술 370개, 담낭절제술 192개, 상부 위장관 내시경 1685개, 대장 내시경 1086개, 경동맥 내막절제술 675개였다(Brook, 1986). 전문가 패널 구성 및 채점 1차 채점 : 상호 의견교환 없음 2차 채점 : 상호 의견교환 후 (9점: 매우 적절, 1점: 매우 부적절) 적절성 기준 개발 적절 (7-9점) 불확실 (4-6점) 부적절 (1-3점) 후향적 활용 과거 의무기록에 적용하여 적절성 기준별 시술분율 분석 (적절/불확실/부적절: 00%, 00%, 00%) 전향적 활용 의사와 환자의 의사결정 지원 → 시술의 적절성 향상 문헌검토 및 근거의 종합 적응증 관련 정의 개발적응증 리스트 및
A ss es sm ent S ervi ce 의 다양성을 보장하면서도 면대면(face to face) 회의시 효과적인 의견교환이 가능 할 수 있는 규모여야 하는데, 초기 RAM은 채점패널을 대개 9명으로 구성하였다. 3단계 : 적절성 채점 시행 패널들은 각 적응증에 대한 적절성을 9점 척도로 2차에 걸쳐 채점한다. 해당 적응 증에 대하여 매우 적절한(extremely appropriate) 시술은 9점, 매우 부적절한(ex-tremely inappropriate) 시술은 1점, 애매하거나 불확실한(equivocal or uncertain; 명확히 적절하지도 않고, 명확히 부적절하지도 않은 또는 적절성을 판단할 만한 연 구 자료가 없는) 시술은 5점으로 채점한다4). 채점시 시술 비용은 고려하지 않고 평 균적인 미국 의사에게 평균적인 환자가 왔을 때를 가정한다. 최초 적응증 리스트, 문헌검토 자료, 채점표, 채점을 위한 안내서 등이 채점패널 에게 제공되면, 패널들은 개별적으로 1차 채점을 한다. RAM 시행기관은 1차 채점 결과를 취합 및 정리하여, 패널간의 의견교환을 위한 회의를 1~2일에 걸쳐 시행 한다. 회의는 적응증 리스트를 개발한 임상의사가 1차 채점결과 자료를 가지고 진 행한다. 각 패널에게는 자신의 채점결과와 다른 패널의 채점결과가 익명으로 표시 된 채점결과 자료가 제공된다. 회의는 적응증에 대한 이해도를 높이고, 적절성 채 점결과가 불일치하는 적응증에 초점을 맞추어 진행된다. 회의시 패널들의 의견에 따라 일부 적응증이 수정, 삭제, 추가 될 수 있다. 2차 채점은 회의 종료직후 또는 며칠 내에 진행된다. 4단계 : 채점결과 정리 개별 적응증에 대한 적절성 기준은 패널들의 2차 채점결과의 중앙값에 따라, 7-9점 은 ‘적절한 시술’, 4-6점은 ‘불확실한 시술’, 1-3점은 ‘부적절한 시술’로 구분된다. 패 널들의 채점결과가 ‘부동의(disagreement)’로 분류되는 경우는 ‘불확실한 시술’로 구분된다5). 일반적으로 면대면 회의를 거치면서 부동의로 분류되는 적응증은 감 소한다. 적절한 시술로 구분된 적응증은 추가적으로 필요성(necessity) 채점이 진 행되기도 한다. 필요성은 적절성보다 엄격한 정의를 적용하여 개발하며 과소이용 (under use)을 평가하는데 활용된다(Kahan, 1994; Fitch, 2001). 최종 채점결과의 예는 다음 그림 2와 같다.
4) 100개의 적응증을 채점하는데 대략적으로 20~35분정도 걸리는 것으로 보고되었다(Park, 1986) 5) 패널이 9명으로 구성되는 경우 ‘적절’과 ‘부적절’에 각각 3명 이상의 채점결과가 있으면 부동의로 분류된다.
그림 2. 관상동맥 우회술의 적절성 기준 채점결과 예시 (관상동맥 중재술 대상이 아닌 환자에서)
주 : 1) 캐나다 심혈관학회 분류기준
(Canadian cardiovascular society classification) 2) 항협심증제 2종 이상 복용 등
3) 50% 이상 협착
4) 3개 혈관의 50% 이상 협착 및 최소 1개 혈관의 70% 협착
자료 : Leape LL, Hilborne LH, Kahan JP, Stason WB, Park RE, Kamberg C, Brook RH. Coronary Artery Bypass Graft: A Literature Review and Ratings of Appropriateness and Necessity: RAND Corporation (1991)에서 일부 수정
개발된 적절성 기준은 연구비 지원처, 채점패널 구성방법 및 명단, 문헌검토 자 료, 채점방법, 채점결과와 함께 보고서로 발표된다. 1980년대와 1990년대 RAND 연구소에서 개발한 적절성 기준은 100 페이지 분량이 넘는 보고서 형태로 RAND 인터넷 홈페이지에 공개되어 있다6).
6) 전체 보고서는 http://www.rand.org/pubs/joint_reports-health.html 등에서 확인할 수 있다.
5) 수정된 Parsonnet risk score 9점 이하 6) 9명의 패널이 해당 적응증의 적절성을 9점으로 채점 7) 채점결과의 중앙값
8) 평균절대편차 (채점결과의 산포도) (mean absolute deviation from the median) 9) A: 동의; D: 부동의; I : 판정보류
1장(chapter). 만성 안정형 협심증 낮은 수술 위험도5) (low surgical risk)
I. 중증의 협심증 환자(Class III, IV)1) 관상동맥 우회술의 적절성
A. 최대 약물 치료를 받고 있는 환자2) 1. 좌주간지 질환(left main disease)3) a. 박출계수(ejection fractions) > 35% 96) 1 2 3 4 5 6 7 8 9 (9.07), 0.08), A9)) b. 박출계수(ejection fractions) : 15-35% 1 8 1 2 3 4 5 6 7 8 9 (9.0, 0.1, A)
c. 박출계수(ejection fractions) < 15% 3 3 3 1 2 3 4 5 6 7 8 9 (8.0, 0.7, A) 2. 삼혈관 질환(three vessel disease)4)
a. 박출계수(ejection fractions) > 35% 1 8 1 2 3 4 5 6 7 8 9 (9.0, 0.1, A) b. 박출계수(ejection fractions) : 15-35% 1 8 1 2 3 4 5 6 7 8 9 (9.0, 0.1, A) c. 박출계수(ejection fractions) < 15% 1 3 3 2 1 2 3 4 5 6 7 8 9 (8.0, 0.8, A) 적절성 점수 기준 1 2 3 4 5 6 7 8 9 1 = 매우 부적절 5 = 불확실 (명확히 적절하지도 않고, 명확히 부적절하지도 않음) 9 = 매우 적절
A ss es sm ent S ervi ce 3) 방법론 검토 RAM은 의료기술의 적응증을 포괄적이면서도 체계적으로 개발한 새로운 접근 방 법으로 이전의 적응증 개발 모습에 비하여 큰 발전을 이룬 것으로 보인다. RAM이 처음 소개될 때에는 11쪽 분량이었는데(Brook, 1986), 관련 경험과 논의가 축적되 면서 109쪽에 달하는 상세한 메뉴얼이 2001년에 출판되어 방법론상의 투명성과 구 체성이 강화되었다(Fitch, 2001). 세 가지 적절성 범주 가운데 ‘애매한 또는 불확실한 시술’ 범주는 임상의 불확실 성을 반영하는 장치로 보이는데, 이는 임상의사들이 RAM을 수용하는데 긍정적으 로 작용했을 수 있다. 채점패널의 구성과 숫자가 명확하게 정해진 것이 아닌 개발 의 목적 및 상황에 따라 조정될 수 있다는 방법론상의 유연성과 한 번의 회의로 수 백 개의 적응증을 개발한다는 효율성도 RAM의 장점으로 꼽을 수 있다. RAM에 대한 비판적인 시각도 적지 않다. 적절성 기준이 전문패널의 구성에 따 라 달라지기 때문에 RAM의 신뢰도와 타당성에 대한 이슈도 제기되었고(Coulter, 1995; Shekelle, 1998), 방법론이 구체적이지 않으며7), 비용을 고려하지 않는 문제 점을 지적한 것도 있다(Hicks, 1994). 이러한 지적들은 RAM의 특성과 제한점을 분명하게 보여주어, RAM의 발전과 신중한 사용에 기여한 것으로 보인다. RAM을 적용해서 개발한 적절성 기준의 타당성을 증명한 연구도 여럿 있다(Hemingway, 2001). RAM의 장점은 여러 나라에서 다양한 보건의료기술에 대한 적절성 기준의 개발 과 활용에 도움을 주었으며8), 아래에서 설명되는 미국영상의학회와 미국심장학회 의 적절성 기준 개발방법에도 직접적인 영향을 주었다. 7) 보건의료기술의 적절성을 위험과 편익을 고려하여 판단할 때, 위험과 편익에 대한 구체적인 정의가 사람마다 다를 수 있고, 각각의 크기에 대한 판단도 사람마다 다를 수 있고, 위험과 편익을 비교할 때에도 패널들마다 부여하는 가중치가 다를 수 있다(Hicks, 1994). 8) RAM을 사용하여 적절성 기준을 개발한 나라에는 캐나다, 이스라엘, 이탈리아, 네덜란드, 스페인, 스웨덴, 스위스, 영국 등이 있으며, 개발 된 적절성 기준에는 관상동맥 중재술, 관상동맥 우회술, 복부대동맥류 수술, 위장관 내시경, 전립선절제술, 유방암 수술, 우울증, 혈우병, 고관절 치환술, 자궁절제술, 척추수술 등이 있다(Fitch, 2001). 개발된 적절성 기준을 근거로 보건의료이용의 적절성을 평가한 결과도 상당 수 보고되었다. 한국에서는 관상동맥 중재술의 적절성 기준 개발과 적절성 평가가 보고된바 있다(Yim, 2004).
나. 미국영상의학회의 적절성 기준 개발
1) 소개미국영상의학회(American College of Radiology, ACR)는 1993년부터 적절성 기 준(AC) 개발 사업을 하였다(Cascade, 2000). 당시 증가하는 영상검사 관련 의료비 용을 억제하기 위한 의료이용관리, 사전승인 등의 조치가 시행되는 가운데 ACR은 학회회원, 병원계, 보험업계로부터 적절성 기준에 대한 요구를 받고 있었다. 이에
ACR은 관련 조직을 구성하고 RAM을 일부 수정한 방법론을 적용하여, ACR ACⓇ
를 1995년 처음으로 발표하였다. ACR ACⓇ 는 환자의 증상 또는 의심되는 진단명을 주제(topic)와 주제별 세부임상 상황(variants)으로 구체화하여, 상황별로 적절한 영상의학적 접근방법(CT, MRI, 초음파, x-ray 등)을 제시하는 형태를 가지고 있다. 주제에는 일반적인 증상(허리통 증, 두통, 흉통, 소아경련 등)부터 세부적인 것(진행된 자궁경부암의 방사선종양 치 료방법, 호지킨 림포마 병기 III 및 IV의 방사선종양 치료방법 등) 까지 넓은 범위의 임상상황이 포함된다. 2013년 2월 기준으로 186개 주제 하부에 900여개의 세부임 상상황에 대한 적절성 기준이 개발되어 있다9). 2) 방법 1 단계 : 적절성 기준 개발 준비 ACR ACⓇ 개발 준비과정에는 분과 패널 구성, 주제선정, 저자선정 작업이 포함 된다(그림 3). ACR ACⓇ 는 적절성 기준 위원회의 하부조직인 분과 패널이 개발하 는데, 2013년 기준으로 20개의 분과 패널이 있으며, 각 분과 패널은 10~16명의 패 널로 구성되어 있다. 패널회원은 해당 분야의 전문가 가운데 지역, 성별, 소속기관 의 성격, 전문영역 등의 균형을 고려하여 패널의장이 선정한다10). 분과 패널의 ACR ACⓇ 개발 활동은 AC 위원회의 지침을 따른다. AC 위원회는 각 분과 패널의 의장, 9) http://www.acr.org/Quality-Safety/Appropriateness-Criteria(접근일 : 2013년 8월) 10) 각 분과 패널은 영상의학 또는 방사선종양 전문의가 60%이상, 외부 전문의가 최소 1명에서 40%이하로 구성되도록 규정되어 있다. 2013 년 기준으로 전체 패널 인원은 300여명이고, 여기에는 20개 외부학회를 대표하는 80명의 패널이 포함되어 있다. 패널회원의 임기는 1년이 며, 학회장의 승인으로 3회까지 연장가능하다.
A ss es sm ent S ervi ce AC 방사선 노출 소위원회 의장, AC 방법론 전문가들이 포함되어 있다. ACR은 이해 상충 관리 정책에 따라 패널의장과 패널회원의 과반수 이상은 이해상충이 없을 것을 요구하고 있으며, 패널회원 선정시 이해상충이 있는 인원은 일반적으로 제외한다11). ACR ACⓇ 주제는 각 분과 패널이 유병률, 진료의 변이정도, 비용, 개선가능성 등 을 고려하여 선정하고, 분과 패널의 의장은 해당 주제의 AC 개발 작업을 전담해서 진행할 저자를 패널회원 중에서 선정한다. 패널의장은 분과 패널이 개발하는 여러 AC간의 일관성을 검토하는 역할도 한다. 그림 3. 미국영상의학회의 적절성 기준 개발 방법
주: 1) AC : Appropriateness Criteria, 2) ACR : American College of Radiology 자료: http://www.acr.org/Quality-Safety/Appropriateness-Criteria 11) ACR은 적절성 기준 개발과 관련하여 기업의 지원을 받지 못하도록 하고 있고, 패널의 과반수와 패널의장에게는 이해상충이 없을 것을 요구하고 있으며, 이해상충이 있는 인원은 패널 선발에서 일반적으로 제외한다. 한편, ACR은 패널의장과 패널회원들의 이해상충 정보 를 수집하고는 있으나, 적절성 기준 개발 관련 문서에서 패널들의 이해상충 정보를 공개하고 있지는 않다(http://www.acr.org/Membership/ Commissions-Committees) AC1) 방법론 소위원회 AC 방사선 노출 소위원회 ACR2) 사무국 AC 채점 자료 초안 작성 지원 참고문헌 검색 지원 채점자료 초안에 대한 의견수렴ㆍ정리ㆍ전파 (저자, 의장, 패널회원간 커뮤니케이션 지원) ㆍ 채점 지원 (결과 취합 및 정리) ㆍ 전화회의 지원 ㆍ 전화회의 결과에 대한 의견수렴 완성된 AC의 최종 문서화 작업 분과 패널의 AC 주제별 저자 (분과 패널의 회원) ㆍAC 개정 필요성 검토(2년 주기) ㆍ AC 채점 자료 초안 준비(세부임 상상황, 문헌고찰 요약결과 등) ㆍ 세부임상상황별 적절성 기준 변 경 가능성 검토 분과 패널 : 초안 검토 AC 채점 자료 초안 검토 분과 패널 : 적절성 기준 채점 ㆍ적절성 기준 채점(최대 3차) ㆍ 합의되지 않은 것은 전화회 의 시행 ㆍ전화회의 결과 검토 분과 패널의 의장 패널 회원 중에서 AC 주제별 저자 선정 AC 위원회 (분과 패널의 의장으로 구성)
2 단계 : 채점 자료 준비 저자로 선정된 패널회원은 적절성 채점 자료 초안을 작성한다. 채점 자료에는 본 문(주제에 대한 문헌고찰 자료, 세부임상상황, 세부임상상황별 영상의학적 접근방 법, 참고문헌 목록), 채점의 근거가 되는 근거표(참고문헌별 연구설계, 환자 수, 연 구목적 및 결과, 연구의 질 평가 결과)가 포함된다. 작성된 초안은 패널회원의 검토 의견을 반영하여 수정한다. ACR 사무국은 참고문헌 검색, 근거표 작성, 저자ㆍ패 널의장ㆍ패널회원간의 커뮤니케이션을 지원한다. 한편, AC를 개정할 때에는 새롭게 추가된 참고문헌을 근거로 기존에 개발된 적 절성 기준을 저자가 검토하여 적절성 기준이 변경될 것으로 예상되는 사항만 패널 채점이 진행되고, 그렇지 않은 사항은 별도의 채점 없이 패널의 승인으로 적절성 기준이 개정된다. 3 단계 : 적절성 채점 시행 패널회원은 채점 자료의 문헌고찰 자료, 근거표, 자신들의 판단을 바탕으로 세 부임상상황별 다양한 영상의학적 접근방법의 적절성을 RAM과 동일하게 9점 척도 로 채점한다12). 채점은 합의(패널의 80% 이상이 동일한 적절성 범주로 채점)에 이 를 때까지 최대 3차까지 진행되는데, 2차 및 3차 채점시에는 채점결과의 분포가 익 명으로 패널들에게 제공된다. 채점은 패널간의 별도 의견교환 없이, e메일과 팩스 로 진행된다. 4 단계 : 채점결과 정리 합의에 이른 채점결과는 중앙값에 따라 7-9점은 ‘대개 적절한 검사(usually not appropriate)’, 4-6점은 ‘적절할 수 있는 검사(may be appropriate)’, 1-3점은 ‘대개 부적절한 검사(usually not appropriate)’로 적절성 기준이 결정된다. 합의에 이르 지 못한 사항은 전화화의를 통해 합의를 시도하고, 그래도 합의가 되지 않는 사항 은 ‘합의가 이루어지지 않음(no consensus)’으로 분류된다. 완성된 적절성 기준을 ACR 사무국이 AC 위원회에 송부하면 AC 개발 작업이 완료된다. 개발된 ACR ACⓇ 은 근거표와 함께 학회 홈페이지에 공개되어 있다. 12) 채점시 패널들에게 요구되는 가정은 “환자는 세부임상상황별 주어진 검사방법에 대한 금기증을 가지고 있지 않다”, “세부임상상황별 주 어진 검사방법은 해당 기관에서 가용하다”, “전문가가 영상의학 검사를 시행하고 해석한다.” “검사의 직접비용과 간접비용은 고려하지 않 는다.” “검사의 방사선 노출은 고려하지 않는다.(적절성 채점시 검사의 편익은 방사선 노출의 위험보다 크다고 간주된다. 하지만 개별 환 자에게 영상의학 검사를 처방할 때에는 방사선 노출위험을 고려해야 한다)” 등이다.
A ss es sm ent S ervi ce 3) 방법론 검토 ACR ACⓇ 개발방법은 기본적으로 RAM과 동일하나, 몇 가지 고유한 특성을 보 인다. 우선 ACR은 학회내에서 RAM이 체계적으로 작동할 수 있도록 관련 조직을 구성하였고, 적절성 기준 개발 분야를 시술 또는 수술에서 영상검사 분야로 확장하 였으며, 한 개 시술 또는 수술 대한 적절성 기준이 아닌 여러 영상의학적 접근방법 의 적절성 기준을 한 개 임상상황에 대해 제시하였다. 또한 면대면 회의를 하지 않 고, 필요한 경우에만 전화회의를 하거나, 저자의 판단에 따라 선택적으로 패널 채 점을 진행하는 모습은 효율적으로 적절성 기준을 개발 또는 수정하기 위한 ACR 고 유의 특성으로 보인다.
다. 미국심장학회의 적절성 기준 개발
1) 소개미국심장학회(American College of Cardiology Foundation, ACCF)는 2004년부 터 심혈관질환 관련 영상검사와 시술에 대한 적절성 기준을 RAM을 일부 수정한 방 법론을 적용하여 개발하고 있다(Patel, 2005; Carr, 2013). 최근에는 방법론을 개정 하여 개발과정의 투명성과 이해관계자의 참여를 강화하였고, ‘적절성 기준’ 대신에 ‘적절한 사용 기준(appropriate use criteria, AUC)’이라는 용어를 사용하기로 하였 다(Hendel, 2013). 1980년대부터 임상진료지침을 개발하는 데에도 많은 노력을 기울인 ACCF는 AUC가 임상진료지침에 비하여 포괄적인 적응증을 제공하기 때문에 다양한 임상현 장에 대한 의사결정을 지원할 수 있고, 합의된 전문가 의견으로써 임상진료지침 개 발 시 근거로 활용될 수 있을 것으로 기대하였다(Patel, 2005). 2013년 기준으로 심 장 초음파, 관상동맥 조영술, 관상동맥 재관류술 등에 관한 AUC가 개발되어 있다. 2) 방법 1 단계 : 적절한 사용 기준 개발 준비 AUC 개발 준비작업은 AUC 태스크 포스가 진행하는데, 이 작업에는 주제 선정,
개발위원회 구성, 외부검토위원 선정, 채점 패널 구성 등이 포함된다. AUC 주제 는 의료이용의 변이, 이해관계자의 요구, 진료량, 비용 등을 근거로 선정하고, 관 련 학회 및 협력 단체로부터 후보를 추천 받아 개발위원회, 외부검토위원, 채점패 널을 선정한다. 개발위원회는 해당분야의 중요한 전문가 및 이해관계자를 대표할 수 있는 사람을 포함하여 6-10명으로 구성되고, 개발위원회를 지원하고 감독하기 위해서 AUC TF 중 1명이 개발위원으로 임명된다. 외부검토위원은 30명에서 50명까지 선정하고 채 점패널은 치우치지 않도록 다양한 전문가 및 관계자가 참여할 수 있도록 구성된다. 특히 채점패널 구성시에는 해당 AUC 분야의 전문가는 50% 미만이 되도록 하는데, 관상동맥 재관류술의 AUC 개발시에는 전체 채점패널 17명 가운데 재관류술 전문 가는 8명으로 구성하였다(Patel, 2009). 2 단계 : 채점 자료 준비 채점 자료는 개발위원회가 작성한다. 여기에는 임상시나리오13), 임상시나리오 분 류 기준에 대한 정의(용어의 정의, 검사결과 해석 기준 등), 채점시 패널들이 고려 해야 하는 공통 가정 또는 조건(시술자의 역량, 검사의 질 등), 채점의 근거가 되는 문헌고찰 자료가 있다. 문헌고찰 자료에는 임상시나리오별로 임상진료지침의 권 고사항을 정리한 맵핑(mapping) 자료와 필요한 경우 체계적 문헌고찰 자료가 포 함된다. 개발위원회가 작성한 임상시나리오는 외부검토위원의 의견을 반영하여 수정되 고, 모든 채점 자료는 AUC TF가 최종 검토하고 승인한다. 3 단계 : 적절성 채점 시행 적절성 채점 방식과 기준 및 상호의견 교환을 RAM과 동일하게 9점 척도로 2차 에 걸쳐 진행된다. 1차 채점 후 진행되는 회의의 목적, 진행방식, 패널에 의한 임상 시나리오 수정도 RAM과 동일하다. 회의의 진행자는 AUC 대상이 되는 시술을 하 지 않으면서, 개발위원회, AUC TF, 채점 패널에 속하지 않은 사람으로 선정한다.
A ss es sm ent S ervi ce 4 단계 : 채점결과 정리 적절성 기준은 2차 채점결과의 중앙값에 따라 7-9점은 적절한 진료(appropriate care), 4-6점은 적절할 수 있는 진료(may be appropriate care), 1-3점은 드물게 적 절한 진료(rarely appropriate care)로 범주화 된다. 패널의 채점결과가 ‘부동의’로
분류되는 경우는 자동적으로 ‘적절할 수 있는 진료’로 구분된다.14) 개발된 AUC는 학회의 승인 후, 주요 내용은(AUC의 배경ㆍ방법ㆍ결과ㆍ해석, AUC 개발 참여자 명단ㆍ소속ㆍ산업계와의 관계 등)은 논문의 형태로 출판되고, 패널들의 상세 채점결과 및 임상시나리오별 임상진료지침 맵핑 자료 등은 학회 홈 페이지에 공개된다. 3) 방법론 검토
ACCF의 AUC는 개발과정의 투명성과 균형성 측면에서 RAM을 발전시킨 것으로
보인다. 투명성의 발전은 이해상충의 공개15) 및 임상시나리오별 임상진료지침 맵
핑 자료에서, 균형성은 채점패널의 구성, 회의 진행자의 선정, 외부검토절차에서 확인할 수 있다. 이런 노력들은 RAM의 방법론상의 제한점을 보완하기 위한 것으 로도 볼 수 있다.
RAM을 학회내에서 작동시키기 위하여 ACR은 신속성과 효율성에 초점을 맞춘데 비하여 ACCF는 AUC TF가 직접 AUC 개발 전 과정을 지원하고 감독함으로써 개발 작업의 엄격성과 일관성에 초점을 맞춘 것으로 보인다.
3. 맺으며 : 국내 적절성 기준 개발 및 활용 가능성
적절성 기준 개발 방법은 1980년대 RAM부터 2013년 AUC에 이르기까지 개발과정 의 투명성을 높이고 치우침을 최소화 하는 방향으로 발전한 것으로 해석할 수 있다. 적절성 채점의 근거로 임상진료지침과 표준화된 문헌고찰 방법이 활용되었고, 다양 14) 패널이 14-16명으로 구성되는 경우 ‘드물게 적절’과 ‘적절’에 각각 5명 이상의 채점결과가 있으면 부동의로 분류된다.15) ACCF는 AUC 개발에 참여한 모든 인원(AUC TF, 개발위원회, 외부검토위원, 채점 패널)의 산업계와의 관계를 6개 항목(자문위원, 연자, 지분참여, 연구비 지원, 기관지원, 전문가 증언)으로 구분하여 AUC에 포함하여 공개하고 있다.
한 이해관계자가 개발과정에 참여하였으며, 이들의 이해상충 관계는 공개되었다. 이 러한 발전 방향은 미국의학원이 제시한 임상진료지침 개발과 관련한 권고사항과 동일 선상에 있기 때문에 긍정적인 평가가 가능하다(IOM, 2011).
국내에서 적절성 기준 개발방법을 활용한 적응증이 개발된다면 심평원의 가치기 반 심사평가 사업에 유용하게 활용될 수 있을 것이다. 보건의료체계가 환자에게 필 요한 진료(right care)를 올바른 방법(right way)으로 제공하여 좋은 건강결과(right outcome)를 성취하는 방향으로 작동해야 한다면, 적절성 기준의 역할은 분명하다 (Patel, 2012). 기존의 심사평가 업무가 주로 진료방법과 건강결과에 초점을 맞추 었다면 근거에 기반한 적응증 또는 적절성 기준은 환자에게 필요한 진료를 정의하 는데 활용될 수 있으며, 이는 가치기반 심사평가 업무의 작지 않은 부분이 될 수 있 을 것이다. 국내에서 적절성 기준을 개발하고 활용하려고 한다면, 우선 이해관계자간 적절 성 기준의 특성에 대한 공통된 이해가 필요하다. 적절성 기준은 일반적인 환자, 의 사, 진료환경을 가정하여 전문가 합의를 바탕으로 개발한 의사결정 지원 도구로써, 임상의사의 판단을 대신하거나, 의료의 불확실성을 제거하는 역할을 할 수는 없다. 복잡하고 다양한 임상상황이 존재하는 만큼 ‘부적절한 또는 드물게 적절한’ 분류되 는 진료도 환자 및 치료환경의 특수성에 따라 불가피하게 해야 하는 경우가 있을 수 있다는 것을 이해관계자들은 이해할 필요가 있다. 또한 타당도과 신뢰도가 완벽 하지 않기 때문에 적절성 기준을 개별 진료 건에 대한 급여기준으로 사용하는 것은 제한될 수 밖에 없다. ACCF는 AUC를 개별 진료 건에 대한 급여기준의 근거로 활 용하는 것은 AUC의 취지에 맞지 않으며, ‘드물게 적절한 시술’ 또는 ‘부적절 시술’ 의 분율이 상대적으로 높은 기관을 선별하는 데 활용하거나, 진료의 적절성 패턴을 분석하여 해당의사와 기관에게 피드백을 제공하는데 활용하는 것이 AUC의 특성 을 고려한 활용방법이라고 하였다(Hendel, 2013). 적절성 기준의 특성과 활용방법 에 대한 공감대가 이루어졌다면, 개발방법과 관련한 세부적인 사항의 결정은 선행 사례와 임상진료지침 개발 관련 원칙에서 도움을 받을 수 있다. 적절성 기준은 제공될 또는 제공된 의료서비스의 가치를 평가하고 높이는데 유 용한 도구가 될 수 있다. 이것이 없다면 증가하거나 감소하는 의료서비스의 적절성 을 해석하는 것도 제한된다. 의료의 질과 비용에 대한 가치를 높이려는 시도는 계 속될 것이고, 이 시도를 구체화하는데 적절성 기준 또는 적응증에 대한 논의는 피
A ss es sm ent S ervi ce 하기 어렵다. 한국의 보건의료에서 누가 이 논의를 리드할 것인지는 이해관계자들 의 역할과 노력에 따라 결정될 것이다. 참고문헌
Ba llard DJ. The RAND/AMA/AMCC Clinical Appropriateness Initiative: Insights for Multi-site Appropri-ateness Studies Derived from the Abdominal Aortic Aneurysm Surgery Project. Int J for Qual Health Care. 1994;6(2):187-98
Bl ackmore CC, Mecklenburg RS, Kaplan GS. Effectiveness of Clinical Decision Support in Controlling Inappropriate Imaging. J Am Coll of Radiol. 2011;8(1):19-25
Br ook RH, Lohr K, Chassin M, Kosecoff J, Fink A, Solomon D. Geographic variations in the use of services: do they have any clinical significance? Health Affairs. 1984;3(2):63-73
Ca scade PN. The American College of Radiology. ACR Appropriateness Criteria project. Radiology. 2000;214 Suppl:3-46
Ch assin MR, Park RE, Fink A, Rauchman S, Keesey J, Brook RH. Indications for Selected Medical and Surgical Procedures-A Literature Review and Ratings of Appropriateness CABG. Rand Corpora-tion;1986
Ch assin MR. Standards of care in medicine. Inquiry : a journal of medical care organization, provision and financing. 1988;25(4):437-53
Co ulter I, Adams A, Shekelle P. Impact of varying panel membership on ratings of appropriateness in consensus panels: a comparison of a multi-and single disciplinary panel. Health services research. 1995;30(4):577
Ex pert Panel on Neurologic Imaging, ACR Appropriateness CriteriaⓇ low back pain. American College
of Radiology (ACR);2011
Fi tch K, Bernstein SJ, Aguilar MS, Burnand B, LaCalle JR, Lazaro P, et al. The RAND/UCLA appropri-ateness method user's manual. Rand Corporation;2001.
He mingway H, Crook AM, Feder G, Banerjee S, Dawson JR, Magee P, et al. Underuse of Coronary Revascularization Procedures in Patients Considered Appropriate Candidates for Revascularization. New Engl J Med. 2001;344(9):645-54
He ndel RC, Patel MR, Allen JM, Min JK, Shaw LJ, Wolk MJ, et al. Appropriate Use of Cardiovas-cular Technology : 2013 ACCF Appropriate Use Criteria Methodology Update: A Report of the American College of Cardiology Foundation Appropriate Use Criteria Task Force. J Am Coll Cardiol. 2013;61(12):1305-17
Hi cks NR. Some observations on attempts to measure appropriateness of care. BMJ:1994;309(6956):730. In stitute of Medicine. Guidelines for Clinical Practice:From Development to Use. The National
Acad-emies Press; 1992
In stitute of Medicine. Clinical Practice Guidelines We Can Trust. The National Academies Press; 2011. Ka han JP, Bernstein SJ, Leape LL, Hilborne LH, Pa가 RE, Parker L, et al. Measuring the Necessity of
Le ape LL, Hilborne LH, Kahan JP, Stason WB, Park RE, Kamberg C, Brook RH. Coronary Artery By-pass Graft: A Literature Review and Ratings of Appropriateness and Necessity: RAND Corporation (1991)
Pa tel MR, Spertus JA, Brindis RG, Hendel RC, Douglas PS, Peterson ED, et al. ACCF Proposed Meth-od for Evaluating the Appropriateness of Cardiovascular Imaging. J Am Coll Cardiol. 2005;46(8): 1606-13
Pa tel MR, Dehmer GJ, Hirshfeld JW, Smith PK, Spertus JA. ACCF/SCAI/STS/AATS/AHA/ASNC 2009 Appropriateness Criteria for Coronary Revascularization. J Am Coll Cardiol. 2009;53(6):530-53 Pa tel MR. Appropriate Use Criteria to Reduce Underuse and Overuse: Striking the Right Balance. J Am
Coll Cardiol. 2012;60(19):1885-7
Sh ekelle PG, Kahan JP, Bernstein SJ, Leape LL, Kamberg CJ, Park RE. The Reproducibility of a Method to Identify the Overuse and Underuse of Medical Procedures. N Engl J Med. 1998;338(26):1888-95 Si strom CL, Dang PA, Weilburg JB, Dreyer KJ, Rosenthal DI, Thrall JH. Effect of Computerized Order
Entry with Integrated Decision Support on the Growth of Outpatient Procedure Volumes: Seven-year Time Series Analysis. Radiology. 2009;251(1):147-55
Yi m J, Khang Y-H, Oh B-H, Kim Y-I, Kim C-y. The appropriateness of percutaneous transluminal coronary angioplasty in Korea. Int J Cardiol. 2004;95(2-3):199-205