• 검색 결과가 없습니다.

동반질환 분석을 위한 데이터 구축

N/A
N/A
Protected

Academic year: 2021

Share "동반질환 분석을 위한 데이터 구축"

Copied!
10
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

동반질환 분석을 위한 데이터 구축

1. 동반질환 정의

●‘동반질환’은환자가가지고있는질환중주진단질환이아닌나머지질환을뜻하며,환자에따라 여러가지동반질환을가지고있을수있음  ▶합병증의개념과비슷하지만주질환과관련이없다는점에서차이가있음 ●객관적인인과성추론을위하여거쳐야하는중증도보정과정에서동반질환은중요한변수로 활용됨  ▶중증도보정은환자결과에영향을줄수있는교란변수들을통제하는과정으로연령,성별, 의료보장형태등을변수로활용  ▶동반질환은합병증,사망,재원일수,진료비등에영향을줄수있어중요한중증도변수임  ▶예를들어동일질환,동일치료를받은환자임에도연령,성별,동반질환등에따라환자의 결과는차이가있을수있으므로,중증도보정을통해동일한조건으로보정이필요함 ●본가이드에서는원격접속통계분석시스템이용시활용할수있는동반질환분석을위한데이터 구축과정을소개하고자함 ※「HIRA빅데이터브리프」제2권3호의가이드에서소개한내용을원격접속통계분석시스템환경에맞게재편집함.

(2)

2. 동반질환 구축 과정

1) 동반질환 측정

●동반질환을활용한보정방법에는기존에발표된연구결과를근거로임상적견해,통계적검정 결과에따라유의한질환만을선택적으로보정하는방법과동반질환측정도구를사용하는방법이 있음  ▶선택적 보정 방법은 동반질환에 대한 서로 다른 견해나 통계적 접근 방법으로 연구들 간 비교가능성이낮다는제한점이있음  ▶동반질환을 종합적으로 평가하고 다양한 질환에 적용할 수 있는 측정도구로는 Charlson 동반질환지수(CharlsonComorbidityIndex,CCI)1)와Elixhauser의동반질환(Elixhauser's ComorbidityMeasure,ECM)2)등이있음 [그림 1]Charlson동반질환지수와가중치(Quan등,2005)

(3)

2) 동반질환 관찰기간 설정

●동반질환관찰기간은환자의이전의료이용을추적하는기간을의미하며,이는동반질환유병률과 모형예측력에영향을줌  ▶관찰기간이길어질수록동반질환을관찰할기회는증가하지만동반질환보정효과가감소하여 비용-효과적이지않다고보고됨 ●건강보험 청구자료에는 환자 고유 식별자(JID)가 있어 자료 접근 범위 내에서 장기간 추적이 가능하지만대부분연구에서자료접근성과임상적판단을고려하여기준일자(Indexdate)로 부터이전1년정도를동반질환관찰기간으로설정함

3) 자료 범위 설정

●동반질환분석시연구자판단에따른의료이용의형태(입원/외래)와상병순위(주,부상병)의 설정이필요함  ▶입원자료만을활용하는경우비교적진단의정확성이높지만당뇨와고혈압등외래중심 질환을관찰하지못하는제한점이있음  ▶상병의범위는i)주상병,ii)주상병과제1부상병,iii)모든상병등으로설정할수있음

3. 동반질환 구축 예시

●기준 일자(Index date) 기준으로 과거 1년 동안 동반질환을 관찰하여, CCI를 산출하는

프로그램을예시로제시함  ▶합병증과구분하기위하여기준일자에청구된상병을CCI에포함하지않고,Quan등(2005) 이제시한ICD-10알고리즘과Original가중치를적용함  ▶주상병과 제1부상병만 관찰하는 경우(200T 활용)와 모든 상병을 관찰하는 경우(400T)로 구분하여프로그램을제시함

(4)

/* 환자의 기준시점(index) 설정 */

proc sortdata = tt.t200_ex; by jid recu_fr_dd recu_to_dd; run;

data index(keep = jid index_start_date index_end_date); set tt.t200_ex; by jid;

format index_start_date index_end_date yymmdd10.; index_start_date = input(recu_fr_dd, yymmdd8.); index_end_date = input(recu_to_dd, yymmdd8.);

if first.jid = 1thenoutput; run;

/* 동반질환 해당 여부 코딩을 위한 data 변환 */ /* 200T를 활용하는 경우(제1부상병까지만 활용) */ data temp200a; set tt.t200_ex;

sick_cd = main_sick; output; sick_cd = sub_sick; output; run;

data temp200b; set temp200a; if sick_cd = ' ' or sick_cd = '$' then delete;

(5)

※200T는주상병과제1부상병이다른변수로동일행에기재되어있어,이를동일변수로변환하여별로의 행(MID는동일)으로표시하여야함

※400T에는수진자개인식별대체키(JID),요양개시일자(RECU_FR_DD),요양종료일자(RECU_TO_DD) 변수가없어,명세서200T와조인하여활용하여야함

/* 400T를 활용하는 경우(제2부상병 이상 활용) */ proc sql; create table t400joint200 as

select t1.mid, t1.sick_cd, t1.sick_ty_cd, t2.jid, t2.recu_fr_dd, t2.recu_to_dd

from tt.t400_ex t1 left join tt.t200_ex t2 on (t1.mid = t2.mid);

quit;

data temp400; set t400joint200; if sick_ty_cd = '3' then delete;

(6)

/* 청구명세서 단위로 동반질환 코딩 */

※본프로그램에서는400T로구축한테이블을활용함

proc sql;

create table comorbidity asselect jid, recu_fr_dd, recu_to_dd, sick_cd, mid, /* 01. Myocardial infarction */

max(case when substr(sick_cd, 2, 3) in ('I21', 'I22') or substr(sick_cd, 2, 4) in ('I252') then 1 end) as count_cci01,

/* 02. Congestive heart failure */

max(case when substr(sick_cd, 2, 3) in ('I43', 'I50') or substr(sick_cd, 2, 4) in ('I099', 'I110', 'I130', 'I132', 'I255', 'I420', 'I425', 'I426', 'I427', 'I428', 'I429', 'P290') then 1 end) as count_cci02,

/* 03. Peripheral vascular disease */

max(case when substr(sick_cd, 2, 3) in ('I70', 'I71') or substr(sick_cd, 2, 4) in ('I731', 'I738', 'I739', 'I771', 'I790', 'I792', 'K551', 'K558', 'Z958', 'Z959') then 1 end)

as count_cci03,

/* 04. Cerebrovascular disease */

max(case when substr(sick_cd, 2, 3) in ('G45', 'G46', 'I60', 'I61', 'I62', 'I63', 'I64',

'I65', 'I66', 'I67', 'I68', 'I69') or substr(sick_cd, 2, 4) in ('H340') then 1 end) as

count_cci04, /* 05. Dementia */

max(case when substr(sick_cd, 2, 3) in ('F00', 'F01', 'F02', 'F03', 'G30') or substr(sick_cd, 2, 4) in ('G311', 'F051') then 1 end) as count_cci05,

/* 06. Chronic pulmonary disease */

max(case when substr(sick_cd, 2, 3) in ('J40', 'J41', 'J42', 'J43', 'J44', 'J45', 'J46',

'J47', 'J60', 'J61', 'J62', 'J63', 'J64', 'J65', 'J66', 'J67')

or substr(sick_cd, 2, 4) in ('I278', 'I279', 'J684', 'J701', 'J703') then 1 end) as

count_cci06,

/* 07. Rheumatologic disease */

max(case when substr(sick_cd, 2, 3) in ('M05', 'M06', 'M32', 'M33', 'M34') or substr(sick_cd, 2, 4) in ('M315', 'M351', 'M353', 'M360') then 1 end) as count_ cci07,

/* 08. Peptic ulcer disease */

max(case when substr(sick_cd, 2, 3) in ('K25', 'K26', 'K27', 'K28') then 1 end) as

count_cci08,

(7)

or substr(sick_cd, 2, 4) in ('K700', 'K701', 'K702', 'K703', 'K709', 'K713', 'K714',

'K715', 'K717', 'K760', 'K762', 'K763', 'K764', 'K768', 'K769', 'Z944') then 1 end) as

count_cci09,

/* 10. Diabetes without chronic complication */

max(case when substr(sick_cd, 2, 4) in ('E100', 'E101', 'E106', 'E108', 'E109',

'E110', 'E111', 'E116', 'E118', 'E119', 'E120', 'E121', 'E126', 'E128', 'E129',

'E130', 'E131', 'E136', 'E138', 'E139', 'E140', 'E141', 'E146', 'E148', 'E149') then 1 end) as count_cci10,

/* 11. Diabetes with chronic complication */

max(case when substr(sick_cd, 2, 4) in ('E102', 'E103', 'E104', 'E105', 'E107',

'E112', 'E113', 'E114', 'E115', 'E117', 'E122', 'E123', 'E124', 'E125', 'E127',

'E132', 'E133', 'E134', 'E135', 'E137', 'E142', 'E143', 'E144', 'E145', 'E147') then 1 end) as count_cci11,

/* 12. Hemiplegia or paraplegia */

max(case when substr(sick_cd, 2, 3) in ('G81', 'G82') or substr(sick_cd, 2, 4) in ('G041', 'G114', 'G801', 'G802', 'G830', 'G831', 'G832', 'G833', 'G834', 'G839') then 1 end) as count_cci12,

/* 13. Renal disease */

max(case when substr(sick_cd, 2, 3) in ('N18', 'N19')

or substr(sick_cd, 2, 4) in ('I120', 'I131', 'N032', 'N033', 'N034', 'N035', 'N036',

'N037', 'N052', 'N053', 'N054', 'N055', 'N056', 'N057', 'N250', 'Z490', 'Z491', 'Z492',

'Z940', 'Z992') then 1 end) as count_cci13,

/* 14. Any malignancy including leukemia and lymphoma */

max(case when substr(sick_cd, 2, 3) in ('C00', 'C01', 'C02', 'C03', 'C04', 'C05',

'C06', 'C07', 'C08', 'C09', 'C10', 'C11', 'C12', 'C13', 'C14', 'C15', 'C16', 'C17', 'C18', 'C19', 'C20', 'C21', 'C22', 'C23', 'C24', 'C25', 'C26', 'C30', 'C31', 'C32', 'C33', 'C34', 'C37', 'C38', 'C39', 'C40', 'C41', 'C43', 'C45', 'C46', 'C47', 'C48', 'C49', 'C50', 'C51', 'C52', 'C53', 'C54', 'C55', 'C56', 'C57', 'C58', 'C60', 'C61', 'C62', 'C63', 'C64', 'C65', 'C66', 'C67', 'C68', 'C69', 'C70', 'C71', 'C72', 'C73', 'C74', 'C75', 'C76', 'C81', 'C82', 'C83', 'C84', 'C85', 'C88', 'C90', 'C91', 'C92', 'C93', 'C94', 'C95', 'C96', 'C97') then 1 end) as count_cci14,

/* 15. Moderate or severe liver disease */

max(case when substr(sick_cd, 2, 4) in ('I850', 'I859', 'I864', 'I982', 'K704', 'K711',

'K721', 'K729', 'K765', 'K766', 'K767') then 1 end) as count_cci15, /* 16. Metastatic solid tumor */

(8)

max(case when substr(sick_cd, 2, 3) in ('C77', 'C78', 'C79', 'C80') then 1 end) as

count_cci16,

/* 17. Acquired immune deficiency syndrome/human immunodeficiency virus */

max(case when substr(sick_cd, 2, 3) in ('B20', 'B21', 'B22', 'B24') then 1 end) as

count_cci17

from temp400

group by mid; quit;

/* 동반질환이 없는 청구건 삭제 */ data comorbidity2; set comorbidity;

total = sum(count_cci01, count_cci02, count_cci03, count_cci04, count_cci05, count_cci06, count_cci07, count_cci08, count_cci09, count_cci10, count_cci11, count_cci12, count_cci13, count_cci14, count_ cci15,count_cci16, count_cci17);

if total = 0then delete; run;

/* index date를 기준으로 1년전 동반질환 내역만 가져오기 */ proc sortdata = index; by jid; run;

proc sort data = comorbidity2; by jid; run;

data comorbidity3; merge index comorbidity2; by jid;

format fol_start_date fol_end_date yymmdd10.; fol_start_date = input(recu_fr_dd, yymmdd8.); fol_end_date = input(recu_to_dd, yymmdd8.);

if -365 < intck('day', index_start_date, fol_end_date) < 0;

run;

/* 청구명세서 단위의 동반질환 내역을 환자단위로 축소 */ proc sql;

create table comorbidity4 as select *,

max(count_cci01) as ncount_cci01, max(count_cci02) as ncount_cci02, max(count_cci03) as ncount_cci03, max(count_cci04) as ncount_cci04, max(count_cci05) as ncount_cci05, max(count_cci06) as ncount_cci06, max(count_cci07) as ncount_cci07, max(count_cci08) as ncount_cci08,

(9)

max(count_cci11) as ncount_cci11, max(count_cci12) as ncount_cci12, max(count_cci13) as ncount_cci13, max(count_cci14) as ncount_cci14, max(count_cci15) as ncount_cci15, max(count_cci16) as ncount_cci16, max(count_cci17) as ncount_cci17

from comorbidity3

groupby jid

orderby jid;

quit;

proc sortdata = comorbidity4 nodupkeyout = comorbidity5; by jid; run; /* index data에 동반질환 점수 붙이기 */

proc sort data = comorbidity5; by jid; run;

proc sortdata = index; by jid; run;

data final; merge index comorbidity5; by jid;

if ncount_cci01 = . then ncount_cci01 = 0;

if ncount_cci02 = . then ncount_cci02 = 0;

if ncount_cci03 = . then ncount_cci03 = 0;

if ncount_cci04 = . then ncount_cci04 = 0;

if ncount_cci05 = . then ncount_cci05 = 0;

if ncount_cci06 = . then ncount_cci06 = 0;

if ncount_cci07 = . then ncount_cci07 = 0;

if ncount_cci08 = . then ncount_cci08 = 0;

if ncount_cci09 = . then ncount_cci09 = 0;

if ncount_cci10 = . then ncount_cci10 = 0;

if ncount_cci11 = . then ncount_cci11 = 0;

if ncount_cci12 = . then ncount_cci12 = 0;

if ncount_cci13 = . then ncount_cci13 = 0;

if ncount_cci14 = . then ncount_cci14 = 0;

if ncount_cci15 = . then ncount_cci15 = 0;

if ncount_cci16 = . then ncount_cci16 = 0;

if ncount_cci17 = . then ncount_cci17 = 0;

cci = (ncount_cci01 + ncount_cci02 + ncount_cci03 + ncount_cci04 + ncount_cci05 + ncount_cci06 + ncount_cci07 + ncount_cci08 + ncount_cci09 + ncount_cci10 + 2*ncount_cci11 + 2*ncount_cci12 + 2*ncount_cci13 + 2*ncount_cci14 + 3*ncount_cci15 + 6*ncount_cci16+ 6*ncount_cci17);

cci_group = cci;

(10)

4. 맺음말

●건강보험청구자료를분석할때는환자의결과에영향을줄수있는변수들을보정하여야보다 객관적인인과추론이가능함  ▶환자의결과에영향을줄수있는교란변수는주진단질환의중증도,임상적상태등다양하나, 건강보험청구자료에서활용할수있는변수는연령,성별,동반질환등임 ●본 가이드에서는 일반적으로 많이 활용하고 있는 Charlson 동반질환 지수에 대해 설명하고 있지만연구자판단에따라다양한방법들이활용될수있음  ▶연구성격에따라동반질환측정도구뿐만아니라적합한관찰기간,자료범위를설정하여야함

참조

관련 문서

- 페이스북이나 트위터를 통해 범죄자와 관련된 소셜 네트워크를 분석하여 범죄자 집단에 대한 감시 시스템 마련6. ■ 다양한 데이터

국가공간정보체계 구축 범용통계조사시스쳄 구축 디지털행정협업체계 구축 외교정보통합관리체계 구축 온라인 국민소통시스템 구축 차세대 전자인사관리

입문편 학습을 통해 데이터 분석을 거시적인 관점에서 이해하고, 데이터 분석의 대상이 되는 데이터와 분석의 필요성, 그리고 분석 의

관리시스템 • 의사결정을 위한 기본 데이터로 기업의 재무데이터, 회계데이터, 매출/마케팅 데이터, 생산, 인적자원 데이터 등 모든 기업

최상의 데이터 센터 구축을 위한 데이터 인프라 혁신 전략..

• 분석 이미지 데이터 저장 효율 제고를 위한

이 연구에서는 농업부문 데이터 경제 체계 구축 활성화를 위해 농업부문 데이 터의 전주기 활용 체계를 구축하기 위한 데이터 활용 현황과 문제점을 진단하고,

공공 데이터 개방(정부3.0)과 행정업무 능률 향상을