• 검색 결과가 없습니다.

시차연관규칙 기법을 적용한 만성폐쇄성폐질환 환자의 동반질환 분석

N/A
N/A
Protected

Academic year: 2021

Share "시차연관규칙 기법을 적용한 만성폐쇄성폐질환 환자의 동반질환 분석"

Copied!
7
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

진료경향분석

1. 들어가며

만성폐쇄성폐질환(Chronic Obstructive Pulmonary Disease, COPD)은 비가역적인 기류제한 을 특징으로 하는 폐질환으로서 만성염증에 의한 기도와 폐실질의 손상으로 발생하는 호흡 기 질환이다(대한결핵 및 호흡기학회, 2014). 만성폐쇄성폐질환은 흡연, 공기 중 오염물질 등에 의해 이환되며 가장 직접적인 위험인 자는 흡연으로 알려져 있다. 질병관리본부에 따르면, 2016년 기준 40세 이상 남성의 만성 폐쇄성폐질환 유병률은 19.6%로 5명 중 1명에서 발생하였고, 여성 유병률 5.8%의 약 3배 수준에 달하고 있는 것으로 나타났다(질병관리본부, 2016). 만성폐쇄성폐질환 환자는 예후에 영향을 줄 수 있는 다른 질환을 동반하는 경우가 많으 며, 특히 심혈관질환, 골다공증, 우울증, 폐암 등이 대표적인 동반질환으로 알려져 있다(대 한결핵 및 호흡기학회, 2014). 이와 같은 질환은 만성폐쇄성폐질환으로 인해 발생하거나 만성 폐쇄성폐질환의 위험을 증가시키는 등 상호관계에 있으므로, 이를 연구할 필요성이 있다. 동반질환에 대한 전통적인 연구방법은 문헌고찰, 특정질환에 동반되는 질환의 빈도 또는 비율검정 등이 있으며, 최근에는 데이터마이닝 등 빅데이터 분석기법을 활용하여 질병 간 패 턴을 찾는 연구도 이루어지고 있다. 빅데이터 분석 기법 중 시차연관규칙기법(Sequence

Association Rules, SAR) 분석은 질병이 동시에 발생하는 규칙(지지도)과 특정 질병이 발생했

을 때 다른 질병에 이환되는 규칙(신뢰도)을 찾는데 가장 적합한 기법이라 사료되어 본 분석 에서는 질병 간 패턴을 찾기 위해 ‘시차연관규칙 분석’을 시도해 보고자 한다.

만성폐쇄성폐질환 환자의

동반질환 분석

김상현 주임연구원‌ 건강보험심사평가원 빅데이터부

(2)

정책동향 2018년 12권 1호 시차연관규칙 분석이란 최근 유행하고 있는 기계학습(machine learning)방법 중 하나인 비지도학습(unsupervised learning)에 속하는 것으로, 종속변수가 존재하지 않은 상태에서 데이터 안에 숨겨진 패턴을 찾아 분석하여 어떤 관계(relationships)를 도출해내는 과정이다. 시차연관규칙 분석은 현재 다양한 산업분야에서 직관력을 높이기 위한 분석방법으로 활용 되고 있으며, 특히 마케팅 분야에서 가장 활발하게 응용된다. 월마트의 ‘맥주와 기저귀의 관계’를 탐색한 결과가 가장 대표적인 사례로 알려져 있다. 보건의료분야에 연관규칙 분석을 접목한 분석 사례로는 뇌경색증과 동반되는 질병으로 본태성 고혈압과 인슐린-비의존성 당뇨병과 동반되는 경우 지지도와 신뢰도가 높은 결과 를 보였으나 향상도는 의미가 없었으며(Lee et al., 2010), Tai와 Chiu의 연구에서는 산술적 으로 역학에서 동반질환은 연관규칙 분석의 신뢰도와 같은 의미를 갖는 관계이고, 주의력 결핍 과다행동장애(ADHD)는 호흡기 질환과 동반되는 경우에 신뢰도와 향상도가 높다는 결 과를 보였다(Tai and Chiu, 2009).

빅데이터를 통해 의미 있는 연관성을 보기 위한 연관규칙분석은 패턴을 분석하여 쉽게 원인과 결과를 규명할 수 있는 장점이 있고, 증상과 질환의 관계, 정도가 같은 환자에서의 부당의료서비스 탐지 등 보건의료분야에 다양하게 접목할 수 있다. 본 간행물에서는 데이터마이닝 기법 중 시차연관규칙 분석을 요양급여비용 청구자료에 적용하여 만성폐쇄성폐질환에 관련된 질환을 탐색하고자 하며, 기존 문헌 등에서 보고되고 있는 만성폐쇄성폐질환과 동반되는 질환에 대해 타당성이 있는지 비교검증을 하고자 한다.

2. 자료수집 및 분석방법

1) 자료수집 자료는 건강보험심사평가원의 2010년에서 2016년 요양급여비용 청구자료를 활용하여 분석하였다.

만성폐쇄성폐질환은 Lee(2017)의 연구에서 사용된 기준을 사용하였다(Jongmin Lee 등,

2017). 2013년도에 전국의 한방을 제외한 의료기관에서 청구된 요양급여비용 청구자료 중 에 J43.x(단, J430은 제외), J44.x를 진단받은 40세 이상의 수진자를 선정하였으며, 이전 3 년간에 만성폐쇄성폐질환 진단명을 받은 수진자는 제외하였다. 선정된 수진자에서 최초 진 단을 받은 요양 개시일을 기준으로 1년 이내에 해당 약제1)를 두 번 이상 처방받은 수진자 로 최종 선별하여 이들의 3년간의 질병코드를 수집하였다. 1) 처방약제: 지속성 베타 2 항진제, 속효성 베타 2 항진제, 지속성 항콜린제, 속효성 항콜린제, 흡입스테로이드, 경구용 코르티코스테로이드, 테오필린, PDE-4 억제제

(3)

진료경향분석 2) 분석방법 자료의 분석에는 데이터마이닝 기법중의 하나로 동시에 발생하는 일련의 사건들 간의 규칙을 탐색하는 연관성분석을 시행하였으며, 순서적으로 연관성을 파악하기 위해 시차연 관규칙 기법을 사용하였다. 사건들 간에 규칙을 찾기 위한 목표가 정해지지 않아 `*`( -1)의 경우의 수로 패턴을 탐 색해 나가고, 이에 따라 사건들이 많아질수록 분석과정은 기하급수적으로 증가하게 된다. 요양급여비용 청구자료는 전 국민의 진료정보가 수집되고 있고 방대한 양을 보유하고 있어서 통계프로그램을 활용하여 데이터를 전 처리하거나 분석하는 데는 어려움이 있다. 모든 경우의 수를 고려하기 위해 전처리 과정은 RDBMS에서 수행하였고, 연관성분석 은 사건들 간의 우연성을 줄이고자 지지도, 신뢰도 및 향상도를 산출하여 연관성을 결정하 였다.

Support (if A then B) : P(A ∩B)

지지도(support)는 전체 일련의 사건들 중에서 사건 A와 사건 B가 동시에 발생하는 확률

을 말한다.

Confidence (if A then B) : P(A ∩B) P(A)

신뢰도(confidence)는 조건절 A가 발생했을 때 A와 B가 동시에 발생하는 조건부 확률을

말하며, 높은 신뢰도는 해당 규칙에서 A가 주어졌을 때 B의 반응 확률이 높음을 의미한다. 즉 지지도와 신뢰도는 동시에 두 사건이 높은 빈도로 발생하는 정도로 연관성을 탐색한다.

Lift (if A then B) : P(A ∩B) P(A) • P(B)

(4)

정책동향 2018년 12권 1호

향상도(lift)는 두 사건이 독립인 경우와 비교하고, 조건절 A가 발생했을 때, 우연적으로

B가 발생한 경우에 대비하여 규칙에 적용되어진 B 사건이 발생했을 때의 비율이다. 이 비 율은 A와 B의 연관성이 우연인지를 판단하는 지표로 사용된다. 향상도가 1인 경우 두 사건 은 서로 독립이며, 1 이상은 정(+)의 관계, 미만은 부(-)의 관계를 의미한다.

본 연구는 Sybase RDBMS와 Shell Script를 통해 가공하였으며, SAS Enterprise Miner Client 13.2를 이용하여 분석하였다.

3. 분석결과

1) 만성폐쇄성폐질환(COPD) 기초분석 만성폐쇄성폐질환 환자는 (그림1)과 같은 방법으로 선별하였다. 2013년 요양급여비용 청구자료 중에 J43.x(단, J430은 제외), J44.x를 진단받은 40세 이상의 수진자는 498,283명 으로 나타났다. 이전 3년간에 만성폐쇄성폐질환 진단명을 받은 수진자는 276,766명 이었 으며, 분석대상자에서 제외시켰다. 선정된 수진자에서 최초 진단일자 기준으로 1년 이내에 약제를 두 번 이상 처방받은 대상자는 192,345명으로 최종 선별하였다. 그림 1. 만성폐쇄성폐질환(COPD) 연구대상자 선정 2013년에 최초로 만성폐쇄성폐질환을 진단받고 1년 이내에 관련 약제를 처방받은 환 자의 인구학적 특성은 (표 1)과 같이 만성폐쇄성폐질환 환자는 192,345명으로 나타났으 며, 남성이 57%로 여성보다 이환된 비중이 높고, 60~70대에서 가장 높은 비중을 보이고 있다. 2013년 만성폐쇄성폐질환 환자(n = 498,283) ・만40세 이상 ・J43.x, J44.x (단, J430은 제외) 2013년 최초 진단받은 대상자(n = 221,517) 1년 이내 해당약제 처방 받은 대상자 (n = 192,345) 제외대상자(n = 276,766) ・이전 3년간 J43.x, J44.x 대상자 제외대상자(n = 29,172) ・해당 약제를 2회 미만 처방받은 자

(5)

진료경향분석 성 별 남 109,229 57 여 83,116 43 연령대 40대 17,087 9 50대 38,319 20 60대 51,949 27 70대 59,466 31 80대 이상 25,524 13 2) 시차를 고려한 연관규칙 분석결과 요양급여비용 청구자료는 요양기관이 의료서비스를 행하고 발생한 비용 중에서 급여가 되는 비용을 지급받기 위해 청구한 명세서가 수집된 자료이다. 이로 인해, 분석을 위한 개 별단위의 데이터셋을 구축할 시 동일 수진자가 동일 질환으로 의료이용을 하는 경우에는 중복이 발생하게 된다. 연관성분석은 동시에 발생하는 빈도를 분석하여 연관규칙을 탐색하는 기법으로 동일 수진자에서 중복되는 진단코드는 배제되어야 한다. 만성폐쇄성폐질환 환자의 관련 질환을 밝히기 위한 연관규칙결과는 (표 2)와 같으며, 본 간행물에서의 가설을 실증하기 위해 충분조건은 만성폐쇄성폐질환 진단코드로 규칙을 설 정하였다. 지지도, 신뢰도, 향상도 순으로 상위 10개의 규칙을 고려하였다. 표 2. 시차연관규칙 분석결과 순위 지지도 신뢰도 향상도 규 칙 1 10.15% 20.32% 1.0009 COPD ⇒ 치은염 및 치주질환(K05) 2 8.19% 16.39% 1.0340 COPD ⇒ 위식도역류병(K21) 3 7.94% 15.91% 1.0340 COPD ⇒ 위염 및 십이지장염(K29) 4 7.79% 15.59% 0.9735 COPD ⇒ 급성기관지염(J20) 5 7.66% 15.34% 1.0154 COPD ⇒ 앨러지성 접촉피부염(L23) 6 7.57% 15.15% 1.0802 COPD ⇒ 치아 및 지지구조의 기타 장애(K08) 7 7.52% 15.06% 1.0137 COPD ⇒ 치수 및 근단주위조직의 질환(K04) 8 7.37% 14.75% 1.0324 COPD ⇒ 혈관운동성 및 알레르기성 비염(J30) 9 7.21% 14.44% 1.0465 COPD ⇒ 급성인지 만성인지 명시되지 않은 기관지염(J40) 10 7.01% 14.04% 1.0402 COPD ⇒ 상세불명 병원체의 폐렴(J18)

(6)

정책동향 2018년 12권 1호 첫 번째 규칙을 보면, “COPD ⇒ 치은염 및 치주질환(K05)”은 지지도가 10.15%, 신뢰 도 20.32%를 보이며, 향상도는 1.0009로 나타났다. 전체 만성폐쇄성폐질환 환자로 구성된 자료 중에서 만성폐쇄성폐질환 진단코드 다음에 치주질환이 발생한 비율은 10.15%이며, 만성폐쇄성폐질환 진단코드와 치주질환이 동시에 나타나는 비율은 20.32%이다. 향상도는 1.0009로 보임에 따라 두 질환은 서로 정(+)의 관 계를 보인다. 만성폐쇄성폐질환은 가장 직접적인 위험요인은 흡연으로 알려져 있으며, 장기간의 흡 연으로 인해 치주질환을 동반하는 것으로 판단되며, 상위 10순위 내에 보이는 구강관련 질 환을 통합하여 보았을 때 더 깊은 관계를 보일 것이라 사료된다. 이는 만성폐쇄성폐질환 환자가 치주질환에 이환될 가능성이 정상인보다 약 1.7배가 높 다는 연구결과와 부합하는 결과를 보여(Chung et al., 2016), 본 규칙은 타당성이 있는 근거 로 뒷받침할 수 있다. 다음으로는 “COPD ⇒ 위식도역류병(K21)” 규칙으로 탐색되었으며, 지지도 8.19%, 신 뢰도 16.39%, 향상도는 1.0340로 나타났다. 또한, “COPD ⇒ 위염 및 십이지장염(K29)” 은 지지도 7.94%, 신뢰도 15.91%, 향상도는 1.0340를 보였다. 위식도역류병과 위염 및 십이지장염은 만성폐쇄성폐질환 진단코드 이후 발생할 비율은 각각 8.19%, 7.94%이며, 동시에 발생하는 비율은 각각 16.39%, 15.91%이다. 향상도는 두 질환 모두 1.0340을 보임에 따라 서로 정(+)의 관계를 보인다. 위 결과는 대한결핵 및 호흡기학회의 COPD 관리지침(대한결핵 및 호흡기학회, 2014)에 따 라 만성폐쇄성폐질환 환자에게서 위식도역류병은 흔하고 급성악화와 위험을 높이는 요인 중 하나로 지적하는 것과 부합한다. 급성기관지염은 향상도가 1미만임에 따라 우연적인 기회로 탐색된 결과보다 우수하지 못하다는 결과가 나타났다. 그 밖에도 알레르기성 접촉피부염, 혈관운동성 및 알레르기성 비염 등의 질환이 양(+) 의 관계를 보이며, 만성폐쇄성폐질환과 연관성을 보이는 질환으로 나타났다.

4. 나가며

본 연구에서는 건강보험심사평가원의 요양급여비용 청구자료를 활용하여 순서를 고려 한 관련 질환을 탐색하기 위해 데이터마이닝 기법을 시행하였다. 만성폐쇄성폐질환은 전 세계적으로 유병률이 증가하고 있는 추세이며, 2030년에는 만 성폐쇄성폐질환으로 인한 사망률이 7.8%에 달하고, 세계에서 사망원인으로 4위에 해당할 것으로 전망되고 있다(Colin and Dejan, 2006). 2016년 통계청 사망원인 통계에 의하면, 우

(7)

진료경향분석 병의 특성상 중증으로 발전할 때까지 자각증상이 나타나지 않아 낮은 진단율과 인지율을 보이고 있다(대한결핵 및 호흡기학회, 2014). 분석결과와 같이 만성폐쇄성폐질환 환자는 남성 의 경우와 고령일수록 증가하고 있음을 보이고 있다. 또한, 만성폐쇄성폐질환 환자의 건강상태와 예후에 악영향을 미치지 않도록 치주질환 과 위식도역류병과 같이 만성폐쇄성폐질환과 높은 연관성을 보이는 동반질환에 대해서 적 절한 관리가 필요하다. 본 연구에서는 대용량의 의료빅데이터를 활용하여 타 분야에서 주로 이용되는 시차연 관규칙인 데이터마이닝 기법을 사용하여 만성폐쇄성폐질환 연관 질환을 탐색하였다. 이 분 석방법은 부당탐지, 증상과 질병과의 관계, 약복용 순응에 의한 치료결과 등 향후 보건의 료분야에서 다양한 주제에 적용할 수 있을 것이다. 참고문헌 대한결핵 및 호흡기학회. COPD 진료지침 2014. 서울 : 대한결핵 및 호흡기학회; 2014. 질병관리본부. 2016 건강행태 및 만성질환 통계. 청주: 질병관리본부; 2017. 통계청. 2016 사망원인통계. 대전: 통계청; 2017.

Colin D. Mathers, Dejan Loncar. Projections of Global Mortality and Burden of Disease from 2002 to 2030. PLOS MEDICINE. 2006;3(11):2011-2030.

In-Hee Lee, A-Mi Shin, Chang-Sik Son, Hee-Joon Park, Joong-Hwi Kim, Sang-Young Park et al. Association Analysis of Comorbidity of Cerebral Infarction Using Data Mining. The Journal Korean Society of Physical Therapy. 2010;22(1):75-81.

Jae Ho Chung, Hee Jin Hwang, Sun Hyun Kim, Tae Ho Kim. Associations Between Periodontitis and Chronic Obstructive Pulmonary Disease: The 2010 to 2012 Korean National Health and Nutrition Examination Survey. Journal of Periodontology. 2016;87(8):864-871.

Jongmin Lee, Jae Ha Lee, Jee Ae Kim, Chin Kook Rhee. Trend of cost and utilization of COPD medication. International Journal of COPD. 2017;12:27-33.

Yueh-Ming Tai, Hung-Wen Chiu. Comorbidity study of ADHD: Applying association rule mining (ARM) to National Health Insurance Database of Taiwan. international journal of medical informatics. 2009;78(12):75-83.

참조

관련 문서

- 분산 환경에서 자원에 대한 정보와 자원 사이의 관계-의미 정보를 기계가 온톨로지 형태로 표현하고 처리할 수 있는...

내부적으로 자사의 강점과 약점을, 외부적으로 시장의 기회와 위협요인을 분석하여 보기 쉽게 도표화한 SWOT Matrix를 바탕으로 시장의 경쟁에서 이기기 위한

● 중소기업이 ①「중소기업기본법」의 규정에 따른 중소기업 외의 기업과 합병하는 경우 ②유예 기간 중에 있는 기업과 합병 ③독립성기준의 요건을 충족하지 못하게

[r]

[r]

다양한 수치를 적용한 로버를 구동해 보고, 팀원간의 논의 를 통해 결과를 도출한다.. 수정 결과는 팀원간의 논의를

본 연구를 통해 검은 물잠자리의 날개가 가지는 방수 의 특성을 알아내고 잔류로 남아 있는 물방울을 쉽게 털어 낼 수 있는 구조를

산성비와 미세먼지의 원인과 결과를 알아보고 그것을 해결하기 위한 과정을 학생들 은 탐구해 볼 것이다.. 이 과정은 요즘 미래교육의 초점이