• 검색 결과가 없습니다.

저작자표시

N/A
N/A
Protected

Academic year: 2022

Share "저작자표시"

Copied!
88
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

저작자표시-비영리-변경금지 2.0 대한민국 이용자는 아래의 조건을 따르는 경우에 한하여 자유롭게

l 이 저작물을 복제, 배포, 전송, 전시, 공연 및 방송할 수 있습니다. 다음과 같은 조건을 따라야 합니다:

l 귀하는, 이 저작물의 재이용이나 배포의 경우, 이 저작물에 적용된 이용허락조건 을 명확하게 나타내어야 합니다.

l 저작권자로부터 별도의 허가를 받으면 이러한 조건들은 적용되지 않습니다.

저작권법에 따른 이용자의 권리는 위의 내용에 의하여 영향을 받지 않습니다. 이것은 이용허락규약(Legal Code)을 이해하기 쉽게 요약한 것입니다.

Disclaimer

저작자표시. 귀하는 원저작자를 표시하여야 합니다.

비영리. 귀하는 이 저작물을 영리 목적으로 이용할 수 없습니다.

변경금지. 귀하는 이 저작물을 개작, 변형 또는 가공할 수 없습니다.

(2)

이학 석사학위 논문

궤적 분석을 통한 치료 불응성 천식 환자의 탐색 및 예측 모델 개발

아 주 대 학 교 대 학 원

의 생 명 과 학 과

박 유 진

(3)

궤적 분석을 통한 치료 불응성 천식 환자의 탐색 및 예측 모델 개발

지도교수 박 래 웅

이 논문을 이학 석사학위 논문으로 제출함.

2021 년 2 월

아 주 대 학 교 대 학 원

의 생 명 과 학 과

박 유 진

(4)

박유진의 이학 석사학위 논문을 인준함.

심사위원장 박 래 웅 인

심사위원 박 범 희 인

심사위원 이 정 연 인

아 주 대 학 교 대 학 원

2021년 1월 7일

(5)

i

국문 요약

궤적 분석을 통한 치료 불응성 천식 환자의 탐색 및 예측 모델 개발

배경: 천식은 만성적인 질환이고 시간에 따라 유형이 변하는 가변적인 질환이기 때문에 최근 인구기반의 코호트를 통해 장기적인 폐 기능의 변화로 천식의 유형을 구분하고자 하는 시도가 있었다. 그러나 중증도를 제한하여 분석하지 않았으며, 장기적인 변화로 구분된 천식의 유형에 어떤 임상적 특성이 관여하는지 분석한 연구는 거의 없다.

목적: 본 연구는 높은 단계의 약물을 시작하는 12 세 이상의 천식 환자의 10 년간의 폐 기능의 변화에 따라 환자가 구별되는지 알아보고, 구별된 환자군을 조기에 예측할 수 있는 임상적 요인을 분석해 장기적인 폐 기능의 변화에 영향을 미치는 특성을 확인하고자 한다.

방법: 면역 질환 심층 연구를 위한 실제 임상 데이터인 ICARUS 데이터베이스가 이용되었다. 12 세 이상의 천식환자 중 GINA 가이드라인 4-5 단계의 높은 수준의 치료를 받는 환자들의 10 년간의 폐 기능 데이터가 분석에 이용됐다. 궤적 분석을 위해 사용한 잠재 계층 혼합 모델을 이용했으며, 예측 모델 개발을 위해 로지스틱 회귀모델이 사용됐다.

결과: 전체 414 명의 천식 환자가 분석에 포함되었고 이들은 10 년간의 폐 기능에 따라 항상 높은 폐기능을 유지하는 그룹(n =128), 중간 정도의 폐 기능을 유지하는 그룹 (n =213), 지속적으로 낮은 폐 기능을 유지하는 그룹(n =73)으로 구분됐다. 지속적으로 낮은 폐 기능을 갖는 그룹은 천식 악화의 빈도 또한 높게 유지되어 치료에 대한 불응성을

(6)

ii

보였다. 세 그룹 간에 차이가 있던 요인 다섯 가지로 항상 낮은 폐 기능 궤적 예측 모델을 로지스틱 회귀분석으로 만들었고, 높은 혈청 EDN (OR 5.28, 95% CI 1.62-18.78)과 높은 혈청 TIMP-1 (OR 7.04, 95%

CI 2.10-29.44)이 낮은 폐 기능 궤적을 유의하게 예측했다.

결론: 장기간 관찰된 폐 기능 궤적 분석으로 높은 강도의 약물에 장기적으로 불응하는 환자군을 확인했고, 두 가지의 서로 다른 기전과 연관된 바이오 마커가 장기적으로 불응하는 환자군을 유의하게 예측할 수 있었다. 본 연구의 이와 같은 발견은 추가적인 연구를 통해 강도 높은 천식 치료에도 치료에 불응하는 천식의 유형에 대한 이해 및 새로운 치료 타겟 개발에 도움이 될 수 있을 것이다.

Keywords: 천식; 폐기능; 잠재계층혼합모델; 로지스틱회귀모델

(7)

iii

차례

제1장 서론 ... 1 제1절 천식의 유병률(prevalence)과 질병 부담(disease burden) . 1 제2절 천식의 이질성(heterogeneity of asthma) ... 3 1. 천식의 이질성에 대한 탐구의 중요성 ... 3 2. 종단 코호트(longitudinal cohort)를 활용한 천식을 구분하고 자 한 이전 연구들 ... 4 제3절 본 연구의 목적 ... 6 제2장 이론적 배경 ... 7 제1절 잠재 계층 혼합 모델(LCMM, latent class mixed model) ... 7 1. 잠재 계층 혼합 모델의 정의 ... 7 2. 잠재 계층 혼합 모델의 구성 ... 9 3. 잠재 계층 혼합 모델의 적용을 위한 가정(assumption) ... 10 4. 잠재 계층 혼합 모델에서 가장 적합한 모형의 선정 방법 ... 11 제3장 연구 방법 ... 12 제1절 연구 자료 ... 12 1. ICARUS(Immune/Inflammatory Disease Common Data Model Augmentation for Research Union System) 데이터베이 스 ... 12

(8)

iv

2. 오몹 공통데이터모델 (OMOP CDM, Observational Medical

Outcome Partnership Common Data Model) ... 15

제2절 정의... 17

제3절 통계 분석 ... 19

1. 잠재 계층 혼합 분석 (LCMM, latent class mixed model) 19 2. 연간 천식 악화 빈도의 비교 분석 ... 20

3. 기저 특성 분석 (baseline characteristics)... 20

4. 예측 모델 개발 ... 21

제4장 실험 결과 ... 25

제1절 연구 대상자 ... 25

제2절 폐 기능 궤적으로 구분된 잠재 하위그룹의 확인 ... 28

1. 궤적의 형태와 잠재 하위그룹의 수 결정 ... 28

2. 잠재 하위그룹 별 장기적인 폐 기능 및 천식 악화 빈도 변화 확인 ... 31

제3절 기저 임상 특성의 비교 ... 35

1. 인구통계학적 특성의 비교 ... 35

2. 기저 염증 특성(inflammatory characteristics)의 비교 ... 37

3. 기저 동반질환(comorbidity)의 분포 비교 ... 40

4. 천식 약물 사용력의 비교 ... 42

(9)

v

5. 변수 간 상관관계 분석 ... 44

제4절 폐 기능 궤적 예측 모델 구축 결과 ... 46

1. 연속형 변수들의 이분화를 위한 컷오프 값 분석 결과 ... 46

2. 로지스틱 회귀분석 결과 ... 48

제5장 고찰 ... 51

제1절 본 연구의 요약 ... 51

제2절 궤적 연구로 확인한 천식의 이질성 ... 53

1. 본 연구로 확인한 중증 천식 환자의 이질성 ... 53

2. 궤적 연구를 통해 확인한 천식의 이질성의 과거 연구와의 비 교 ... 55

제3절 치료 불응성 중증 천식환자에 대한 조기 진단 및 예측 바이 오 마커 ... 57

1. 통계적 유의성을 갖는 다섯 가지 임상 특성에 대한 고찰 ... 57

2. 혈청 EDN과 혈중 eosinophil counts의 예측 마커로의 비교 ... 59

3. 독립적인 두 예측 마커인 혈청 EDN과 혈청 TIMP-1... 60

제4절 본 연구의 제한점과 강점 ... 61

제6장 결론 ... 62

참고문헌 ... 63

(10)

vi

부록 ... 69 Abstracts ... 74

(11)

vii

그림 차례

Figure 1 An example of identifying the heterogeneity in the trajectory and classifying latent subgroups with a latent class mixed model.

... 8 Figure 2 Characteristics of the ICARUS database visualized through Achilles ... 14 Figure 3 Entity-relationship diagram of ICARUS database complemented OMOP common data model ... 16 Figure 4 Example of ROC curve analysis and Youden index ... 22 Figure 5 Flowchart of study population ... 26 Figure 6 Three distinct longitudinal changes of FEV1(%) during a follow-up of up to 10 years after prescribing for GINA guideline step 4-5 medication ... 32 Figure 7 Three distinct longitudinal changes of FEV1(%) over age 20 to 80 years ... 33 Figure 8 Changes in annual counts of asthma exacerbation during a follow-up of up to 10 years ... 34 Figure 9 ROC curves for evaluating the performance of logistic regression model in predicting group 3 ... 50

(12)

viii

표 차례

Table 1 Demographic characteristics of study population ... 27

Table 2 Results of latent class mixed models ... 29

Table 3 Baseline clinical characteristics of subgroups ... 36

Table 4 Baseline laboratory profiles of subgroups... 38

Table 5 Baseline comorbidities of subgroups ... 41

Table 6 Baseline medication uses of subgroups ... 43

Table 7 Correlation analysis between clinical characteristics that differed significantly among or within subgroups ... 45

Table 8 Results of ROC analysis to find the optimal cutoff values for predicting group 3 ... 47

Table 9 Results of univariate and multivariate logistic regression for predicting the group 3 in baseline ... 49

(13)

ix

부록 차례

Supplementary Figure 1 Histogram of all FEV1 ... 69 Supplementary Figure 2 Observed individual FEV1 trajectories over follow-up after the start of GINA guideline step 4-5 asthma medication ... 70 Supplementary Figure 3 Observed individual FEV1 trajectories over age from 20 to 80 years ... 71 Supplementary Figure 4 Identifying the cutoff values of continuous variables in predicting group 3 using ROC analysis with Youden index ... 73

Supplementary Table 1 Longitudinal changes in FEV1 in the subgroups analyzed by the linear mixed effects model ... 72

(14)

1

제1장 서론

제1절 천식의 유병률(prevalence)과 질병 부담(disease burden)

천식은 전세계 3억명 이상이 앓고 있는 질환으로, 기도에 염증을 일으키 고 통로를 좁혀 호흡에 지장을 주는 만성 질환이다. 전 세계적으로 매년 40만명 이상이 천식으로 인해 사망하는 것으로 알려져 있다(Pawankar, 2014). 한국에서도 천식의 유병률은 증가하고 있는 추세에 있으며, 건 강보험심사평가원의 데이터 분석 결과 2002년 1.6%에서 2015년 2.2%

로 천식의 유병률이 증가하는 경향을 보였다. 유병률 뿐 아니라 천식으 로 인한 사망 또한 10만명 당 16.2에서 28.0으로 증가하고 있고, 천식 으로 인한 의료 비용 또한 지속적으로 늘어나고 있다. 이러한 국내의 천 식 환자의 사망 및 의료 비용의 증가는 중증 천식(severe asthma)의 증 가가 크게 영향을 미치고 있다고 밝혀졌다(E. Lee, Kim, Ye, Choi, &

Park, 2020).

중증 천식이란 적절한 치료를 받았음에도 불구하고 천식 악화가 지속되 는 등 증상이 조절되지 않는 천식을 의미한다. 천식에 대한 국제적인 가 이드라인인 Global Initiative for Asthma (GINA)에 따르면 중증 천식이 란 GINA 가이드라인의 치료 단계 중 4-5 단계에 있는 환자 중 약물에 대한 복약 순응도와 흡입기 사용 능력이 좋으나 증상이 잘 조절되지 않 는 천식의 유형으로 정의하고 있다(GINA, 2019). 이러한 중증 천식은 전체 천식의 5-10%로 비교적 작은 비율로 존재하지만, 반복되는 천식 악화, 병원 내원 및 약제 사용의 증가로 인해 전체 천식 환자에게서 발 생하는 경제적 부담의 절반 이상을 담당한다(Kian Fan Chung et al.,

(15)

2

2014; Nunes, Pereira, & Morais-Almeida, 2017). 따라서 중증 천식의 부담을 감소시키고자 하는 수요는 지속적으로 존재하며, 이와 같은 필요 성에 따라 중증 천식의 진단이나 치료에 대한 연구가 활발히 진행되고 있다. 여러 대규모 코호트 연구들을 통해 중증 천식에 대한 연구가 진행 이 되었으나 그럼에도 불구하고 많은 부분이 밝혀지지 않은 채 남아있어 중증 천식은 여전히 천식이라는 질환에 있어 미충족 의료 수요(unmet need)로 남아있다(Group, 2003; Lang, 2015; Moore et al., 2007).

(16)

3

제2절 천식의 이질성(heterogeneity of asthma)

1. 천식의 이질성에 대한 탐구의 중요성

과거에는 천식을 내인성과 외인성으로 이분화하여 분류했다. 그러나 천 식은 단순한 질환이기 보다 하나 이상의 병리기전이 복합적으로 작용하 는 복잡한 질환이며, 이러한 천식 내의 이질성(heterogeneity)을 고려 해야 적절한 치료가 가능하다(Carr & Bleecker, 2016; Lang, 2015). 이 처럼 천식은 하나의 임상증후군으로 다양한 표현형(phenotype)을 포함 하는 질환이며, 이와 같은 특성은 중증 천식에도 동일하게 작용한다. 적 절한 치료에도 증상이 조절되지 않는다는 정의 하에 구분된 중증 천식 환자들 안에도 다양한 임상양상을 보이며 이질적인 특성을 갖는다 (Bossley et al., 2012; Kian F Chung, 2012; Gibeon & Chung, 2012;

Wenzel, 2012). 최근에는 이러한 천식의 임상적 다양성과 질병 내에 존 재하는 이질성을 이해하고 실제 겉으로 드러나는 표현형적 특성과 질병 발생 원인과 같은 병태생리학적 측면을 모두 고려하여 천식을 분류하고 자 하는 시도가 있다. 천식의 이질성은 여러 병태생리학적 기전들의 복 합적인 작용이며 서로 다른 병인에 의한 것이기 때문에 기존의 치료제로 증상이 좋아지지 않는 중증 천식에 있어서는 그 안에 존재하는 이질성을 확인하고 그 병리 기전을 확인하는 것이 중요하다 볼 수 있다(Poon, Eidelman, Martin, Laprise, & Hamid, 2012).

(17)

4

2. 종단 코호트(longitudinal cohort)를 활용한 천식을 구분하고자 한 이전 연구들

천식의 이질성을 확인하고자 하는 연구는 대부분 단면적인(cross- sectional) 데이터를 활용한 가설기반(hypothesis-driven) 혹은 데이터 기반(data-driven)으로 시도되었다(Bourdin et al., 2014; Pranab Haldar et al., 2008; Moore et al., 2007; Moore et al., 2010). 그러나 단면적으로 구분된 천식의 임상표현형은 10년 이상 후에 그대로 유지되 지 않으며, 천식이라는 질환은 단시간에 치료가 가능한 질환이 아니다 (Boudier et al., 2013). 이에 따라 장기간 추적 관찰된 종단 코호트 (longitudinal cohort)로 천식을 구분하는 시도가 최근 증가하고 있다.

세 개의 인구 기반 출생 코호트를 이용한 후향적 코호트 연구에서는 소 아 천식 환자에서 장기간 관찰된 폐 기능의 변화로 천식을 구분하고자 했다. 그 결과 소아 천식을 폐 기능 궤적에 네 가지의 패턴이 잠재적으 로 존재함을 확인했고, 각각의 패턴을 따르는 하위 그룹들로 환자가 유 형화되었다. 또한 유년기에 노출되는 환경적 요인들이 소아 천식 환자로 하여금 어떤 폐 기능 궤적을 따르게 될 것인지에 영향을 줄 수 있음을 밝혔다(Belgrave et al., 2018). 이외에 COREA 코호트를 이용한 성인 천식 환자의 3년간의 폐 기능 또한 궤적 분석을 통해 4개의 서로 다른 궤적으로 구분됐고, 이렇게 구분된 궤적들에 따라 천식 악화로 인한 예 상치 못한 병원 방문 및 스테로이드 처방과 같은 임상적인 예후에 차이 가 있었다(Park et al., 2019). 따라서 천식이 장기적인 폐 기능의 변화 를 통해 유형화할 수 있으며 여러 임상적인 차이가 존재하는 것이 연구 들을 통해 밝혀졌다. 그러나 이전 연구들은 환자의 치료 및 진료에 대한 모든 실제 임상 기록이 아닌 인구기반 코호트를 대상으로 하였으며 하나

(18)

5

이상의 의료기관 데이터가 합쳐진 형태이기 때문에 장기적인 폐 기능의 궤적이 구분되는 근본적인 원인이 어디서 오는지를 추측할 수 있는 임상 적 바이오 마커 정보가 부족했다. 또한 단일 기관에서 일관된 의료진들 에 의해 치료된 환자들이 아니기 때문에 천식 치료에 대한 순응도를 연 구자가 판단할 수 없었다.

최근 아주대학교병원에서 전문가에 의해 관리 및 치료되고 있는 천식 환 자의 실제 임상 데이터 및 여러 임상 바이오 마커 데이터를 통합하여 ICARUS라는 데이터베이스를 구축하는 데 성공하였다. ICARUS 데이터 베이스를 이용해 중증 천식의 장기관찰 연구를 진행한 최근의 연구에서 는 적절하게 치료했음에도 악화가 반복되는 중증 천식 환자를 GINA가 이드라인에 따라 구분하는 데 성공했으며, 중증 천식 환자의 폐 기능이 중증이 아닌 환자들보다 10년동안 지속적으로 낮고 심지어 더 빠르게 감소하는 패턴임을 확인했다. 또한 여러 임상 마커들을 이용해 중증 천 식을 예측할 수 있는 예측 모델을 만들어 어떤 임상적 마커들이 중증 천 식과 연관성이 있는지 분석하고 중증 천식이 다른 천식 유형과 차별되는 유형의 천식임을 보였다. 그러나 여전히 중증 천식 환자는 천식 악화가 더 빈번히 발생하는 군과 비교적 적게 발생하는 군으로 구분됐고 폐 기 능과 같은 임상 특성에 유의한 차이가 존재했다(Y. Lee et al., 2020).

따라서 치료 저항성을 갖는 중증 천식환자에 대한 분류 및 근본적인 차 이를 분석하기 위하여는 이미 정해진 정의에 기반한 분류 이외에 종단 데이터기반(longitudinal data-driven)의 구분으로 환자를 유형화해야 할 필요가 있다. 또한 이와 같은 차이가 어디에서 기인되는지를 알아내 는 것은 장기적으로 치료에 불응하는 중증 천식의 비밀을 밝히고 난치성 환자들을 위한 새로운 치료제 개발과 같은 도움을 줄 수 있을 것이다.

(19)

6

제3절 본 연구의 목적

본 연구는 실제 임상 데이터와 여러 바이오 마커 및 폐 기능 데이터를 통합한 ICARUS 데이터베이스를 이용하여 천식의 중증도가 높은 환자들 가운데 장기적인 폐 기능의 궤적에 차이가 있는 환자군이 존재하는지 확 인하고자 한다. 또한 서로 다른 폐 기능 궤적이 어떤 임상 바이오 마커 들과 강하게 연관되는지 확인하고자 한다.

즉, 본 연구의 목적은 다음과 같다:

(1) 중증도가 높은 천식 환자를 장기적인 폐 기능 궤적에 따라 세분한다.

(2) 폐 기능 궤적에 따라 나뉜 하위그룹 간에 임상적인 차이점 이 존재하는지 확인한다.

(3) 폐 기능 궤적을 예측하는 모델을 만들고 유의한 인자를 통 해 궤적의 근본적인 차이점을 확인한다.

(20)

7

제2장 이론적 배경

제1절 잠재 계층 혼합 모델(LCMM, latent class mixed model)

1. 잠재 계층 혼합 모델의 정의

잠재 계층 혼합 모델은 종단 데이터에서 시간에 따라 관찰된 측정값의 궤적에 대한 분석을 통해 유사한 패턴을 갖는 하위그룹을 분류하도록 하 는 통계 기법으로 성장 혼합 모델(growth mixed model) 혹은 이질성 혼합 모델(heterogeneous mixed model)이라고 불리기도 한다. 이 모델 은 환자 개인의 변동성(individual variability)과 잠재적인 하위 계층 구 조를 모두 고려한 모델로 변화 궤적 안에 알려지지 않은 잠재된 하위그 룹이 존재하는지 확인할 수 있는 통계 방법이다(Muthén, 2002;

Proust-Lima & Jacqmin-Gadda, 2010). [Figure 1]은 시간에 따라 추 적 관찰된 측정값의 궤적 안에 존재하는 서로 다른 두 그룹을 잠재 계층 혼합 모델로 확인한 예시이다. 이와 같이 기본적으로 잠재 계층 혼합 모 델은 각각의 환자마다 시간에 따라 관찰된 관측 값의 궤적이 크기를 가 늠할 수 없는 잠재적인 n개의 하위 그룹에 속할 수 있다고 가정한다.

(21)

8

Figure 1 An example of identifying the heterogeneity in the trajectory and classifying latent subgroups with a latent class mixed model.

There may not be a certain pattern before classification, but after classification, the Y-axis value is divided into an increasing group and a decreasing group over time

(22)

9 2. 잠재 계층 혼합 모델의 구성

잠재 계층 혼합 모델은 환자 군을 잠재 하위그룹에 속하게 될 확률을 구 하기 위한 다항 로지스틱 회귀 모델(multinomial logistic regression model)과 하위그룹의 궤적을 추정하기 위한 선형 혼합 모델(linear mixed model)의 크게 두 하위 모델로 구성되어 있다(Proust-Lima &

Jacqmin-Gadda, 2010; Proust‐Lima, Letenneur, & Jacqmin‐Gadda, 2007).

가. 다항 로지스틱 회귀 모델을 통한 잠재 계층에 속할 확률 (probability of latent class membership)

다항 로지스틱 회귀 모델을 통해 N명의 환자가 있다고 했을 때 각각의 환자 i (i = 1, 2, …, N) 라고 하고, 잠재적인 하위그룹을 G개 서로 다른 하위그룹 중 하나인 g (g = 1,2, …, G) 해 보자. 잠재 계층에 포함이 된 다는 정의를 𝑐𝑖 라는 이항의 랜덤 변수를 통해 다음과 같이 표현할 수 있다: 𝑐𝑖 = 𝑔. 그 확률은 공변량 𝑋𝑐𝑖에 따라 다항 로지스틱 회귀 모델을 사용하여 다음과 같이 설명된다:

𝜋𝑖𝑔 = 𝑃(𝑐𝑖 = 𝑔|𝑋𝑐𝑖) = exp (ξ0𝑔 + 𝑋𝑐𝑖ξ1𝑔)

𝐺=1exp (ξ0𝑙+ 𝑋𝑐𝑖ξ1𝑙)

ξ0𝑔은 계층 g의 절편, ξ1𝑔은 time-independent인 공변량 𝑋𝑐𝑖와 연관된 계층 별 매개변수이다.

(23)

10

나. 선형 혼합 모델을 통한 궤적의 추정(class-specific trajectory) 연속 변수에 대하여 Y의 궤적들은 선형 혼합 모델로 잠재 하위그룹에 대해 조건부로 정의된다. 따라서 하위그룹 g에서 조건부로 모델이 환자 i에서 시점 j에 대해 정의된다.

𝑌𝑖𝑗|𝑐𝑖 =𝑔 = 𝑋2𝑖𝑗𝛽 + 𝑋3𝑖𝑗𝛾𝑔 + 𝑍𝑖𝑗𝑏𝑖 + 𝜖𝑖𝑗

𝑋2𝑖𝑗, 𝑋3𝑖𝑗 그리고 𝑍𝑖𝑗는 각각 공통된 고정 효과인 𝛽, 계층 별 고정 효과 인 𝛾𝑔그리고 환자 개인별 랜덤 효과인 𝑏𝑖|𝑐𝑖=𝑔와 연관된 공변량들이다.

3. 잠재 계층 혼합 모델의 적용을 위한 가정(assumption)

잠재 계층 혼합 모델은 선형 혼합 모델의 확장이기 때문에 기본적으로 선형 혼합 모델과 동일하게 가우시안 분포(Gaussian distribution)를 따 르는 연속형 측정 값에 대하여 적용 가능하다. 또한 하나 이상의 하위그 룹으로 나뉠 수 있을 적절한 환자 수를 확보해야 한다. 아직 적절한 환 자 수에 대한 뚜렷한 가이드라인은 존재하지 않으며, 모델 적용 후 하위 그룹이 적절하게 생성되는지를 통해 판단해야 할 수 있다.

(24)

11

4. 잠재 계층 혼합 모델에서 가장 적합한 모형의 선정 방법

혼합 모델에서 가장 적합한 모형을 선정할 때는 적합도와 해석 가능성을 종합적으로 고려해야 한다. 적합도 지수로 사용되는 값에는 정보지수, 엔트로피(entropy)등이 있으며, 정보지수에는 다음과 같이 세 가지가 있다: AIC(Akaike Information Criterion), BIC(Baysian Information Criterion), 그리고 SABIC(Sample-size Adjusted BIC).

AIC = −2 ln(𝐿) + 2𝑝 BIC = −2 ln(𝐿) + 𝑝[ln (𝑛)]

SABIC = −2 ln(𝐿) + 𝑝[𝑙𝑛 (𝑛 + 2 24 )]

Ln(L)은 log likelihood, p는 모수의 수, n은 표본의 크기를 의미하며 세 정보지수 모두 값이 작을수록 더 적합한 모형으로 판단한다. 일반적으로 가장 많이 사용되는 정보지수는 BIC이다. 엔트로피 값은 잠재 계층 혼 합 모델로 구분된 하위그룹의 분류 정확도를 나타내는 지표로 0에서 1 까지의 값을 갖는다. 1에 가까울수록 분류가 잘 된 모델이라고 판단하며, 0.8 이상이면 좋은 분류로 볼 수 있다. 일반적으로 잠재 계층 혼합 모델 에서 적합한 모형을 선정할 때는 이와 같은 적합도 지수 중 하나 내지는 두개 정도를 선택하여 확인한다. 가장 일반적으로 선택하는 적합도 지수 는 BIC값이다. 이외에 분류 목적에 따라 각 군에 포함될 대상자의 비율 등이 추가적으로 모델 선정의 기준이 될 수 있다(김지원, 양준영, 이청 아, & 홍세희, 2019).

(25)

12

제3장 연구 방법 제1절 연구 자료

1. ICARUS(Immune/Inflammatory Disease Common Data Model Augmentation for Research Union System) 데이터베 이스

ICARUS 데이터베이스는 면역 및 염증 질환에 대한 심층 연구를 위해

아주대학교병원 알레르기내과 내원 환자들의 전자의무기록(EMR,

electronic medical records)과 실험실 수준의 바이오 마커 및 이미지 형태의 폐 기능 검사(PFT, pulmonary function test) 데이터를 통합하 여 구축한 환자 중심의 실제 임상 통합 데이터베이스이다. 환자는 1994 년부터 2017년까지 아주대학교병원 알레르기내과에 내원한 환자들을 대 상으로 하며 해당 환자들 중 전향적으로 바이오 마커 데이터 수집에 동 의한 환자들 4,893명의 환자들이 등록되어 있다.

본 데이터베이스는 오몹 공통데이터모델 (OMOP CDM, Observational Medical Outcome Partnership Common Data Model) 버전 5.3.1의 아 주대학교병원 공통데이터모델을 기반으로 한다. 따라서 전자의무기록에 포함되지 않은 실험실 수준의 바이오 마커 데이터는 동일하게 용어와 구 조를 표준화하여 Measurement 테이블에 추가하였다. 또한 폐 기능 검 사 데이터의 경우 수치가 자동적으로 전자의무기록에 저장되지 않아 이 미지 형태로 남아있는 데이터를 광학 문자 인식(OCR, optical character recognition)을 통해 이미지에서 텍스트를 추출하고 자연어처리기법 (NLP, natural language processing)을 통해 필요한 폐 기능 정보를 정 리하여 정형화하였다. 정형화된 형태의 폐 기능 검사 데이터는 오몹 공

(26)

13

통데이터모델 버전 5.3.1로 용어와 구조를 표준화하여 Measurement에 테이블에 추가하였다. ICARUS 데이터베이스의 기본적인 인구통계학적 특성은 [Figure 2]와 같다.

(27)

14

Figure 2 Characteristics of the ICARUS database visualized through Achilles

(28)

15

2. 오몹 공통데이터모델 (OMOP CDM, Observational Medical Outcome Partnership Common Data Model)

공통데이터모델은 서로 다른 형태로 존재하는 의료기관의 의료 데이터를 용어와 구조를 표준화하기 위해 제안된 데이터모델이다. 이를 통해 동일 한 분석 코드를 각각의 의료기관에서 실행하고 그 결과만 통합함으로써 데이터의 이질성에서 오는 경제적 손실을 줄이고 실행 결과만 반출하여 개인정보를 포함한 의료정보의 열람 없이 다기관 분석을 가능하게 하는 분산형 공동 연구가 가능하도록 한다. 그 중 오몹 공통데이터모델은 오 딧세이(OHDSI, Observational Health Data Science and Informatics) 국제 컨소시움이 개발, 운영하는 공통데이터모델로, 용어와 구조를 모두 표준화할 수 있도록 한다(Hripcsak et al., 2015; Stang et al., 2010).

본 연구에서 사용한 ICARUS 데이터베이스는 오몹 공통데이터모델 버전 5.3.1로 표준화된 데이터베이스를 사용하였다. 따라서 본 연구는 오딧세 이에서 제공하는 ATLAS나 Achilles와 같은 분석 툴을 이용할 수 있다.

ICARUS 데이터베이스의 도메인 별 스키마 간 관계도는 [Figure 3]과 같다.

(29)

16

Figure 3 Entity-relationship diagram of ICARUS database complemented OMOP common data model

(30)

17

제2절 정의

본 연구에서는 중증도가 높은 천식 환자의 구분을 위해 2019 GINA 가 이드라인에서 제시한 천식 치료 가이드라인을 참고했다. GINA 가이드라 인 4-5단계의 약물을 시작하는 환자를 중증도가 높은 환자로 정의하였 으며, 2019 GINA 가이드라인에서 명시한 4-5단계에 해당하는 약물은 high dose- to medium dose-ICS/LABA였다. 해당 정의에 따라 중증도

가 높은 환자는 다음의 약물을 시작한 환자로 정의하였다:

salmeterol/fluticasone(50/500μg), salmeterol/fluticasone(50/250μ g), formoterol/fluticasone(10/250μg), formoterol/budesonide(9/320 μg), formoterol/budesonide(4.5/160μg).

천식 악화(AE, asthma exacerbation)는 이전 ICARUS 데이터베이스를 이용한 연구에서 사용한 정의와 동일하게 다음과 같이 정의한다: 전신 코르티코스테로이드의 처방 (1일 15mg이상의 경구 프레드니솔론 및 그 와 동등한 경구 스테로이드의 3일 연속된 처방 혹은 정맥주사 스테로이 드 1일 처방) 혹은 천식 증상의 악화로 인한 응급실 혹은 외래 방문(Y.

Lee et al., 2020).

동반 질환은 적어도 하나의 ICD-10 코드가 기저에 존재 할 경우로 정 의한다: 알레르기성 비염 및 만성 부비동염 (J00, J02, J30-33), 알레르 기성 결막염 (H10), 아토피성 피부염 (L20, L23, L25), 두드러기 및 혈 관부종 (D69, D84, L27, L29, L50, T78), 골다공증 (M80-82), 위식도 역류 질환 (GERD, gastroesophageal reflux disease) (K21), 허혈성 심장 질환 (I20-I25, I20,1 제외). 아토피는 “allergic” 혹은 “atopic”

을 포함하는 ICD-10 코드를 갖거나 0.35kU/L 이상의 일반적인 흡입 알레르겐에 대한 헐청 특이 IgE의 값을 갖는 경우로 정의한다. 고혈압은

(31)

18

ICD-10 코드 I10을 갖거나 수축기 혈압이 120mmHg 이상일 경우로 정의하고, 당뇨는 ICD-10 코드 E10-E14를 갖거나 당화혈색소가 6.5%

이상일 경우로 정의한다. 위의 정의는 이전의 ICARUS 데이터베이스를 활용한 연구에서 사용한 정의와 동일한 것을 사용한다(Y. Lee et al., 2020).

다음과 같은 정의는 오딧세이에서 제공하는 ATLAS 툴을 통해 코호트 (cohort)화 한다. ATLAS는 오몹 공통데이터모델로 변환된 데이터베이 스에서 분석하고자 하는 환자군(cohort)을 연구자가 정한 기준에 따라 정의할 수 있도록 하며 후향적 코호트 연구에 필요한 여러 분석 코드를 생성해 주는 분석 툴이다. ATLAS는 버전 2.7을 이용한다. 본 연구에서 분석에 사용한 정의들은 ATLAS를 통해 코딩 되어 깃헙(github)을 통 해 공개된다(https://github.com/ABMI/severeAsthmaLcmm.git).

(32)

19

제3절 통계 분석

1. 잠재 계층 혼합 분석 (LCMM, latent class mixed model) 연구 대상자들이 폐 기능 변화에 따라 구분될 수 있는지 확인하고 환자 군을 서로 다른 하위그룹으로 나누기 위해 잠재 계층 혼합 분석을 시행 한다. 본 연구에서 폐 기능을 평가하기 위해 사용한 값은 1초간 강제 호 기량(FEV1, forced expiratory volume in one second)이고 치료 시작 이후 10년간의 관찰기간의 데이터로 분석한다. 1차의 직선(linear) 형태 부터 4차 곡선(quartic) 형태의 궤적까지 모든 형태에 대하여 잠재 계층 혼합 분석을 시행하며, 하위그룹의 수도 2부터 5까지 분석을 반복적으로 시행한다. 최종적으로 선택된 모델에 의해 잠재 하위그룹이 존재함을 확 인했다면 구분된 하위그룹의 폐 기능 궤적의 추정은 선형 혼합 모형 (LMM, linear mixed model)을 이용해 수행한다. 폐 기능 궤적은 추적 기간에 대한 궤적과 연령에 따른 궤적을 모두 확인한다.

가장 최적의 잠재 하위그룹의 수와 궤적의 모형을 결정하기 위해 사용한 적합도 지수는 BIC(Bayesian information criterion)이다. 또한 임상적 으로 해석 가능하고 의미 있는 사이즈를 만족하기 위해 각각의 하위그룹 에 속하는 환자의 수가 전체 환자 수의 최소 5% 이상이 되도록 했다.

아울러 해석 가능성 및 이론적 연관성 등도 함께 고려해 통합적으로 가 장 적절한 그룹의 수와 궤적의 모형을 선택했다(Nylund, Asparouhov,

& Muthén, 2007).

(33)

20 2. 연간 천식 악화 빈도의 비교 분석

하위그룹 간에 천식 악화 빈도의 차이가 존재하는지 확인하기 위해 그룹 별로 연간 발생한 천식 악화의 평균과 95% 신뢰구간을 치료를 시작한 시점부터 10년간 관찰한다. 이를 통해 구분된 하위그룹 간 천식 증상이 어떻게 변화하는지 확인하고자 한다.

3. 기저 특성 분석 (baseline characteristics)

기저의 특성 분석은 잠재 계층 혼합 분석을 통해 하위그룹으로 구분된 환자군 간에 유의한 차이가 있는 변수들을 확인하기 위해 시행한다. 연 속형 변수들은 정규성 가정을 만족한 경우 그룹 간 차이를 확인하기 위 해 분산분석(ANOVA)을 시행하고 사후 검정으로 Tukey 검정을 시행한 다. 연속형 변수 중 정규성 가정을 만족하지 않은 경우 그룹 간 차이를 확인하기 위해 Kruskal Wallis 분석을 시행하고 사후 검정으로 Bonferroni-Dunn 검정을 시행한다. 정규성을 확인하기 위해서는 Shapiro-Wilk 검정을 시행한다. 범주형 변수들은 카이제곱검정을 통해 그룹 간 분포의 차이를 확인한다. 모든 연속형 변수는 평균과 표준 편차 로 표현하고 범주형 변수는 퍼센트로 표시한다. P 값이 0.05 보다 작을 경우 통계적으로 유의하다고 판단한다. 변수 간 상관관계를 평가하기 위 해 피어슨 상관 계수(Pearson Correlation Coefficient, PCC)를 계산한 다. PCC는 다음과 같이 판단한다: (1) 절대값이 0.9 이상일 경우 완벽한 상관성, (2) 0.7이상일 경우 강한(strong) 상관성, (3) 0.4 이상일 경우 중간(moderate) 상관성, (4) 0.1 이상일 경우 약한(weak) 상관성, 그리 고 (5) 0.1 보다 작을 경우 상관성이 없다.

(34)

21 4. 예측 모델 개발

가. ROC 곡선을 통한 연속형 변수의 컷오프 값 탐색

기저 특성 분석을 통해 사후 검정에서 그룹 내에 하나라도 통계적 유의 성이 확인된 기저 특성들에 대하여 좋지 않은 폐 기능의 궤적을 갖는 하 위 계층에 대하여 통계적으로 유의한 위험 요인을 확인하기 위해 로지스 틱 회귀분석을 시행한다. 연속형 변수의 경우 범주형 변수로 만들어 분 석에 사용한다. 연속형 변수를 범주형 변수로 만들기 위해 컷오프 값 (cut-off value)을 찾아야 한다. 각 연속형 변수의 적절한 컷오프 값을 찾기 위해 본 연구에서는 ROC 곡선을 분석한다. ROC 곡선은 x축이 1- 특이도(specificity), y축은 민감도(sensitivity)로 표현되는 곡선으로 민 감도와 특이도는 아래와 같이 정의된다.

민감도 (sensitivity) =모델이 옳게 양성으로 판단한 환자 수

실체 양성 환자 수 = TP

TP + FN

특이도 (specificity) =모델이 옳게 음성으로 판단한 환자 수

실체 음성 환자 수 = TN

TN + FT 가장 적절한 컷오프 값을 찾기 위해서 Youden index를 계산한다.

Youden index는 [Figure 4]에서의 예시에서 확인할 수 있는 것과 같이

‘민감도+특이도-1’이 최대가 되는 지점을 통해 ROC 곡선에서 해당 연 속형 변수의 가장 적절한 컷오프 값을 결정할 수 있도록 한다. Youden index는 ROC 곡선에서 컷오프 값을 찾는 가장 흔한 방법이다.

(35)

22

Figure 4 Example of ROC curve analysis and Youden index

(36)

23 나. 로지스틱 회귀분석

가장 좋지 않은 패턴을 보이는 폐 기능 궤적에 대한 예측 모델을 특성 분석에서 그룹 내 유의한 차이가 있었던 요인들로 구축한다. 이를 위해 로지스틱 회귀분석을 시행한다. 연속형 변수들의 경우 ROC 분석으로 구 한 컷오프 값을 기준으로 이분화하여 사용하고 범주형 변수의 경우 그 자체로 독립변수로 사용한다. 종속변수는 좋지 않은 폐 기능 궤적을 따 르는 잠재 하위그룹을 1로 하고 이외의 다른 모든 하위 계층들은 0으로 이분화해 분석에 사용한다. 단순 회귀 분석을 통해 각각의 독립변수의 오즈비(OR, odds ratio)를 계산하고 그 신뢰구간(CI, confidence interval)을 구했다. 다중회귀분석으로 첫 번째는 그룹 내 유의미한 차이 가 있었던 기저 특성들을 모두 포함한 모델을 1개 구축하여 Model 1이 라고 한다. 이를 통해 모든 변수가 모델에 포함되었을 때의 변수들의 오 즈비와 신뢰구간을 확인한다. 또한 Model 1에서 유의미한 오즈비를 가 졌던 독립변수들에 한하여 다시 한 번 다중회귀분석을 실시해 Model 2 를 구하고 각각의 독립변수의 오즈비와 신뢰구간을 확인한다. 본 분석을 통해 기저 요인들 중 가장 좋지 않은 예후를 보이는 폐 기능 궤적에 어 떤 요인이 통계적으로 유의하게 영향을 미치는지를 확인할 수 있다. 신 뢰구간은 95% 신뢰수준을 사용한다.

(37)

24 다. 평가 척도

로지스틱 회귀분석을 통해 구축된 예측 모델의 성능은 AUROC(area under the receiver operating characteristics curve)값으로 측정된다.

ROC곡선 아래 영역의 넓이 값으로 표현되며 1에 가까울수록 성능이 좋 은 모델이라고 볼 수 있다.

(38)

25

제4장 실험 결과 제1절 연구 대상자

전체 ICARUS 데이터베이스의 천식 환자 2,228명 중 1,750명의 환자 가 높은 강도의 천식 치료를 시작했음을 확인했다. 높은 강도의 천식 치 료를 시작한 환자들의 폐 기능 변화에 대한 궤적을 분석하기 위해 [Figure 5]에서 확인할 수 있는 포함 기준(inclusion criteria)과 제외 기준(exclusion criteria)에 따라 환자를 제외시키고 최종적으로 414명 의 환자들이 분석에 사용되었다. 환자들은 평균 5.82 ± 4.03년의 추적 관찰 기간을 가지며 관찰 시작 시점(index date)에서의 연령은 평균적으 로 42.25 ± 14.52년이었고 천식 시작 연령은 36.30 ± 14.04년이었 다. 여성의 비율은 58.5%이었다[Table 1]. 본 연구에서 사용한 연구 대 상자의 정의는 ATLAS를 통해 이루어졌다.

(39)

26 ICARUS Database

n=4,893

Asthmatics n=2,228

GINA guideline step 4-5 asthma medication users

n=1,750

Exclusion: n=1,336:

- Patients aged <12

- Patients who did not perform pulmonary function test within 180 days before index date

- Patients who did not perform pulmonary function test more than 2 times within 10 years after index date

GINA guideline step 4-5 asthma medication users

n=414

Figure 5 Flowchart of study population

(40)

27

Table 1 Demographic characteristics of study population

Variable Total

(n=414)

Age (years) 42.25 ± 14.52

Asthma onset age (years) 36.30 ± 14.04

Late onset asthma (%) 40.2

Follow-up duration (years) 5.82 ± 4.03

Female (%) 58.5

BMI (kg/m2) 24.06 ± 3.92

Baseline FEV1 (%) 87.39 ± 18.47 Baseline FEV1/FVC (%) 81.10 ± 10.63

Smoking history (n) 149

Current or ex-smoker (%) 62.4

BMI, body mass index; FEV1, forced expiratory volume in one second;

FVC, forced vital capacity. ‡ Late onset asthma: age first diagnosed asthma is more than 40.

(41)

28

제2절 폐 기능 궤적으로 구분된 잠재 하위그룹의 확인

1. 궤적의 형태와 잠재 하위그룹의 수 결정

[Figure E1]와 같이 연속형의 가우시안 분포를 따르는 1초간 강제 호기 량 값의 추적 관찰기간 동안의 궤적에 따라 연구 대상자들 간에 이질성 이 존재하는지 확인하고, 하위 그룹으로 나누기 위해 잠재 계층 혼합 모 델을 시행했다. 직선형부터 4차 곡선까지 네 개의 궤적 모양과 2부터 5 까지의 하위그룹 수에 따라 16개의 잠재 계층 혼합 모델을 구축했다. 각 하위그룹마다 전체 연구 대상자의 최소 5%가 속하도록 하면서 BIC 값 이 가장 작은 모델은 직선 형태의 궤적과 3개의 하위 계층으로 나뉜 모 델이었다. 따라서 선택 기준에 따라 가장 적절한 모델이었던 궤적의 형 태는 직선이고, 잠재 계층의 수가 3인 잠재 계층 혼합 모델이 최종적인 모델로 선택되어 분석에 이용되었다[Table 2].

(42)

29 Table 2 Results of latent class mixed models

Shape of trajectory

# of

classes BIC Class 1 (%)

Class 2 (%)

Class 3 (%)

Class 4 (%)

Class 5 (%)

Linear

2 30317.47 98.06 1.94

3 30334.30 51.45 30.92 17.63

4 30348.46 44.17 36.65 16.75 2.43

5 30366.46 36.65 29.61 16.99 13.35 3.40

Quadratic

2 30302.73 98.06 1.94

3 30317.75 67.96 30.34 1.70

4 30319.83 77.18 18.20 2.91 1.70

5 30347.55 88.83 5.34 3.16 1.70 3.16

Cubic

2 30262.76 97.82 2.18

3 30287.22 97.58 1.21 1.21

4 30308.93 45.15 38.83 14.08 1.94

5 30330.29 56.55 25.00 15.78 2.18 0.49 Quartic 2 30242.56 97.82 2.18

(43)

30

3 30241.72 95.87 2.43 1.70

4 30268.71 85.44 9.95 2.67 1.94

5 30304.33 86.17 9.47 2.43 1.46 0.49

BIC; Bayesian information criterion

(44)

31

2. 잠재 하위그룹 별 장기적인 폐 기능 및 천식 악화 빈도 변화 확 인

GINA 가이드라인 4-5단계의 천식 약물 처방 이후 10년간 관찰한 1초 간 강제 호기량으로 세분화된 궤적은 3 개의 서로 다른 잠재 하위그룹 으로 나뉘었다; (1) 지속적으로 100 이상의 높은 값을 유지하는 군 (group 1, n=128, 30.9%), (2) 80 이상의 준수한 폐 기능을 유지하나 100으로 완전하게 회복하지는 못하는 중등도의 폐 기능을 유지하는 군 (group 2, n=213, 51.4%), (3) 70 전후의 낮은 폐 기능이 10년간 유지 되는 군 (group 3, n=73, 17.6%). 구분된 세 군 모두 높은 농도의 약물 치료를 시작한 이래로 폐 기능의 궤적이 일정하게 유지되는 패턴을 보였 다[Figure 6]. 그러나 장기적으로 낮은 폐 기능 궤적을 보이는 group 3 는 연령의 증가에 따라서 폐 기능 궤적을 확인했을 때, 다른 두 그룹이 폐 기능을 일정하게 유지하는 것에 비해 급격하게 감소하는 패턴을 보였 다[Figure 7; Table E1]. 연간 천식 악화의 빈도는 높은 농도의 약물 치 료 시작 이후로 7년간 group 3가 다른 두 그룹에 비하여 통계적으로 빈 번하게 유지된다. 반면 group 1와 group 2는 서로 다른 폐 기능 궤적으 로 구분되지만 천식 악화에 대하여는 통계적으로 차이가 없었다[Figure 8].

(45)

32

Group 3 (n=73) Group 1 (n=128) Group 2 (n=213)

Figure 6 Three distinct longitudinal changes of FEV1(%) during a follow- up of up to 10 years after prescribing for GINA guideline step 4-5 medication

Shaded area presenting 95% confidence intervals.

(46)

33

Group 3 (n=73) Group 1 (n=128) Group 2 (n=213)

Figure 7 Three distinct longitudinal changes of FEV1(%) over age 20 to 80 years

Shaded area presenting 95% confidence intervals.

(47)

34

Figure 8 Changes in annual counts of asthma exacerbation during a follow-up of up to 10 years

Group 1 (open circle), group 2(open triangle) and group 3 (closed circle).

Bar indicate 95% confidence intervals.

Annual coun ts o f as thm a ex ac erbat ion

(48)

35

제3절 기저 임상 특성의 비교

1. 인구통계학적 특성의 비교

[Table 3]에서는 1초간 강제 호기량의 궤적에 따라 나뉜 잠재 하위그룹 의 인구통계학적 특성을 요약하고 있다. Group 1은 항상 높은 폐 기능 궤적을 유지하는 군, group 2는 중간정도의 폐 기능을 유지하는 군 그리 고 group 3는 가장 낮은 폐 기능 궤적을 갖는 군이었다. GINA 가이드라 인 4-5단계의 천식 약물을 시작한 시점에 group 1에 속하는 환자들의 평균 연령은 39.74 ± 14.66년, group 2에 포함된 환자는 42.01 ± 14.28년, group 3에서는 47.32 ± 13.87년으로 group 3가 가장 연령이 높았으며, 하위그룹 간 통계적으로 유의하게 차이가 있었다(P = 0.002).

그러나 천식 시작 연령은 그룹 간에 통계적으로 차이가 없었다(P = 0.679). 폐 기능은 FEV1과 FEV1/FVC 모두 기저에서 그룹 간 통계적 으로 유의하게 차이가 있었다(모두 P <0.001). 관찰기간 및 여성의 분 포, 체질량 지수와 흡연력은 세 하위그룹 간 통계적으로 유의한 차이가 없었다.

(49)

36 Table 3 Baseline clinical characteristics of subgroups

Variable Group 1

(n=128)

Group 2 (n=213)

Group 3

(n=73) P value Age (years) 39.74 ± 14.66 42.01 ± 14.28 47.32 ± 13.87 0.002b,c Asthma onset age (years) 34.48 ± 12.18 37.28 ± 14.03 36.92 ± 18.05 0.679 Follow-up duration (years) 5.88 ± 3.61 5.84 ± 4.10 5.66 ± 4.57 0.586

Female (%) 60.16 59.62 52.05 0.424

BMI (kg/m2) 23.92 ± 3.34 24.01 ± 3.26 24.11 ± 5.51 0.478 Baseline FEV1 (%) 101.80 ± 12.72 79.10 ± 14.43 55.50 ± 20.22 <0.001a,b,c Baseline FEV1/FVC (%) 85.17 ± 8.81 79.39 ± 10.89 69.19 ± 13.15 <0.001a,b,c

Smoking history (n) 47 76 26

Current or ex-smoker (%) 55.32 64.47 69.23 0.434

P values achieved significance were denoted as a:significance between the group3 and group2; b:significance between the group2 and group1; c: significance between the group1 and group3.

BMI, body mass index; FEV1, forced expiratory volume in one second; FVC, forced vital capacity.

(50)

37

2. 기저 염증 특성(inflammatory characteristics)의 비교

혈액과 혈청 및 객담의 염증 지표의 수치를 그룹간 비교했을 때 결과는 [Table 4]와 같다. 혈중 eosinophil counts와 neutrophil counts의 경우 그룹 간 통계적으로 유의한 차이가 있다(각각 P = 0.037과 P = 0.004).

두 수치 모두 group 3에서 가장 높았고(각각 590.31 ± 716.89/μL과 5,036.31 ± 2,519.23/μL), 그 다음으로 group 2 (각각 445.56 ± 418.54/μL과 4,370.40 ± 2,257.86/μL), 마지막으로 group 1이 가장 낮은 값을 가졌다(각 각 376.21 ± 461.99/μL과 4,111.34 ± 1,833.85/μL). 특히 혈중 neutrophil counts의 경우 사후검정에서 group 3가 group 2와 group 1보다 높은 값을 갖고 있었고, eosinophil counts의 경우 group 3와 group 1이 통계 적으로 유의한 차이를 보였다. 그러나 객담의 eosinophils와 neutrophils의 경우 통계적으로 유의한 차이를 보이지 않았다. 혈청의 EDN(eosinophil-derived neurotoxin)의 경우 그룹 간 통계적으로 유 의한 차이를 보였으며(P <0.001), group 3는 84.42 ± 38.54ng/mL로 다른 두 그룹들과 비교해 통계적으로 유의하게 높은 값을 갖고 있었다.

Group 2는 group 1보다 높은 혈청 EDN값을 가졌으나 두 그룹 간의 차 이는 통계적으로 유의하지는 않았다. 혈청 TIMP-1(tissue inhibitor of metalloproteinase 1) 또한 group 3에서 200.10 ± 89.82ng/mL로 가 장 높은 값을 가지고, group 2는 159.30 ± 84.63ng/mL가 두번째로 높 았고, group 1이 148.33 ± 74.32ng/mL로 가장 낮았다. 특히 group 3 와 group 1은 그룹 간에 통계적으로 유의하게 차이가 있음을 확인했다.

(51)

38 Table 4 Baseline laboratory profiles of subgroups

Variable Group 1

(n=128)

Group 2 (n=213)

Group 3

(n=73) P value Total IgE (KU/L) 417.15 ± 665.32 342.21 ± 460.96 496.73 ± 605.76 0.677 Blood eosinophil counts (/μL) 376.21 ± 461.99 445.56 ± 418.54 590.31 ± 716.89 0.037c Blood neutrophil count (/μL) 4,111.34 ± 1,833.85 4,370.40 ± 2,257.86 5,036.31 ± 2,519.23 0.004b,c Sputum eosinophils (%) 47.39 ± 36.40 48.22 ± 33.87 49.28 ± 35.80 0.986 Sputum neutrophil (%) 56.67 ± 33.15 55.82 ± 32.39 52.41 ± 33.89 0.840 Blood basophils (%) 0.62 ± 0.39 0.60 ± 0.34 0.56 ± 0.31 0.481 Platelet count (103/μL) 262.90 ± 62.39 256.84 ± 56.58 266.79 ± 53.47 0.412 Serum EDN (ng/mL) 48.91 ± 31.06 62.98 ± 38.53 84.42 ± 38.54 <0.001b,c Serum periostin (ng/mL) 74.83 ± 35.85 79.37 ± 44.62 78.90 ± 38.92 0.789 Serum eotaxin-2 (pg/mL) 1,088.47 ± 605.25 1,139.19 ± 961.54 1,376.37 ± 776.28 0.155 Serum myeloperoxidase (ng/mL) 203.65 ± 139.60 241.17 ± 240.73 269.73 ± 289.37 0.811 Serum IL-8 (pg/mL) 67.46 ± 198.34 43.18 ± 86.60 23.63 ± 34.20 0.220

(52)

39

Serum MBL (ng/mL) 823.14 ± 478.86 814.14 ± 496.25 958.39 ± 591.79 0.665 Serum TGFβ1 (ng/mL) 31.72 ± 25.61 30.46 ± 16.28 28.24 ± 12.09 0.840 Serum TIMP-1 (ng/mL) 148.33 ± 74.32 159.30 ± 84.63 200.10 ± 89.82 0.066c Serum MMP-9 (ng/mL) 292.09±261.68 431.38 ± 458.43 395.59 ± 293.90 0.309 MMP-9/TIMP-1 ratio 2.38±2.53 2.75 ± 2.76 2.69 ± 3.18 0.662 Serum osteopontin (pg/mL) 3,945.13±4,720.21 2,971.11 ± 2,059.58 3,876.25 ± 3,080.04 0.634 P values achieved significance were denoted as a:significance between the group 1 and group 2; b:significance between the group 2 and group 3; c: significance between the group 3 and group 1.

IgE, immunoglobulin E; EDN, eosinophil-derived neurotoxin; IL-8, interleukin 8; MBL, mannan binding lectin; TGFβ1, transforming growth factor β 1; TIMP-1, tissue inhibitor of metalloproteinase 1; MMP-9, matrix metallopeptidase 9

(53)

40

3. 기저 동반질환(comorbidity)의 분포 비교

기저 동반질환을 갖고 있는 그룹 내 환자의 분포를 비교한 결과는 [Table 5]와 같다. 아토피를 비롯한 알레르기성 비염/만성 부비동염과 알레르기성 결막염은 세 군 간 분포의 차이가 없었다. 두드러기 및 혈관 부종은 group 3에서 0명인 것에 반해 group 1와 group 2는 각각 8.6%

와 8.0%를 차지하고 있으며 그룹 간 차이는 통계적으로 존재했으나 사 후검정에서는 통계적 유의성을 보이지 않았다. Group 3는 고혈압 환자의 분포가 39.7%로 group 1의 11.7%와 group 2의 14.1%보다 높은 비율 을 보였으며 통계적으로 유의한 분포의 차이를 보였다. 당뇨, 골다공증, 역류성식도염과 허혈성 심장질환은 통계적으로 유의한 차이를 보이지 않 았다.

(54)

41 Table 5 Baseline comorbidities of subgroups

Comorbidity Group 1

(n=128)

Group 2 (n=213)

Group 3

(n=73) P value

Atopy (%) 29.7 35.7 39.7 0.179

Allergic rhinitis/chronic rhinosinusitis (%) 72.7 70.0 74.0 0.758

Allergic conjunctivitis (%) 27.3 22.5 23.3 0.593

Urticaria/angioedema (%) 8.6 8.0 0.0 0.039

Hypertension (%) 11.7 14.1 39.7 <0.001a,c

Diabetes mellitus (%) 3.1 1.4 5.5 0.162

Osteoporosis (%) 2.3 0.9 4.1 0.218

GERD (%) 2.3 4.7 2.7 0.481

Ischemic heart disease (%) 0.8 0.5 1.4 0.733

Data are presented as n (%). GERD. Gastroesophageal reflux disease. P values achieved significance were denoted as

a:significance between the group 1 and group 2; b:significance between the group 2 and group 3; c: significance between the group 3 and group 1.

(55)

42 4. 천식 약물 사용력의 비교

세 그룹간 기저의 약물 사용에 차이가 있었던 약물은 전신 코르티코스테 로이드, SABA 그리고 LAMA 세 가지였다(모두 P <0.001). 세 약물 모 두 group 3의 환자에서 더 많이 사용되었으며 group 1이 가장 낮은 사 용력을 보였다. 그러나 사후검정에서 group 1과 group 2간에는 통계적 유의성을 확인하지 못했다[Table 6].

(56)

43 Table 6 Baseline medication uses of subgroups

Anti-asthmatic medication Group 1 (n=128)

Group 2 (n=213)

Group 3

(n=73) P value Systemic corticosteroid use (%) 73.4 80.3 95.9 <0.001b,c

Daily dose of systemic corticosteroid

High dose(%) 11.7 18.3 41.1 <0.001b,c

Moderate to low dose (%) 61.7 62.0 54.8

SABA use (%) 16.4 20.2 42.5 <0.001b,c

LTRA use (%) 92.2 93.0 100.0 0.056

Methylxanthine use (%) 25.0 19.7 26.0 0.382

LAMA use (%) 0.8 5.2 37.0 <0.001b,c

P values achieved significance were denoted as a:significance between the group 1 and group 2; b:significance between the group 2 and group 3; c: significance between the group 3 and group 1.

LABA, long-acting β agonist; SABA, short-acting β agonist; LTRA, leukotriene receptor antagonist; LAMA, long-acting muscarinic antagonist. High dose: ≧40 mg prednisolone or its equivalent dose.

(57)

44 5. 변수 간 상관관계 분석

통계적으로 유의하게 차이가 있었던 인구통계학적 특성과 기저 염증 특 성들 간에 상관관계를 분석한 결과는 [표 7]과 같다. 분석에 포함된 변 수들은 연령, 혈중 eosinophil과 neutrophil counts, 그리고 혈청 EDN 과 TIMP-1의 다섯 가지이다. 중간 이상의 상관성을 보이는 변수들은 없었으나, 혈청 EDN은 혈청 TIMP-1을 제외하고 연령과 혈중 eosinophil 및 neutrophil counts과 약한 상관성을 보였고, 특히 혈중 eosinophil counts와는 통계적으로 유의했다. 혈청의 TIMP-1은 연령과 약한 상관성을 보였으나 통계적으로 유의하지 않았다.

(58)

45

Table 7 Correlation analysis between clinical characteristics that differed significantly among or within subgroups

Variable Serum

TIMP-1 Age Blood eosinophil

counts

Blood neutrophil

counts Serum

EDN

R value 0.074 -0.164 0.240 0.205

P value 0.500 0.134 0.027 0.059

Serum TIMP-1

R value 0.195 -0.091 0.104

P value 0.074 0.406 0.342

Age R value -0.043 0.043

P value 0.699 0.693

Blood eosinophil counts

R value -0.011

P value 0.919

EDN, eosinophil-derived neurotoxin; TIMP-1, tissue inhibitor of metalloproteinase 1; AUC, area under curve

(59)

46

제4절 폐 기능 궤적 예측 모델 구축 결과

1. 연속형 변수들의 이분화를 위한 컷오프 값 분석 결과

통계적으로 유의한 차이가 있었던 다섯 개의 인구통계학적 및 기저 염증 마커들의 컷오프 값을 정하기 위해 ROC 분석이 시행했다. [Table 8]은 ROC 분석 결과 Youden index를 통해 찾은 가장 적절한 각 인자 별 컷 오프 값과 그 때의 민감도와 특이도 값을 정리한 것이다. 혈청 EDN은 AUC(area under the curve)값이 0.724로 다른 인자들보다 높았고, 74.71ng/mL(민감도 60.9%, 특이도 76.7%)의 컷오프 값을 가졌다. 혈 청 TIMP-1은 160.89ng/mL(민감도 60.8%, 특이도 75.0%), 혈중 eosinophil counts은 385.0.0/μL(민감도 47.2%, 특이도 66.8%), 혈중 neutrophil counts는 4,044.8/μL(민감도 63.9%, 특이도 56.7%), 그리 고 연령은 40세(민감도 75.3%, 특이도 47.2%)의 컷오프 값을 얻었다 [Figure E4].

(60)

47

Table 8 Results of ROC analysis to find the optimal cutoff values for predicting group 3

Variable Cutoff value AUC (95% CI) Sensitivity Specificity Serum EDN (ng/mL) 74.71 0.724 (0.617, 0.831) 0.609 0.767 Serum TIMP-1 (ng/mL) 160.89 0.662 (0.531, 0.793) 0.608 0.750 Blood eosinophil counts (/uL) 385.0 0.542 (0.461, 0.624) 0.472 0.668 Blood neutrophil counts (/uL) 4,044.8 0.604 (0.535, 0.674) 0.639 0.567

Age (year) 40 0.630 (0.561, 0.699) 0.753 0.472

EDN, eosinophil-derived neurotoxin; TIMP-1, tissue inhibitor of metalloproteinase 1; AUC, area under the curve

(61)

48 2. 로지스틱 회귀분석 결과

ROC 분석으로 구한 컷오프 값을 통해 이분화 한 인자들의 낮은 폐 기 능 궤적에 대한 예측력을 확인하기 위해 단변량 및 다변량 로지스틱 회 귀모델을 구축했다[Table 9]. 단변량 분석 결과 컷오프 값 보다 높은 혈 청 EDN, 혈청 TIMP-1, 그리고 혈중 eosinophil counts가 group 3 예 측에 통계적으로 유의했던 인자임이 확인됐다(각각 P =0.007, P

=0.003 그리고 P =0.015). 그러나 모든 요인들을 포함하여 구축한 로 지스틱 회귀모델인 Model 1의 결과 컷오프 값 보다 높은 혈청 EDN과 혈청 TIMP-1만이 낮은 폐 기능 궤적의 예측에 통계적으로 유의한 인 자였다 (각각 P =0.050과 P =0.006). 혈청 EDN과 혈청 TIMP-1만으 로 구축한 로지스틱 회귀모델 Model 2의 결과에서도 컷오프 값보다 높 은 혈청 EDN (OR 5.276, 95% CI 1.621-18.78, P =0.050)과 TIMP- 1 (OR 7.039, 95% CI 2.096-29.44, P =0.006)는 각각 독립적으로 유 의한 인자였다. 로지스틱 회귀분석으로 구축한 예측모델 Model 1과 Model 2의 성능은 [그림 9]에서 보이는 바와 같이 각각 AUC 0.811 (95% CI 0.680-0.942)와 0.783 (95% CI 0.663-0.904)였다.

(62)

49

Table 9 Results of univariate and multivariate logistic regression for predicting the group 3 in baseline

Variable Univariate analysis Multivariate Model 1 Multivariate Model 2 OR (95% CI) P value OR (95% CI) P value OR (95% CI) P value Serum EDN > 74.71

ng/mL 4.500

(1.524, 13.83) 0.007 3.965

(1.020, 16.73) 0.050 5.276

(1.621, 18.78) 0.007 Serum TIMP-1 >

160.89 ng/mL 6.160

(1.969, 23.61) 0.003 6.391

(1.832, 27.63) 0.006 7.039

(2.096, 29.44) 0.003 Blood eosinophil

counts > 385.0 /uL 3.850

(1.330, 11.85) 0.015 2.657

(0.755, 9.708) 0.128 - - Blood neutrophil

counts > 4,044.8 /uL 1.830

(0.644, 5.354) 0.258 1.163

(0.303, 4.286) 0.820 - - Age > 40 years 1.477

(0.493, 5.043) 0.503 1.521

(0.404, 6.482) 0.547 - - EDN, eosinophil-derived neurotoxin; TIMP-1, tissue inhibitor of metalloproteinase 1; OR, odds ratio.

Model 1, high serum EDN + high serum TIMP-1 + high blood eosinophil counts + high blood neutrophil counts + high age.

Model 2, high serum EDN + high serum TIMP-1.

(63)

50

Model 2, AUC 0.783 (0.663, 0.904) Model 1, AUC 0.811 (0.680, 0.942)

Figure 9 ROC curves for evaluating the performance of logistic regression model in predicting group 3

Model 1, high serum EDN + high serum TIMP-1 + high blood eosinophil counts + high blood neutrophil counts + high age

Model 2, high serum EDN + high serum TIMP-1

(64)

51

제5장 고찰 제1절 본 연구의 요약

본 연구를 위하여 연구자는 전자의무기록과 실험실 수준의 바이오 마커 데이터 및 폐 기능 검사 데이터를 통합하여 오몹 공통데이터모델로 구축 한 ICARUS 데이터베이스를 구축하였다. ICARUS 데이터베이스에서 414명의 GINA 가이드라인 4-5단계의 천식 치료를 시작한 환자를 연 구에 포함하였다. 동일한 강도의 천식 치료를 했음에도 불구하고 잠재 계층 혼합 모델을 통해 환자군 간 1초간 강제 호기량으로 확인할 수 있 는 폐 기능의 궤적에 잠재적인 하위그룹이 존재함을 확인했다. 직선 형 태의 폐 기능 궤적에서 세 개의 하위그룹을 확인할 수 있었는데, 항상 높은 폐 기능을 유지하는 group 1, 중간정도의 폐 기능을 장기간 지속하 는 group 2, 지속적으로 낮은 폐 기능을 유지하며 치료에 대한 불응성을 보이는 group 3로 나뉘었다. 특히 group 3는 천식 악화가 다른 두 하위 그룹에 비하여 지속적으로 높은 빈도를 보이며 높은 단계의 치료에 대한 불응성을 보였다. 기저 특성 분석을 통해 그룹 간 혹은 그룹 내 하나라 도 통계적으로 유의한 차이가 있었던 변수 다섯 개를 확인했다: 연령, 혈중 eosinophil 및 neutrophil counts, 혈청 EDN 및 TIMP-1. 각각의 변수마다 ROC 분석을 통해 적절한 컷오프 값을 확인하였다. 로지스틱 분석을 통해 이 중 74.71ng/mL보다 높은 혈청 EDN과 160.89ng/mL 보다 높은 혈청 TIMP-1이 통계적으로 유의하게 낮은 폐 기능 궤적을 갖는 group 3를 효과적으로 예측할 수 있음을 확인하였다. 이 두 마커를 이용한 로지스틱 예측모형의 성능은 AUC 0.783 (95% CI, 0.663-0.904) 로 비교적 높은 예측력을 보였다.

본 연구를 통하여 (1) 잠재 계층 혼합 모델을 통해 높은 단계의 치료를

(65)

52

시작한 천식 환자들 간에 장기적인 폐 기능 변화에 따른 이질성이 존재 하며, (2) 그 중 천식 치료에 지속적으로 불응성을 보이는 낮은 폐 기능 궤적에 대해 혈청 EDN과 혈청 TIMP-1을 조기 진단 및 예측 마커로 활용할 수 있음을 밝혔다.

참조

관련 문서

Therefore, this thesis aims to analyze the past and present of the precautionary principle for predicting the future management in fishery resources of the

Participants in one group (20’s) started to learn English before school and they have high proficiency of English.. The other group had participants who

The purpose of the present study was to investigate whether there are any differences in Korean high school students ’ reading comprehension of English texts according to

Therefore, the aim of this study was to investigate the morphologic characteristics of the interalveolar foramen and to analyze according to sex and age using cone

Therefore, this study aims to reveal the educational value of modern early childhood learners' emotional cultivation and to present a method of art

Therefore, this study aims to maintain the even saponin content by standardizing balloon flower extract (60ml) to use as tea to maximize the

Therefore, in order to help educational instruction in the educational field, this study aims to examine whether in families of middle school students

This study aims to identify whether socioeconomic level of parents affects obesity of adolescents and whether the relations between adolescent's obesity