• 검색 결과가 없습니다.

폐암검진에서 인공지능 기술의 활용

N/A
N/A
Protected

Academic year: 2021

Share "폐암검진에서 인공지능 기술의 활용"

Copied!
8
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Application of Artificial

Intelligence in Lung Cancer Screening

폐암검진에서 인공지능 기술의 활용

Sang Min Lee, MD1 , Chang Min Park, MD2*

1Department of Radiology and Research Institute of Radiology, Asan Medical Center, University of Ulsan College of Medicine, Seoul, Korea

2Department of Radiology, Seoul National University College of Medicine,

Institute of Radiation Medicine, Seoul National University Medical Research Center, Seoul, Korea

Lung cancer is a leading cause of deaths due to cancer, worldwide. At present, low-dose com- puted tomography (CT) is the only established screening method for reducing lung cancer mor- tality. However, several challenges must be overcome, to ensure the implementation of lung can- cer screening, which include a large number of expected low-dose CT examinations and relative shortage of experienced radiologists for interpreting them. The use of artificial intelligence has garnered attention in this regard. A deep learning technique, which is a subclass of machine learning methods, involving the learning of data representations in an end-to-end manner, has already demonstrated outstanding performance in medical image analysis. Several studies are exploring the possibility of deep learning-based applications in medical domains, including radi- ology. In lung cancer screening, computer-aided detection, report generation, prediction of ma- lignancy in the detected nodules, and prognosis prediction can be considered for the application of artificial intelligence. This article will cover the current status of deep learning approaches, their limitations, and their potential in lung cancer screening programs.

Index terms Lung Neoplasms; Screening; Computed Tomography, X-Ray; Artificial Intelligence

서론

폐암은 전 세계적으로 가장 흔한 암 사망 원인이며, 절반 이상의 환자들이 근치적 절제술이 불가능한 진행 병기(advanced stage)에서 발견되기 때문에, 5년 생존율이 20%에도 미치지 못하는 실정이다(1). 폐암에 의한 사망률을 감소시키기 위해서는, 폐암을 조기에 발견하고 치 료하는 것이 가장 효과적이다. 최근까지 폐암검진을 위한 다양한 방법이 시도되었지만, 저선 량 CT를 이용한 폐암검진만이 유일하게 폐암 사망률을 20% 감소시킬 수 있었다(2). 현재 미 국 등에서 폐암 고위험군에서 폐암검진을 시행하고 있고(3), 국내에서도 폐암검진 사업이 시

Received May 21, 2019 Revised August 5, 2019 Accepted August 6, 2019

*Corresponding author Chang Min Park, MD Department of Radiology, Seoul National University College of Medicine,

Institute of Radiation Medicine, Seoul National University Medical Research Center, 101 Daehak-ro, Jongno-gu, Seoul 03080, Korea.

Tel 82-2-2072-0367 Fax 82-2-743-7418 E-mail

cmpark.morphius@gmail.com This is an Open Access article distributed under the terms of the Creative Commons Attribu- tion Non-Commercial License (https://creativecommons.org/

licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduc- tion in any medium, provided the original work is properly cited.

ORCID iDs Chang Min Park https://

orcid.org/0000-0003-1884-3738 Sang Min Lee

https://

orcid.org/0000-0001-7627-2000

(2)

작되었다.

효과적인 폐암검진을 위해서는 저선량 CT에 대한 정확한 판독이 전제되어야 한다. 이를 통해, 불필요한 추가 검사나 중재시술을 줄이면서 폐암을 조기에 진단해 치료할 수 있다. 실제 2011년도 National Lung Screening Trial (이하 NLST)에서 양성 판정 폐결절 병변들 중, 3.6%만이 최종적 으로 폐암으로 진단되어, 96.4%의 높은 위양성률을 보였다. 저선량 CT의 정확한 판독을 위해서는, 경험 있는 전문가가 필수적인데, 예상되는 CT 검사 건수와 판독하는 데 소요되는 시간과 노력을 고 려할 때, 이들 판독 전문가들의 진료업무에 큰 부담이 될 것은 자명해 보인다.

이 문제의 해결 측면에서, 인공지능 기술을 활용한 저선량 CT 판독 보조 시스템 개발과 적용에 학계와 관련 산업계의 관심이 모아지고 있다. 인공지능(artificial intelligence) 기술은, 그 역사가 70년도 넘지만, 최근 들어 딥러닝(deep learning) 기술이 의학영상 분석에 직접 적용이 가능하고, 기존 인공지능 기술들 보다 매우 우수한 성능을 보이고 있어, 그 유용성 및 활용에 대한 연구가 활 발히 진행되고 있다(4).

폐암검진에서 인공지능 기술을 적용할 수 있는 분야는 크게 컴퓨터 보조 병변 검출(computer- aided detection (이하 CADe), 판독문 생성, 검출된 폐결절의 악성도 평가, 그리고 환자의 예후 예 측으로 나누어 볼 수 있다. 하지만, 아직 이러한 인공지능 기술의 적용이 시작 단계에 있어, 이에 본 기고문에서는 현재 폐암검진에 활용할 수 있는 인공지능 기술 기반 연구들을 살펴보고, 향후 이를 이용한 폐암검진의 가능성에 대해 논의하고자 한다.

폐암검진 CT에서의 폐결절 검출(Computer-Aided Detection; CADe)

폐암검진 CT에서 발견해야 하는 가장 중요한 영상 소견은 폐결절이다. 폐결절이 조기 폐암의 가장 중요하면서 흔한 영상 소견이기 때문이다. 폐결절을 발견하는 것은 영상의학과 전문의도 쉽 지 않을 수 있으며, 상당한 intra-, inter-reader variability가 실제로 존재한다. 또한, American College of Radiology (이하 ACR)에서 폐암검진 CT를 촬영할 때 절편 두께를 2.5 mm 이하로 규 정하고 있어, 한 CT 검사 당 100장이 넘은 영상을 검토해야 해, 상당한 시간과 노력이 필요한 업무 이다. 영상의학과 전문의의 진단능은 폐결절의 양성기준, 위치, 대상 환자군에 따라 차이가 있기 때 문에 정확하게 비교하긴 어렵지만, NLST에서 4 mm 폐결절을 검진 양성으로 설정했을 때, 6.2%

의 폐암을 놓치는 것으로 보고한 바 있다(5).

많은 연구들이, CADe 기술이 CT에서 폐결절을 찾는데, 민감도를 높인다고 보고하고 있다. Li- ang 등(6)은 폐암검진에서 놓친 50개의 폐암에 대해 CADe를 적용하였을 때, 56~70%의 병변을 추가로 찾는다고 보고하였다. 그리고 위양성은 검사 당 0.6~7.4개로 나타났다. 하지만, 폐암이 보 이는 추적 CT 검사에서 영상의학과 전문의가 찾은 병변 중 CADe는 20%를 찾지 못하여(6), 단독 으로 사용하기보다는 보완적인 목적으로 사용될 것으로 생각된다. 지금까지의 CADe는 병변 검출 의 민감도를 향상시킬 수 있지만, 위양성률이 높고, 기존 판독시스템과 분리되어 있어 실제 임상 에는 널리 사용되고 있지 못하다. 특히 높은 위양성률은 판독시간을 증가시킬 뿐 아니라, 오진의 가능성을 높여, CADe가 실제 진료 현장에 활용되기 위해서 반드시 극복되어야 할 점이다.

(3)

그럼, 실제 폐암검진 CT를 CADe가 평가하는 것과 두 명의 영상의학 전문의가 두 번 평가하는 것에 차이가 있을까? Zhao 등(7)은 NELSON 폐암검진 연구에서 400개의 CT를 임의로 선택해 위 의 경우를 비교하였다. 400개의 CT 중 하나 이상의 이상 소견을 보인 CT는 332개였고, 발견된 폐결 절의 총 수는 1667개였다. CADe의 민감도는 96.7%, 두 명의 영상의학 전문의가 두 번 평가하는 경 우의 병변 검출 민감도는 78.1%로 차이를 보였다. CADe의 위양성률은 검사 당 3.7개, 영상의학 전 문의의 위양성률은 검사 당 0.5개였다. 양성예측도는 8.9%, 35.2%로 전문가의 경우가 높았다. 폐 결절의 양성기준을 50 mm3으로 할 경우, CADe의 민감도는 영상의학 전문의와 동일해지고, 위양 성률도 1.9개로 감소했지만, 여전히 전문가와 비교하였을 때 CADe의 위양성률이 현저히 높았다 (영상의학 전문의, 검사 당 0.1개). 최근 결절의 양성 기준이 6 mm로 높아져(8), 작은 폐결절에 대 한 CADe의 위양성률이 감소함으로써, CADe의 임상 적용에 도움이 될 것으로 예상된다.

Zhao 등(7)의 연구에서 흥미로운 점은, 두 명의 전문의가 판독을 하더라도 민감도가 80% 수준이 고 CAD가 전문의가 놓치기 쉬운 결절을, 특히 혈관에 붙어있는 결절은 크기가 커도 놓치기 쉬운 데, 이를 찾는데 CADe가 도움을 줄 수 있다는 점이다. 특히 혈관을 제거하는 기능이 적용된 CADe 를 이용할 경우, 영상의학 전문의가 폐결절을 빠르게, 더 잘 찾을 수 있었다(9).

2011년도에 4명의 흉부 영상의학 전문의에 의해 병변의 위치가 표시된 1018개의 CT 검사로 이 루어진 Lung Image Database Consortium (이하 LIDC) database가 공개되었다(10). 이러한 공 개자료는 기존 기계학습 기법을 이용한 CADe 개발뿐만 아니라 딥러닝을 이용한 CADe 개발을 촉 진하는 계기가 되었다. 2015년에 Hua 등(11)에 의해 딥러닝을 이용한 CADe의 폐결절 검출능이 처 음으로 보고되었는데, 민감도 73%, 특이도 80%였다. 2016년에는 위양성을 줄이는 알고리즘을 적 용해 LIDC database에서 검사 당 위양성률이 1일 때, 85.4%의 민감도를 보이는 CADe가 보고되 었다(12). Jacobs 등(13)이 LIDC database를 이용해 기존의 CADe의 성능을 평가했을 때, 평균 3.1개의 위양성일 때 82%의 민감도를 보였다. LIDC data와 같은 공개 자료는 개발된 CADe의 성 능을 외부 검증할 수 있는 기회를 제공할 뿐만 아니라, 개발 시스템의 성능을 서로 비교해 볼 수 있 는 기회를 제공해 주기 때문에, 높은 질의 공개 자료는 향후에도 활성화되어야 한다.

지금까지의 CADe는 고형 결절(solid nodule)에 주로 초점을 두고 개발되었다. 하지만 여러 연 구에서 간유리음영 결절의 악성 가능성이 높게 보고되면서 간유리음영 결절을 잘 찾는 것도 중요 하게 되었다(14-16).

Benzakoun 등(17)은 상용화된 CADe를 사용하였을 때 부분고형 결절(part-solid nodule)의 72%(36/50), 순수간유리음영 결절(pure ground-glass nodule)의 28%(14/50)를 검출함으로써, 부 분고형 결절을 상대적으로 잘 검출했지만, 그 정확도는 여전히 낮았다.

Silva 등(18)은 Multicenter Italian Lung Detection (이하 MILD) 폐암검진 사업에서 얻어진 2303개의 CT를 이용해 CADe의 간유리음영 결절 검출능을 평가하였다. 총 155명(6.7%)의 환자에 서 194개의 간유리음영 결절이 발견되었고, 실제 검진판독에서의 병변 검출능과 CADe 결과를 비 교하였다. CADe의 양성예측도는 22.5%(175/779)였고, 이전 Benzakoun 등(17)의 연구와 같이 부 분고형결절을 더 잘 찾았다. 위양성은 검사 당 0.26개였다. Lung CT Reporting And Data System (이하 Lung-RADS)를 기준으로 가장 위험도가 높은 결절만 평가할 경우, CADe만 찾은 경우는 102

(4)

개, 영상의학 전문의만 찾는 경우는 18개, 양자가 모두 찾는 경우는 35개로, CADe의 병변 검출 민 감도가 영상의학 전문의보다 높았다[88.4%(137/155) vs. 34.2%(53/155)]. 하지만, CADe가 영상의 학과 의사가 찾은 결절의 66%(35/53)만 찾아, CADe와 영상의학 전문의의 시각적 평가를 병행함 으로써 CADe의 위양성을 줄일 수 있겠다. CADe는 2년, 4년 추적 CT에서도 영상의학 전문의가 찾 은 48개 중에 42개를 찾아 추적관찰에도 유용함을 보여주었다. 폐결절의 크기 측정 면에서도, CADe 를 활용한 반자동으로 측정에 기반한 경우와 전문가의 Lung-RADS 분류 판정이 94%(50/53)의 증 례에서 일치하였다.

정리하면, CADe를 사용할 경우, 폐결절 검출 민감도를 증가시킬 수 있지만, 전문가 대비 높은 위 양성으로 인해, 실제 임상 적용에 어려움이 있고, CADe가 보조적인 판독에 그 역할이 머물러, 임 상 진료 효율성을 향상시킬지 명확하지 않다. 하지만, 새로운 딥러닝 기술이 도입됨으로써, 이전 CADe보다 높은 성능을 보이고 있어, 임상 진료에 유용한 CADe 개발을 기대해 볼 만하다. 최근 Li 등(19)이 딥러닝을 활용한 CADe 결과를 보고하였는데, 기존 17개의 CADe 연구에서 평균 위양성 이 검사 당 4.1개(20)인 것과 비교하였을 때, 1.53개로 큰 향상을 보여 주었다. 하지만, 전문가의 위 양성률이 검사 당 0.13개로 여전히 큰 차이가 있어, 추가적인 성능 보완이 요구된다.

폐암검진 CT의 판독문 작성

2014년 미국방사선협회(ACR)에서 검진에서 발견된 폐결절에 대한 악성도 평가, 관리, 일관적 인 보고를 위한 Lung-RADS를 제안하였다. 이 시스템은 폐결절의 종류와 크기에 따라, 추적관찰 기간, 추가적인 검사 등을 포함하고 있다. Lung-RADS는 간단하고, 실제 임상적용에 용이한 면이 있지만, 폐결절 구분의 기준이 다소 모호한 측면이 있다. 저선량 검진 CT에서 폐결절 종류를 분류 하는 데 있어, 판독자 간 일치도는 kappa 값이 0.30에서 0.68로 중간 정도였다(21). 특히 폐결절 내 부에 고형성분이 있는지에 대해서는 일치도가 낮았다. 이 연구 결과는 판독자에 따라, 같은 환자가 다른 관리를 받을 수도 있음을 시사한다. Lung-RADS와 같은 관리지침이 공통된 기준을 적용함으 로써, 같은 병변은 어디서나 같은 관리를 받기 위해 제작된 것임을 고려하면, 인공지능 기술이 정 해진 규칙에 따라, 일관된 결과를 제시할 수 있다면, 분명 중요한 이점이 될 수 있다.

Ciompi 등(22)은 딥러닝 기반 폐결절 자동 분류 시스템 개발 및 검증을 위해, 폐결절을 고형결 절, 부분고형결절, 순수간유리결절, 석회화 결절로 크게 구분하고, 고형결절에서 엽간열 주위 결절 (perifissural nodule)을 다시 세분하였다. 그리고 폐결절의 특징 중, 침상결절(spiculated nod- ule)에 대해서도 별도 분류하였다. Ciompi 등(22)은 MILD 폐암검진 사업의 943명, 총 1352개 폐결 절을 이용해, multi-stream, multi-scale 방법을 통해 딥러닝 기반의 분류기를 만들었다. 이 분류기 의 성능을 Danish Lung Cancer Screening Trial에서 선택된 468명 환자의 639개 폐결절에서 검 증했고 162개의 결절에 대해서는 판독자와 비교하였다. 4명의 판독자 간 분류 일치도는 0.59~0.75 였고, 딥러닝과 4명의 판독자 간의 분류 일치도는 0.59~0.67로 판독자 간의 일치도와 유사하였다.

639개의 결절에 대한 양성예측도와 민감도는 고형결절의 경우 89.2%, 82.2%, 석회화 결절의 경우 88.9%, 82.8%, 순수간유리음영 결절의 경우 87.4%, 87.4%로 좋은 결과를 보였지만, 부분고형결절

(5)

의 경우, 43.6%, 64.9% 그리고 침상결절의 경우는 32.7%, 64.3%로 낮은 편이었다. 엽간열 주위 결 절은 78.4%, 60.4%로 중간 정도의 결과를 보였다. Ciompi 등(22)이 제시한 알고리즘은 전반적으 로 좋은 성능을 보였고, 낮은 정확도를 보였던 부분고형결절과 침상결절은 추가적인 학습을 통해 성능개선을 기대해 볼 수 있겠다. 딥러닝 알고리즘을 이용한 일관성 있는 폐결절 자동분류가 가능 해지면, CADe를 통해 폐결절을 검출하고, 자동 분절(segmentation) 하여 크기를 구하는 과정을 통해 Lung-RADS 분류를 자동으로 할 수 있게 될 것으로 기대된다.

그러면 과연 이러한 분석을 통한 결과보고가 진료의 효율성을 높일 수 있을까? 이에 대해서는 더 많은 연구가 필요하지만 최근 발표된 Brown 등(23)에 의하면, CADe에서 분석된 내용을 판독문에 미리 작성할 경우, 전체 판독시간을 7~44% 정도 단축시킬 수 있다고 한다. 3명의 판독자만을 대상 으로 하고, 폐결절의 검출 정확도에 대한 평가는 없지만, 실제 어느 정도 성능이 입증된 CADe를 임상에 적용할 때 참고할 수 있는 연구로 판단되며, 판독문에 포함되어야 하는 필수적인 항목이 많 을수록 CADe에 의한 판독문 작성은 판독의 효율성을 높일 수 있을 것으로 기대된다. 특히 폐암검 진에서는 폐결절의 크기, 위치, 이미지 위치 등의 자세한 판독문이 필요하므로, 도움이 될 가능성 이 높다.

검출된 폐결절의 악성도 및 예후 예측

지금까지 CADe의 개발은 폐결절을 보다 정확하게 검출하는 데 초점이 맞추어 있었다. 하지만, 여러 대규모 폐암검진 연구를 통해, 폐결절에 대한 지식이 축적되고, 영상 분석 기술이 발전하면서 정량적 분석을 포함한 폐결절 분석의 새로운 장이 열리게 되었다.

폐결절의 정량적 분석을 위해서는 폐결절을 오려내는, 소위 말하는 분절(segmentation) 작업 단 계가 필요하다. 이미 수많은 연구가 이루어지고 있는 분야였지만, 최근에 U-NET (24), Mask region- based CNN 등의 딥러닝 기법이 활용되면서, 보다 정확하게 폐병변을 오려낼 수 있게 되었다.

폐결절을 정확하게 분절하게 되면, 크기뿐만 아니라 다양한 영상 특징들을 추출할 수 있다. 그리 고 이러한 영상 특징들을 이용해서 폐결절의 악성도를 예측할 수 있다. Huang 등(25)은 NLST에서 4~20 mm 크기의 186개의 폐결절을 선택한 후 Radiomics를 포함한 다양한 영상 특징을 학습 시 켜, 악성 폐결절을 정확하게 진단할 수 있었다고 보고하였다(area under the receiver operating characteristic curve: 0.9154). 3명의 판독자와 비교하였을 때 CAD의 악성 폐결절에 대한 양성예 측도(positive predictive value)가 0.86으로 판독자의 양성예측도 0.64보다 더 높고, 위양성률은 0.31에서 0.11로 낮추었다.

최근에 Ardila 등(26)은 저선량 폐암검진 CT에서 3D 딥러닝을 이용하여 폐암 가능성이 가장 높 은 결절 2개를 결과로 보여주는 알고리즘을 제시했다. 이 알고리즘은 폐암검진 대상군에서 발견된 모든 폐암을 찾았고, 그 진단능은 전문가와 비교하였을 때 비슷하거나 더 나은 성능을 보였다. 특 히 이 알고리즘은 이전 CT 검사의 정보를 활용하여, 악성도를 예측할 수도 있어, 실제 검진현장에서 판독하는 상황과 유사하다고 할 수 있다. 이 알고리즘은 이전 CADe가 폐결절로 의심되는 모든 폐 병변을 검출했던 접근방법과 달리 가장 중요한 2개 병변만을 제시함으로써, 폐암을 찾는 임상적

(6)

목적을 달성하면서도, 기존 CADe 시스템의 높은 위양성 결과의 단점을 피할 수 있었다. 또한 폐암 검진을 실제로 받은 대상군에서 그 성능을 입증함으로써, 보조진단시스템의 임상적용 가능성에 한 발 더 다가섰다고 평가할 만하다.

이처럼 CAD가 정교하고, 정량적인 영상 특징을 활용해 폐결절의 악성도를 평가하거나 혹은 Brock 모델(27, 28) 등 이미 성능이 입증된 예측 모델에서의 폐암 예측값을 제시해 주면, 판독자가 폐결절의 악성도를 판단하는 데 도움이 될 것으로 생각된다. 더 나아가 딥러닝 기법은 아니지만 폐 결절의 특성을 학습한 프로그램을 이용해서 환자의 예후를 예측함으로써(29), 개별 환자에게 보다 적합한 추적관찰이나 치료를 제시할 수 있겠다.

결론

저선량 CT를 이용한 폐암검진은 검진 대상자들에게 실제적인 이익을 줄 수 있는 중요한 검진이 될 것으로 기대되며, 인공지능 기술은 이 검진을 효율적으로 운영하는 데 도움을 줄 것으로 보인다.

특히 인공지능 기술이 폐결절의 검출, 악성도 예측, 판독문 생성, 환자의 예후 예측 등을 통해 의료 의 효율성을 제고하는 역할을 담당할 수 있기를 기대한다.

인공지능 기술을 활용한 최근 연구 결과는 과거보다 좋은 진단 성능을 보이지만, 실제 임상진료 에 사용할 수 있을지 아직은 분명하지 않다. 엄격한 검증을 통해, 새로운 인공지능 기술이 진단 정 확도, 치료 성적을 향상시킬 수 있을지, 검진 대상자들의 의료 경험을 향상시킬 수 있을지, 혹은 과 도한 의료 비용을 감소시킬 수 있을지에 대한 연구가 필요함은 두말할 필요가 없다. 또한, 임상적 으로 유용성이 입증된 기술은, 딥러닝 기술의 특성을 감안했을 때, 진료 현장에 빠르게 적용함으로 써, 추가적인 성능 향상을 도모하는 전략도 필요한 시점으로 판단된다. 이러한 과정에서 영상의학 전문가와 여러 의료 전문가들의 적극적인 관심과 참여가 필수적임은 아무리 강조해도 지나치지 않다.

Conflicts of Interest

The authors have no potential conflicts of interest to disclose.

REFERENCES

1. Siegel RL, Miller KD, Jemal A. Cancer statistics, 2019. CA Cancer J Clin 2019;69:7-34

2. National Lung Screening Trial Research Team, Aberle DR, Adams AM, Berg CD, Black WC, Clapp JD, et al. Re- duced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med 2011;365:395- 409

3. Nishi S, Zhou J, Kuo YF, Goodwin JS. Use of lung cancer screening with low-dose computed tomography in the medicare population. Mayo Clin Proc Innov Qual Outcomes 2019;3:70-77

4. Lee JG, Jun S, Cho YW, Lee H, Kim GB, Seo JB, et al. Deep learning in medical imaging: general overview.

Korean J Radiol 2017;18:570-584

5. National Lung Screening Trial Research Team, Church TR, Black WC, Aberle DR, Berg CD, Clingan KL, et al.

Results of initial low-dose computed tomographic screening for lung cancer. N Engl J Med 2013;368:1980- 1991

6. Liang M, Tang W, Xu DM, Jirapatnakul AC, Reeves AP, Henschke CI, et al. Low-dose CT screening for lung can- cer: computer-aided detection of missed lung cancers. Radiology 2016;281:279-288

(7)

7. Zhao Y, De Bock GH, Vliegenthart R, Van Klaveren RJ, Wang Y, Bogoni L, et al. Performance of computer-aid- ed detection of pulmonary nodules in low-dose CT: comparison with double reading by nodule volume.

Eur Radiol 2012;22:2076-2084

8. Henschke CI, Yip R, Yankelevitz DF, Smith JP; International Early Lung Cancer Action Program Investigators.

Definition of a positive test result in computed tomography screening for lung cancer: a cohort study. Ann Intern Med 2013;158:246-252

9. Lo SB, Freedman MT, Gillis LB, White CS, Mun SK. Journal club: computer-aided detection of lung nodules on CT with a computerized pulmonary vessel suppressed function. AJR Am J Roentgenol 2018;210:480-488 10. Armato SG 3rd, McLennan G, Bidaut L, McNitt-Gray MF, Meyer CR, Reeves AP, et al. The Lung Image Database

Consortium (LIDC) and Image Database Resource Initiative (IDRI): a completed reference database of lung nodules on CT scans. Med Phys 2011;38:915-931

11. Hua KL, Hsu CH, Hidayati SC, Cheng WH, Chen YJ. Computer-aided classification of lung nodules on com- puted tomography images via deep learning technique. Onco Targets Ther 2015;8:2015-2022

12. Setio AA, Ciompi F, Litjens G, Gerke P, Jacobs C, Van Riel SJ, et al. Pulmonary nodule detection in CT images:

false positive reduction using multi-view convolutional networks. IEEE Trans Med Imaging 2016;35:1160- 1169

13. Jacobs C, Van Rikxoort EM, Murphy K, Prokop M, Schaefer-Prokop CM, Van Ginneken B. Computer-aided detection of pulmonary nodules: a comparative study using the public LIDC/IDRI database. Eur Radiol 2016;

26:2139-2147

14. Henschke CI, Yankelevitz DF, Mirtcheva R, McGuinness G, McCauley D, Miettinen OS, et al. CT screening for lung cancer: frequency and significance of part-solid and nonsolid nodules. AJR Am J Roentgenol 2002;178:

1053-1057

15. Li F, Sone S, Abe H, Macmahon H, Doi K. Malignant versus benign nodules at CT screening for lung cancer:

comparison of thin-section CT findings. Radiology 2004;233:793-798

16. Nakata M, Saeki H, Takata I, Segawa Y, Mogami H, Mandai K, et al. Focal ground-glass opacity detected by low-dose helical CT. Chest 2002;121:1464-1467

17. Benzakoun J, Bommart S, Coste J, Chassagnon G, Lederlin M, Boussouar S, et al. Computer-aided diagnosis (CAD) of subsolid nodules: evaluation of a commercial CAD system. Eur J Radiol 2016;85:1728-1734 18. Silva M, Schaefer-Prokop CM, Jacobs C, Capretti G, Ciompi F, Van Ginneken B, et al. Detection of subsolid

nodules in lung cancer screening: complementary sensitivity of visual reading and computer-aided diagno- sis. Invest Radiol 2018;53:441-449

19. Li L, Liu Z, Huang H, Lin M, Luo D. Evaluating the performance of a deep learning-based computer-aided di- agnosis (DL-CAD) system for detecting and characterizing lung nodules: comparison with the performance of double reading by radiologists. Thorac Cancer 2019;10:183-192

20. Al Mohammad B, Brennan PC, Mello-Thoms C. A review of lung cancer screening and the role of computer- aided detection. Clin Radiol 2017;72:433-442

21. Van Riel SJ, Sánchez CI, Bankier AA, Naidich DP, Verschakelen J, Scholten ET, et al. Observer variability for classification of pulmonary nodules on low-dose CT images and its effect on nodule management. Radiol- ogy 2015;277:863-871

22. Ciompi F, Chung K, Van Riel SJ, Setio AAA, Gerke PK, Jacobs C, et al. Towards automatic pulmonary nodule management in lung cancer screening with deep learning. Sci Rep 2017;7:46479

23. Brown M, Browning P, Wahi-Anwar MW, Murphy M, Delgado J, Greenspan H, et al. Integration of chest CT CAD into the clinical workflow and impact on radiologist efficiency. Acad Radiol 2019;26:626-631

24. Ronneberger O, Fischer P, Brox T. U-Net: convolutional networks for biomedical image segmentation. In Na- vab N, Hornegger J, Wells W, Frangi A, eds. Medical Image Computing and Computer-Assisted Intervention–

MICCAI 2015. MICCAI 2015. Lecture Notes in Computer Science, vol 9351. Cham: Springer 2015:234-241 25. Huang P, Park S, Yan R, Lee J, Chu LC, Lin CT, et al. Added value of computer-aided CT image features for

early lung cancer diagnosis with small pulmonary nodules: a matched case-control study. Radiology 2018;286:286-295

26. Ardila D, Kiraly AP, Bharadwaj S, Choi B, Reicher JJ, Peng L, et al. End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nat Med 2019;25:954-961 27. McWilliams A, Tammemagi MC, Mayo JR, Roberts H, Liu G, Soghrati K, et al. Probability of cancer in pulmo-

nary nodules detected on first screening CT. N Engl J Med 2013;369:910-919

(8)

28. White CS, Dharaiya E, Dalal S, Chen R, Haramati LB. Vancouver risk calculator compared with ACR lung- RADS in predicting malignancy: analysis of the national lung screening trial. Radiology 2019;291:205-211 29. Maldonado F, Duan F, Raghunath SM, Rajagopalan S, Karwoski RA, Garg K, et al. Noninvasive computed to-

mography-based risk stratification of lung adenocarcinomas in the national lung screening trial. Am J Respir Crit Care Med 2015;192:737-744

폐암검진에서 인공지능 기술의 활용

이상민1 · 박창민2*

저선량 CT를 이용한 폐암검진은 폐암 사망률 감소 효과가 입증되었으며, 국내에서도 시작되 었다. 효과적인 폐암검진을 위해서는 저선량 CT에 대한 정확한 판독이 전제되어야 한다. 하 지만, 추정 검사 건수와 경험 있는 전문가의 수를 고려했을 때 영상의학 진료에 큰 부담이 될 것은 자명해 보인다. 이 문제의 해결 측면에서, 인공지능 기술을 활용한 저선량 CT 판독 보조 시스템 개발과 적용에 학계와 관련 산업계의 관심이 모아지고 있다. 특히, 의학영상 분석에 직접 적용이 가능한 딥러닝(deep learning) 기술은 기존 기계학습(machine learning) 기술 보다 우수한 진단 성능을 보이고 있어, 그 잠재적 유용성에 대한 연구가 활발히 진행되고 있 다. 폐암검진에서 딥러닝을 포함한 인공지능 기술을 적용할 수 있는 분야는 크게 컴퓨터 보 조 병변 검출, 판독문 생성, 검출된 폐결절의 악성도 평가, 그리고 환자의 예후 예측으로 나누 어 볼 수 있다. 이에 본 기고문에서는 현재 폐암검진에 활용할 수 있는 인공지능 기반 연구들 을 살펴보고, 향후 이를 이용한 폐암검진의 가능성에 대해 논의하고자 한다.

1울산대학교 의과대학 서울아산병원 영상의학과

2서울대학교 의과대학 의학연구원, 방사선의학연구소, 영상의학교실

참조

관련 문서

MR: Start and end mode output selection, shown here as 0 (output an END output signal on a high or low limit error so that the next weld cycle can start)a. The other selection is

Colorectal cancer screening using fecal occult blood test and subsequent risk of colorectal cancer: a prospective cohort study in Japan.. Allison JE, Sakoda LC, Levin

a prospective analysis of 50 cases. Preoperative staging of non-small-cell lung cancer with positron-emission tomography. Staging of non- small-cell lung cancer

Year-end tax settlement of reemployed persons (Article 138, Income Tax Act) Where a wage & salary income earner who retires in the middle of a taxable period and is

 In the present study, as a preliminary study, a LACC-based Compton CT was developed to estimate the activity of the spot inside the radioactive waste drum. To

addition of each monomer molecules to the chain end addition of each monomer molecules to the chain end involves an attack by the radical site on the unsaturated

Marfaing Marfaing Marfaing Marfaing- -- -Koka A, Devergne O, Gorgone G, et al: Koka A, Devergne O, Gorgone G, et al: Koka A, Devergne O, Gorgone G, et al: Koka A, Devergne O,

A Study on the Power Metering Data Missing Correction Model Based on Deep Learning..