러닝을 이용한 유방영상에서의 유방 밀도 측정

(1)

딥 러닝을 이용한 유방영상에서의 유방 밀도 측정

안 철 균¹ · 김 종 효^{1, 2, 3}

1서울대학교 융합과학기술대학원 융합과학부 방사선융합의생명전공,

2서울대학교 차세대융합기술연구원 의료 IT융합기술 연구센터,

3서울대학교병원 영상의학과

Mammographic Breast Density Estimation using Deep Learning

Chulkyun Ahn¹, Jong Hyo Kim^{1, 2, 3}

1Program in Biomedical Radiation Sciences, Department of Transdisciplinary Studies, Graduate School of Convergence Science and Technology, Seoul National University, Korea

2Center for Medical-IT Convergence Technology Research, Advanced Institutes of Convergence Technology, Seoul National University, Korea

3Department of Radiology, Seoul National University Hospital, Korea

=Abstract=

Background : Deep learning has recently emerged as a powerful machine learning technique applicable to various pattern recognition problems including image recognition, speech recognition, data analysis, etc and has a good potential for use in medical image processing.

We present our pilot study of applying convolution neural network (CNN) in automated mammographic breast density estimation.

Materials and Methods: 397 craniocaudal (CC) view full field digital mammograms were used in this study. Of the 397 mammograms, 297 mammograms were randomly selected as a training set and the rest 100 mammograms were used for a test set. Three experts determined boundaries between glandular and fat areas, from which square-shaped patches were extracted from each of glandular and fat area. Those patches were fed into the CNN for training.

Results: The trained-CNN produced patch-based segmentation of mammograms, which in turn gave percent mammographic density for the 100 test mammograms. The correlation between CNN-derived breast density and manually measured density by three experts was 0.77.

Conclusion: We were able to train CNN for estimating breast density from mammograms. As the deep learning technique has an ability to improve the performance by providing appropriate training with large amount of data, we expect a growing performance of deep learning technique with extended experience and accumulation of open medical imaging database.

Key Words: Deep learning; Convolutional neural network (CNN); Mammography breast density;

Quantitative measure; Full filed digital mammography

통신저자: 김종효

(03080) 서울특별시 종로구 대학로 101, 서울대학교병원 영상의학과

Tel. (02) 2072-3677, Fax. (02) 747-1762, E-mail: [email protected]

(2)

서 론

딥러닝(deep learning)은 최근 각광받는 인공지능 기계 학습 분야로서, 데이터 분석 및 예측, 영상인식, 음성인식 그리고 보안 등 다양한 분야에서 활발하게 연구되고 있다 (1, 2). 딥러닝은 기본적으로 기존 인공 신경망(artificial neural network) 계층을 깊게 쌓아 생성한 심층 신경망 (deep neural network)의 형태를 가지며, 원시 데이터 (raw data) 로부터 고수준 특징(high-level feature)을 추 출할 수 있는 것으로 알려져 있다(1, 2). 많은 계층을 보 유한 깊은 신경망의 학습이 쉽지 않지만 2000년 후반 Hinton이 효과적인 깊은 신경망 학습 기술을 개발한 이 후로 최근까지 활발하게 연구되고 있다(3). 현재 딥러닝의 주요방법으로 사전 학습(pre-training), 컨볼루션 네트워 크(convolutional neural network; CNN) 그리고 순환 신경망(recurrent neural network; RNN)이 있다.

딥러닝 기법 중 CNN은 컴퓨터 비전 내 필기숫자인식, 물체인식 등 여러 분야에서 뛰어난 성과를 보이고 있으며 (4, 5), 의료영상분야에서도 점차 CNN을 이용한 연구가 확대되고 있다(6, 7). 일 예로서, 유방암 병리 영상에서 유 사 분열 세포는 암의 검진과 평가의 중요한 지침이 되는 데, CNN을 사용하여 병리 영상에서 유사 분열 세포를 자 동으로 검출하는 기술이 연구되었다(6). 마찬가지로 CNN 을 이용하여 CT 영상에서 간질성 폐질환의 병변을 자동 으로 분류해주는 연구도 보고되었다(7).

본 연구에서는 CNN을 이용하여 유방영상(Mammo- gram)의 유방 밀도를 자동으로 측정했다. 최근 유방 밀도 는 유방암 관련 다양한 연구에서도 주요한 연구주제로 부 상하고 있다[8-11]. 치밀 유방 일수록 유방암에 걸릴 확률

이 높아짐에도 불구하고, 실제 임상현장에서 유방밀도는 아직까지 전문가의 육안 평가에 의존되고 있다(8-10). 이 연구에서는 기존 주관적으로 이루어지고 있는 유방 밀도 측정에서 컨볼루션 네트워크가 활용될 수 있는 가능성을 알아보고자 하였다.

재료 및 방법 데이터베이스

본 연구를 위해 서울대학교 병원에서 상하촬영방식 디지털 유방촬영술로 촬영된 평균 나이 50.5세10.3, 나 이 범위 27-78세 여성 환자 349명의 영상들을 사용하였 다. 2008년 1월부터 12월까지 기간 동안 349명 환자로 부터 디지털 유방촬영 시스템(Senograph 2000D, GE Healthcare) 으로 촬영된 397장의 디지털 유방영상을 얻 었다. 영상의 해상도는 100 ㎛/픽셀이며 영상의 픽셀단위 행렬 크기는 2294 × 1914 픽셀로 구성되었다. 397장 영상 중 여성 100명의 유방영상 100장이 임의로 테스트 집합 으로 선택하였으며 남은 여성 249명의 297장의 유방영상 은 훈련 집합으로 사용하였다.

10년 이상 유방암 판독분야의 3명의 전문의가 참여하였 고 2명의 유방분야 영상의학과 전문의와 1명의 유방 외과 전문의가 참여하였다. 전문가들은 유방 밀도 프로그램 중 Cumulus4(12) 소프트웨어 프로그램을 사용하여 유방 밀 도를 측정하였다. Cumulus4 프로그램은 유방 내 지방 영 역과 유선 영역 각각 경계선의 문턱치를 결정하여 유방 밀 도를 측정하는 프로그램이다.

Fig. 1. Overall schematic diagram of mammography breast density estimation.

(3)

전체 흐름도

본 연구에서는 전처리, CNN 학습 그리고 유방밀도 측 정 3단계의 방법으로 데이터를 처리하였으며, 그 전체 흐 름을 그림 1에 나타내었다. 전처리 과정에서 입력된 유방 영상의 크기를 축소한 후, 유방영역만을 분할하고 영상의 밝기 값 범위를 조정했다. CNN 학습에서는 훈련 집합에

서 추출한 사각형 패치를 CNN에 입력하여 훈련시켰다.

마지막 유방 밀도 측정과정에서 학습시킨 CNN을 기반으 로 유방 밀도 영역을 자동 영상 분할하여 유방 밀도를 측 정했다.

전처리

전처리 과정에서는 컴퓨터 계산 량을 줄이기 위해 2294

× 1914 해상도를 가지는 원본 영상을 1147 × 957 해상도 의 영상 크기로 란초스 보간법을 사용해 축소하였다. 영상 의 밝기 값 히스토그램 분포도는 그림 2처럼 바이모달 분 포를 가지며 첫 번째 정점은 배경 영역이며 두 번째 정점 은 유방 영역이다. 유방 영역의 문턱치를 설정함으로써 배 경 영역을 제외한 유방영역을 추출하였다.

유방영상에서는 유방 두께, 방사선 노출 조건, kVp, mAs, 양극 타켓 물질 그리고 필터 물질 등 다양한 유방촬 영술 조건에 따라 유방 영역의 밝기 값 분포가 달라진다.

각 영상의 밝기 값 분포표준화를 위해 히스토그램 쉬프트 과정을 거치며 본 연구에서는 백분위수 2 만큼 히스토그 램 쉬프트 하였다(13). 쉬프트 과정 전(a)과 후(b)의 히스 토그램 분포도는 그림 3과 같다.

Fig. 2. Intensity histogram distribution of an example mammogram.

Fig. 3. (A) before histogram shift and (B) after histogram shift. The black arrows indicate the 2 percentile histogram.

A B

(4)

CNN 학습

본 연구에서는 다수의 계층으로 구성된 CNN 구조를 사용하였다. 그 구성은 컨볼루션 계층, Rectified Linear Unit (ReLU) 활성화 함수 계층, max-pooling, drop-out, fully-connected 계층 그리고 softmax 분류 계층으로 되 어 있으며 표 1에 정리하였으며 전체적인 파이프라인은 그림 4와 같다. 본 연구에서는 유방 영역 내 지방 조직과 유선 조직의 바이너리 분류이므로 fully-connected 최종 계층의 출력 수는 2개로 설정했다. CNN 구조를 최적화하 기 위해 사용한 오차 함수 C는 크로스 엔트로피이며 수식 (1)과 같다.

C = - 1

Σ_x [y lna + (1 - y)ln(1 - a)] (1) n

여기서 y는 기대값이고 a는 CNN에서 실제 출력된 값 이며 n은 훈련 데이터의 개수이다. 오차 함수를 최소화하 고 설계한 CNN 구조를 최적화시키기 위해 Adam 최적화 방법을 사용하였다. Adam 최적화 방법은 기존 기울기 하 강 방법에 비해 계산적으로 효율적이며 메모리 소요량이

적다[14]. 또한 네트워크의 가중치 학습율을 0.001로 설 정하였으며 세대(epoch)수는 15로 지정하였다.

CNN을 학습시키기 위해 3명의 전문가가 Cumulus4 프로그램을 사용하여 훈련 집합 297장의 유방영상에서 결 정한 지방영역과 유선영역의 분할 문턱값을 이용하였다.

전문가로부터 훈련 집합의 문턱값이 결정되면, 각 영상 의 지방 영역과 유선 영역에서 41 × 41 크기의 사각형 패 치를 자동으로 추출하였으며 훈련 집합에서 추출된 패치 의 총 수는 62,000개였으며 그 중 유선 조직 패치의 수는 35,000개 그리고 지방 조직 패치의 수는 27,000개였다.

추출된 패치는 평균값 0, 표준편차 1로 정규화 과정을 거 친 후 CNN의 첫 계층으로 입력하여 CNN을 학습시켰다.

본 연구에서 설계된 CNN을 학습시키기 위해 사용된 PC의 O/S는 Ubuntu 15.10이고 GPU는 GeForce GTX 970이며 프로그램은 Pyhton 3.4버전으로 코딩 되었다.

그리고 사용한 딥러닝 라이브러리로는 구글에서 배포한 TensorFlow 라이브러리를 사용하였다(15).

유방 밀도 측정

테스트 집합으로 주어진 100장의 유방영상 유방 밀도

Fig. 4. Deep convolutional architecture consisting of convolutional, pooling and fully connected layer.

Table 1. Convolutional neural network architecture used in this study

(5)

측정을 위해 2.4절에서 훈련시킨 CNN을 사용했다. 우선, 테스트 집합으로 주어진 유방영상에 2.3절에서 설명한 전 처리 과정을 시행한 이후 유방 영역을 분할했다. 유방 전 체 영역 내에 매 픽셀 마다 41 × 41 크기의 사각형 패치 를 추출하고 추출된 패치는 정규화 과정을 거친 후 학습된 CNN에 입력영상으로 입력하였다. CNN은 입력된 패치 에 대해 지방 영역 혹은 유선 영역인지 분류하였다. 주어 진 유방영상의 유방 밀도 측정은 다음과 같이 측정했다.

유방밀도(%) = 유선영역의 픽셀 수

× 100 (2) 유방영역의 픽셀 수

실험결과

CNN을 학습시키는데 걸리는 시간은 GPU기반으로 약 5분 정도 소요된 반면에 새로운 테스트 영상의 유방 밀도 를 측정하는데 소요된 시간은 약 3분 정도였다. CNN을 사용하여 자동 측정한 유방 밀도의 결과와 전문가가 측정

했던 유방 밀도와의 비교를 위해 1) 유선 영역과 지방 영 역 경계선의 육안 평가와 2) 전문가 평가와의 일치도를 확 인하였다.

육안 평가

본 연구에서 제안한 방법으로 생성한 유선 영역과 지방 영역간의 경계선과 전문가가 설정한 경계선을 육안으로 비교 평가하였으며 일부를 그림5에 나타내었다. 첫 행은 전문가가 그린 경계선이며 아래 행은 CNN으로 생성된 경 계선이며 치밀 유방일수록 영역의 경계선이 잘 잡히는 반 면에 지방 영역이 많아질수록 유선 영역의 경계선이 과하 게 잡혔다.

전문가 평가와의 일치도

세 명의 전문가는 테스트 집합 유방영상 100장의 유방 밀도를 Cumulus4 소프트웨어를 사용하여 2번씩 측정하 였다. 따라서, 유방영상 한 장 당 6개의 유방 밀도의 결과 값을 얻었으며, 6개의 밀도 값의 평균값을 취하여 영상의

A B C D

Fig. 5. Overlaid dense area boundaries of example mammogram: Shown in (A) - (D) are the boundaries drawn from the experts, and in (E) - (H) are the boundaries produced by the CNN.

E F G H

(6)

기준 유방 밀도 값으로 삼았다.

CNN 기반의 자동 측정 유방 밀도와 기준 유방 밀도와 의 산포도는 그림 6과 같다. 자동 측정한 유방 밀도와 기 준 유방 밀도의 상관도수는 0.77였다.

고찰 및 결론

딥러닝 기법중에 CNN은 영상 인식 및 분류에 매우 높 은 성능을 보이는 것으로 알려져 있다. 필기숫자 인식성 능 검증에서 널리 사용되는 MNIST 데이터에 적용하여 0.23%에 불과한 적은 오류를 기록한 바 있으며(16), 세 계에서 가장 큰 규모의 물체 인식 컨테스트 중 하나인 ILSVRC (ImageNet Large Scale Visual Recognition Challenge)에서 CNN을 사용한 방법이 다른 기계학습 기 법보다 높은 성과를 얻었다(17). 때문에 저자들은 CNN이 의학영상 분석에서도 뛰어난 성능을 나타낼 수 있을 것이 라는 기대를 갖게 되었다. 의학영상에서 관심조직이나 병 변을 분할하고, 분할된 영역에서 특징을 추출하며 질병을 검출하거나 감별하는 등 많은 분야에서 기존의 영상처리 기법들이 사용되고 있지만, 아직 만족할 만한 성능을 얻지 못하는 응용 분야들이 남아있다. 딥러닝이 이러한 난문제 해결에 활용될 수 있다면 그 파급효과는 클 것으로 기대하 였다.

저자들은 이번 연구에서 그 첫 단계로서, 저자들이 이 전부터 관심을 갖고 연구해오던 유방밀도 자동측정에서 CNN이 갖는 가능성을 확인하고자 하였다. 유방 영상에서

자동으로 유선 영역을 분할하는 것의 어려운 점은 유선 영 역과 지방 영역간의 화소값 대조도가 크지 않다는 점이다.

유방 촬영술에서는 유방 내 여러 구조물에 X-선을 투영시 켜 영상을 형성하는데, 유선 조직과 지방조직간의 X-선 감 쇠계수가 크게 다르지 않고 많은 경우에 조직들이 서로 겹 쳐있기 때문에 유선 영역과 지방 영역간의 대조가 크지 않 고 육안으로 보기에도 흐릿하여 영역 간 경계를 정하기가 어렵다. 따라서 유방 관련 전문가들조차 유방 밀도 측정에 관하여 개인 차이가 적지 않다.

또 다른 어려운 점은 유방 촬영술의 촬영 조건에 따라 유방 영상의 화소 값 히스토그램의 분포도가 달라지는 점 에 있다. 유방 영상의 화소 값은 피검자의 유방 크기와 유 방 치밀도등 신체 특성뿐 아니라, 이에 따라 가변적으로 적용되는 X-선관 전압과 관전류 및 에너지 필터, 그리고 촬영 장치에 의해 유방에 가해지는 물리적 압박력등 다수 의 요소가 상호작용한 결과물이기 때문에 같은 피검자라 할지라도 촬영시마다 화소값의 변이 폭이 적지 않다. 따라 서 유선 영역과 지방 영역을 구별할 때에도 어떤 절대적인 물리적인 지수를 적용하는 것이 곤란하고, 촬영된 유방 영 상에서 상대적인 화소값의 분포와 기존 관찰을 통하여 전 문가가 학습한 경험적인 결정규칙에 의존하여 영역 간 경 계선을 구별한다.

이러한 유방 영상 촬영술의 특징을 고려하여, 저자들은 CNN에 입력시키는 값을 화소값 그 자체보다는 유선 조 직 구성의 특징을 잘 반영할 수 있는 상대적인 값을 입력 시키는 것이 효과적일 것으로 판단하였다. 즉 전체 유방영 상의 히스토그램에서 얻는 문턱값으로 화소값을 쉬프트 시키고, 41 × 41 크기의 패치별로 데이터를 얻어 CNN에 입력시키고, 다량의 데이터로부터 자율적인 학습이 이루 어지기를 기대했다.

이번 연구에서 얻는 CNN 기반의 유방밀도와 기준 유방 밀도와의 일치율 0.77은 저자들이 이전에 연구한 집단조 직확률 기반방법의 일치율 0.94에 비하면 현저히 낮았다.

사용한 데이터가 같았고, 훈련시간이나 횟수에 특별한 제 한을 두지도 않은 것을 고려하면, 이번 실험에서 딥러닝이 보여준 성적은 애초에 저자들이 기대했던 것과는 달랐다.

딥러닝은 비선형적인 반응특성을 가지는 다수의 층으로 구성된 복잡계 모형이다. CNN을 포함하여 딥러닝 연구 의 애로점은 층과 노드의 구성, 층간의 관계설정, 입력의 설계등에서 매우 많은 조합과 경우의 수가 있다는 것이다.

사실 많은 조합중에 주어진 문제에 적절한 구조를 찾아내 는 것이 딥러닝 연구이 핵심이라고도 할 수 있겠다. 이 연 구에서는 CNN 입력의 크기를 41 × 41 패치로 하였고, 층 Fig. 6. Scatter plot of the CNN-provided automated

estimation versus the experts' estimation.

(7)

수를 16개로 하였으며, 1 - 11층에는 2 × 2 풀링과 7 × 7, 5 × 5 그리고 3 × 3 크기의 컨벌루션 커널을 적용한 반면, 12 - 16층에는 풀링을 적용하지 않았고 fully connected 된 망과 softmax 분류기를 사용하였다. 이러한 구성은 CNN에서 일반적으로 사용되는 유형을 따른 것이었으나, 층의 수나 풀링 및 컨벌루션 커널의 크기는 얼마든지 다르 게 구성할 수 있다.

이번 연구에서 저자들이 경험한 딥러닝 연구의 또 다른 애로점은 단계별 작동성 검증이 어렵다는 것이다. 저자들 의 이전 연구에서는 알고리즘의 각 단계마다 저자들이 의 도하고 설계한 바 대로 작동하는 지를 확인할 수가 있었 으며, 그렇지 않을 경우 각 단계에 관여하는 변수들을 조 정하여 의도한 작동을 이끌어 내는 것이 가능하였다. 이에 반해, 딥러닝 실험에서는 각 단계에서의 작동이 적절히 이 루어지고 있는지를 확인하는 것이 곤란하였다. 비록 반복 적인 훈련을 통하여 네트워크의 가중치들이 수렴해가고 있음을 확인 할 수는 있었으나, 그것이 종합적 성능에 적 절한 기여를 하는지를 직접적으로 확인하는 것은 곤란하 였다. 이러한 어려움 때문에, 딥러닝이 가진 잠재성이 풍 부함에도 불구하고 단시간에 성능을 향상시키지 못하였 다.

다른 한편, 이번 연구에서 얻는 일치율 0.77이 저자들의 기존연구 성과인 0.94보다 낮기는 하지만 저자들의 기존 방법은 그간 여러 연구그룹에서 발표된 알고리즘의 장단 점을 취합한 것이며, 지난 수년간 많은 반복실험을 통해 최적화한 결과였고, CNN의 결과 성적은 이러한 과정이 생략된 초기 성적임을 생각할 때, CNN은 향후 빠른 속도 로 향상된 성적을 제공할 여지가 있다고 생각된다.

이번 연구를 통해 저자들은 딥러닝이 의학영상처리에 응용될 수 있음을 확인하였으며, 딥러닝에 대한 기초적인 이해만을 가진 저자들이 시도했음에도 불구하고 유방 밀 도의 정량측정 문제에서 중급 수준의 성능을 나타냄을 확 인하였다. 딥러닝을 이용하여 기존의 방법보다 향상된 성 적을 얻기 위해서는 의학영상이 지닌 독특한 문제를 잘 이 해하며 CNN이 이 문제를 효과적으로 풀어낼 수 있도록 CNN의 구조와 학습과정을 적절히 설계하는 데 대한 보 다 깊이 이해할 수 있는 연구가 필요할 것으로 생각한다.

감사의 글

본 논문은 보건복지부 보건의료연구개발사업에 의해 부 분적으로 지원된 연구결과입니다.

(No. HI16C1127, 한국인 호발만성질환 위험예측과 질

병위험 아틀라스 구현을 통한 개인 맞춤형 예방관리서비 스모형 개발)

본 논문은 보건복지부 첨단의료기술개발사업에 의해 부 분적으로 지원된 연구결과입니다.

(No. HI14C3287, 환자맞춤 지능형 방사선피폭선량 예 측과 적정선량 안내가 가능한 차세대 방사선관리시스템 개발과 시범운영)

참 고 문 헌

1. Hinton GE, Osindero S, Teh YW. A fast learning algorithm for deep belief nets. Neural computation.

2006;18(7):1527-54.

2. Bengio Y. Learning deep architectures for AI.

Foundations and trends? in Machine Learning.

2009;2(1):1-127.

3. LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient- based learning applied to document recognition.

Proceedings of the IEEE. 1998;86(11):2278-324.

4. Krizhevsky A, Sutskever I, Hinton GE, editors.

Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems; 2012.

5. Sharif Razavian A, Azizpour H, Sullivan J, Carlsson S, editors. CNN features off-the-shelf: an astounding baseline for recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops; 2014.

6. Cire?an DC, Giusti A, Gambardella LM, Schmidhuber J, editors. Mitosis detection in breast cancer histology images with deep neural networks. International Conference on Medical Image Computing and Computer-assisted Intervention; 2013: Springer.

7. Gao M, Bagci U, Lu L, Wu A, Buty M, Shin H-C, et al. Holistic classification of CT attenuation patterns for interstitial lung diseases via deep convolutional neural networks. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization.

2016:1-6.

8. Warner E, Lockwood G, Tritchler D, Boyd N. The risk of breast cancer associated with mammographic parenchymal patterns: a meta-analysis of the published literature to examine the effect of method of classification. Cancer detection and prevention.

1991;16(1):67-72.

(8)

9. Boyd NF, Guo H, Martin LJ, Sun L, Stone J, Fishell E, et al. Mammographic density and the risk and detection of breast cancer. New England Journal of Medicine.

2007;356(3):227-36.

10. Harvey JA, Bovbjerg VE. Quantitative assessment of mammographic breast density: relationship with breast cancer risk 1. Radiology. 2004;230(1):29-41.

11. Lundstr?m E, Wilczek B, von Palffy Z, S?derqvist G, von Schoultz B. Mammographic breast density during hormone replacement therapy: differences according to treatment. American journal of obstetrics and gynecology. 1999;181(2):348-52.

12. Bakic PR, Carton A-K, Kontos D, Zhang C, Troxel AB, Maidment AD. Breast Percent Density: Estimation on Digital Mammograms and Central Tomosynthesis Projections 1. Radiology. 2009;252(1):40-9.

13. Kim Y, Hong BW, Kim SJ, Kim JH. A population- based tissue probability map-driven level set method for fully automated mammographic density estimations.

Medical physics. 2014;41(7):071905.

14. Kingma D, Ba J. Adam: A method for stochastic optimization. arXiv preprint arXiv:14126980. 2014.

15. Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C, et al. Tensorflow: Large-scale machine learning on heterogeneous distributed systems. arXiv preprint arXiv:160304467. 2016.

16. LeCun Y, Cortes C, Burges CJ. The MNIST database of handwritten digits. 1998.

17. Russakovsky O, Deng J, Su H, Krause J, Satheesh S, Ma S, et al. Imagenet large scale visual recognition challenge. International Journal of Computer Vision.

2015;115(3):211-52.

대한의학영상정보학회지│2016;22:1-8

=초록=

배경: 딥러닝(Deep learning)은 최근 강력한 머신러닝 기술로서 부상하였으며, 영상 인식, 음성 인식 그리고 데이터 분석 등 다양한 분야에 응용성이 인정되며, 의학 영상 처리 분야에도 큰 잠재성을 가지고 있다. 이 연 구에서는 컨볼루션 네트워크(Convolutional neural network, CNN)를 사용하여 유방영상에서 유방 밀도를 추출하는 저자들의 실험적 연구를 제시한다.

재료 및 방법: 상하촬영식 디지털 유방 영상 397장을 사용하였으며, 이 중 297장은 훈련 집합으로, 100장은 테 스트 집합으로 사용되었으며 3명의 유방영상 전문가가 훈련 집합에서의 유선 영역과 지방 영역의 경계선을 결정하였다. 훈련 집합의 경계선이 결정되면 각 유선 영역과 지방 영역 내에서 사각형 패치를 추출하여 CNN 에 입력 학습시켰다.

결과: CNN으로 추출한 100장의 유방조영상의 유방 밀도와 3명의 전문가가 수동으로 측정한 유방 밀도와의 상관도는 0.77이었다.

결론: 저자들은 유방영상에서 유방밀도를 추출하는 문제에 CNN을 훈련시킬수 있었다. 딥러닝은 충분한 량의 데이터와 적절한 훈련을 통하여 성능이 향상되는 능력을 가졌으므로, 향후 딥러닝에 관한 폭넓은 경험과 더 많은 의료 영상 데이터베이스의 활용으로 성적이 향상될 수 있을 것으로 기대된다.