Ⅰ. 서 론
한국유방암 학회에서 발표한 자료에 따르면 유방암은 여 성의 주요 암 중 2위를 기록하고 있으며, 매년 유방암의 발 병률 및 유병률은 계속해서 증가하고 있다[1]. 유방의 치밀 도는 유방암 발생과 관련 있으며, 유방이 치밀할수록 유관 과 주변 조직을 둘러싸고 있는 세포가 상호작용을 일으키기 때문에 저밀도 유방에 비해 고밀도 유방에서 유방암 발병위 험이 약 4-6배 높다. 초산이 시기가 점점 늦어지고, 출산 경 험의 횟수가 적어지는 국내 여성은 외국 여성에 비해 유방 의 치밀도가 높으며 이로 인해 매년 유방암 발병률이 높아 지고 있다. 또한 같은 인종이라도 연령에 따라 치밀도가 다 르며 국내 여성의 경우 특히 30대 및 40대 가장 높은 유방 치밀도를 보인다[1]. 유방암의 진단에는 X선을 이용한 디지 털 유방촬영이 대표적이지만 높은 유방 치밀도로 인해 영상 에서 종양의 대조도가 낮으며, 유방의 모든 구조물이 중첩 되어 나타나기 때문에 종양을 검출하는데 한계가 있다[2]. 이중에너지 유방촬영은 유방을 구성하고 있는 조직의 감약 계수 차이를 극대화할 수 있는 방법으로 일반적인 단일 에 너지 유방촬영에 비해 종양의 대조도를 향상시킬 수 있다. 하지만 두 번의 X선 조사를 기반으로 하기 때문에 환자의 피폭선량이 증가한다는 단점이 있다[3,4]. 광자계수검출기 는 일반적인 X선 검출기와는 달리 입사 광자의 에너지를 구 별할 수 있으며, CdTe(Cadmium Telluride), CZT(Cadmium Zinc Telluride)와 같이 원자번호가 높은 물질로 구성되어 있기 때문에 검출효율이 높다. 뿐만 아니라 에너지 문턱값 설정을 통해 한번의 X선 조사만으로 에너지 간섭현상이 없 는 다중에너지 정보를 획득할 수 있기 때문에 피폭선량 증 가 없는 이중에너지 유방촬영이 가능하다[5-9].
현재 의료분야에서 인공지능 및 빅데이터의 활용 가능성 에 대한 관심이 증가하고 있다. 인공지능의 한 분야인 머신 러닝은 빅데이터 기반의 인공지능 학습방법으로 복잡한 알 고리즘을 이용해 대량의 데이터를 분석하고, 패턴을 인식하 여 이를 바탕으로 결과를 예측하는 방법이다. 머신러닝은 크게 지도 학습, 비지도 학습, 준지도 학습, 강화 학습으로 나눌 수 있다. 그 중 지도학습의 경우 예측 데이터에 대한 결과 값을 알고 있는 경우에 학습할 수 있는 방법으로, 분류 는 전형적인 지도학습 작업이다[10]. 분류를 위한 대표적인 알고리즘에는 LDA(Linear Discriminant Analysis), SVM (Support Vector Machines) 및 KNN(K-Nearest Neighbors) 등이 있다. LDA는 훈련 데이터를 가장 잘 분류할 수 있는 기준선을 찾고, 해당 기준선을 통해 실제 데이터를 분류해 주는 알고리즘이다. SVM은 서로 다른 분류에 속한 훈련 데 이터간의 간격이 최대가 되는 1차원 또는 2차원 기준벡터를 찾아 이를 기준으로 실제 데이터를 분류하는 알고리즘이다. KNN은 훈련 데이터 중 K개의 가장 가까운 이웃 데이터를 그룹화하고 그 빈도수에 따라 데이터를 분류하는 알고리즘 이다[11,12].
본 연구에서는 이중에너지 디지털 유방촬영에서 지도학 습 기반 머신러닝을 이용하여 데이터를 학습시킴으로써 에 너지 선택적 유방촬영의 진단 정확도를 향상시키고자 하였 다. 또한 본 연구에서 제안하는 방법을 일반적인 디지털 유 방촬영영상에서 추출하기 어려운 종양 두께에 대해서 시행 하였고, 훈련 데이터 대비 검증 데이터의 비율을 다양하게 설정하여 각 머신러닝 알고리즘을 통해 예측된 종양 두께의 정확도를 비교하였다.
Ⅱ. 대상 및 방법
1. 몬테카를로 시뮬레이션 및 영상획득조건
본 연구에서는 Gean4 Application for Tomograpic Emission(GATE) version 6.0을 이용하여 광자계수검출기 기반 유방촬영 시스템을 모사하였다[13-15]. 초점-검출기간 거리는 600 mm로 설정하였다. 검출기는 eValuator-3500 (Kromek, UK)을 기반으로 모델링되었다. eValuator-3500 검출기는 CZT 물질로 구성되어 있으며, 128×0.5×3 mm3 의 크기, 0.5×0.5 mm2의 픽셀 크기를 갖는다. 또한 5개의 에너지 문턱값을 설정할 수 있기 때문에 에너지 선택적 X- 선 영상화가 가능하다.
본 연구에서는 4개의 에너지 문턱값을 사용하여 X선 영 상을 획득하였다. 본 연구에서 모델링 한 검출기는 선형의 모양을 갖기 때문에 2차원 유방촬영영상을 획득하기 위해 검출기가 일정한 방향으로 이동 가능하도록 시뮬레이션 하 였다.
종양 두께추출에 대한 머신러닝의 가능성을 확인하기 위 해 펄스중첩과 전하공유는 고려하지 않았다. 압박된 유방을 모사하기 위해 지름 100 mm, 두께 38 mm의 반원 형태의 유방 팬텀을 모델링 하였고, 유방 팬텀을 검출기에 밀착되 도록 설정하였다. 유방 팬텀의 물질은 유선조직과 지방질로 구성하였으며, Table 1과 같이 연령에 따라 유선조직과 지 방질의 혼합비율을 다르게 하여 30대부터 80대까지 각각 72.15, 70.7, 61.1, 47, 44.55 및 41.65의 유선조직 치밀도 를 갖도록 설정하였다[16]. 유방 팬텀 내부에 위치한 종양은 지름 15 mm의 수산화인회석(Ca5(OH)(PO4)3)으로 구성하였 으며 1-4 mm의 다양한 두께로 설정하였다(Fig. 1)[17].
연속 X선 에너지 스펙트럼은 SRS-78 프로그램을 이용하 여 모사되었다[18]. X선 에너지 스펙트럼은 텅스텐 양극, 44 kVp의 관전압, 600 μAs의 관전류 및 8 mm 알루미늄 필 터를 이용하여 0.5 keV 단위로 모사되었다(Fig. 2).
입력 데이터 증가에 따른 머신러닝 정확도 향상을 확인하 기 위해 단일 에너지 및 이중 에너지 X-선 영상을 획득하였 다. 전체 X-선 에너지 스펙트럼을 이용하여 일반적인 단일 에너지 유방영상을 획득하였으며, 이중 에너지 영상 획득 시 광자계수검출기의 전기적 잡음을 최소화하기 위해 20 keV 이상의 에너지 범위를 선택적으로 설정하여 유방영상 을 획득하였다. 또한 유선조직과 종양의 선감약계수를 바탕 으로 저에너지 및 고에너지 영상 사이의 종양 대조도 차이 를 극대화하기 위해 저에너지 범위를 20-26 keV, 고에너지 범위를 38-44 keV로 설정하여 이중 에너지 유방영상을 획 득하였다(Fig. 3).
2. 머신러닝을 이용한 분류기 추출 및 정량적 평가
본 연구에서는 매트랩(MATLAB software verson 9.0 (MathWork Inc, USA)) 프로그램 기반 머신러닝을 통한 분 류 학습기를 이용하여 종양 두께 추출을 위한 분류기를 생 성하였다. 각 에너지 영상에서 6.5 mm의 반지름을 갖는 원 형 관심영역을 종양 부위에 설정하여 각 종양 두께에 대한 대조도 대 잡음비를 측정하였다. 대조도 대 잡음비는 다음 식 (1)과 같이 계산할 수 있다[19].
여기서 SBKG 및 σBKG는 각각 유선조직 신호의 평균값 과 표준편차값을 의미하며, Stumor 및 σtumot는 각각 종양 신호의 평균값과 표준편차를 의미한다. 단일 에너지 및 이 중 에너지의 각 에너지 범위에서 측정된 대조도 대 잡음비 를 머신러닝의 입력 데이터로, 각 종양의 두께를 머신러닝 의 출력 데이터로 이용하여 분류기를 생성하였다. 본 연구 에서는 설정된 종양 두께와 X선 영상에서 측정된 대조도 대 잡음비의 관계를 바탕으로 머신러닝을 이용하였기 때문 에 동일 종양 두께에 대하여 모든 연령대 X선 영상의 대조 도 대 잡음비 수준이 유사할수록, 각기 다른 종양 두께에 대해서는 X선 영상의 대조도 대 잡음비가 중첩되지 않고 분리되어 있을수록 머신러닝의 분류 정확도가 높다는 것을 의미한다.
본 연구에서 훈련과 검증 단계로 나누어서 머신러닝 알고 리즘의 정확도를 평가하였다. 또한 훈련과 검증 데이터 비 율에 따른 정확도 변화정도를 평가하기 위해 훈련 및 검증 데이터의 비율을 2:4, 3:3 및 4:2로 설정하였다. 첫 번째 세 트(set 1)는 30대와 40대, 두 번째 세트(set 2)는 30대부터 50대, 세 번째 세트(set 3)는 30대부터 60대까지의 데이터 를 훈련 데이터로 이용하였고, 각 세트에서 훈련 데이터에 포함되지 않는 데이터를 검증에 이용하였다. 분류기를 이용 한 훈련과 검증 알고리즘은 Fig. 4와 같다.
머신러닝 기반 분류기로 결정 트리(Decision Tree), 판 별 분석(Discriminant Analysis), 로지스틱 회귀(Logistic Regression), SVM, KNN 및 앙상블(Ensemble) 알고리즘 을 이용하였으며, 각 알고리즘에서 훈련을 통한 분류 기준 설정 시 1-3차의 방정식을 사용하였다. 훈련 정확도는 5-fold cross validation을 이용하여 평가되었다[20]. 전체 분류기 중 훈련 정확도가 상위 30%인 분류기만을 이용하여 검증을 진행하였으며, 각 분류기의 정확도는 식 (2)를 이용 하여 계산하였다[21].
여기서 total predictions는 예측된 전체 종양의 개수를 의미하며, correct predictions는 입력한 두께와 동일하게 예측된 종양의 개수를 의미한다.
Ⅲ. 결 과
1. 정량적 분석
Fig. 5는 각각 단일 에너지 및 이중 에너지 영상에서 잡 음, 종양 두께 및 연령 사이의 상관관계를 보여준다. 단일 에너지 영상의 평균 잡음은 저에너지 및 고에너지 영상보다 각각 약 0.15배 및 0.6배 낮은 결과를 확인하였다. 또한 단 일 에너지 및 이중 에너지 영상에서 모든 연령대에 대해 종 양의 두께가 증가할수록 잡음이 증가하는 결과를 보여준다.
Fig. 6은 단일 에너지 및 이중 에너지 영상에서 종양의 대조도 대 잡음비, 종양 두께, 연령 사이의 상관관계를 보여 준다. 단일 에너지 영상의 평균 대조도 대 잡음비는 저에너 지 및 고에너지 영상보다 각각 약 3.4 및 2.1배 높은 결과를 확인하였다. 단일 에너지 영상의 경우, 0 mm 및 1 mm 두께 의 종양에 대해서는 상호관계에 의한 분리가 확인되는 반면 나머지 두께의 종양에 대해서는 대조도 대 잡음비의 차이가 작아 분리가 되지 않는 것을 확인할 수 있다. 이는 단일 에 너지 유방영상에서는 연령에 관계없이 두꺼운 또는 대조도 대 잡음비가 높은 종양 사이의 구분이 명확하지 않다는 것 을 보여주는 결과이다.
반면, Fig. 6(b)에서 확인할 수 있는 바와 같이, 이중 에 너지 영상에서는 모든 종양 두께에 대하여 상호관계가 구분 될 뿐만 아니라 같은 두께의 종양으로 그룹화 되었다.
2. 머신러닝 기반 분류기 정확도
훈련에 사용된 22개의 전체 알고리즘 중 LDA, quadratic SVM, cubic SVM, medium gaussian SVM, fine KNN, weighted KNN 및 ensemble 총 7개의 알고리즘이 높은 훈 련 정확도를 보였으며, 해당 알고리즘을 이용하여 검증을 진행하였다. 검증에 사용된 알고리즘의 평균 훈련 정확도는 단일 에너지 및 이중 에너지 영상화 기술에 대해 각각 76% 및 99%를 보였으며, 이중 에너지 기술이 단일 에너지 기술 보다 훈련 정확도가 약 1.3배 높은 것을 확인하였다.
Fig. 7과 Fig. 8은 단일 에너지 및 이중 에너지 영상화 기 술을 이용하여 종양 두께 분류 검증에 사용된 각 알고리즘 에 대한 평균 정확도, 각 종양 두께 별 평균정확도를 보여준 다. 단일 에너지 및 이중 에너지 영상화 기술의 평균 정확도 는 각각 60% 및 96%로써 단일 에너지 대비 이중 에너지 영 상화 기술의 분류 정확도가 약 1.6배 높은 것을 확인할 수 있었다. 알고리즘별 분류 정확도는 단일 에너지 영상화 기 술의 경우 fine KNN 및 weighted KNN 알고리즘에 대해 66%의 가장 높은 정확도를, LAD 및 ensemble 알고리즘에 대해 56%의 가장 낮은 정확도를 보였다. 이중 에너지 영상 화 기술의 경우 LAD 및 ensemble 알고리즘에 대해 100%의 가장 높은 정확도를, quadratic SVM 및 cubic SVM에 대해 93%의 가장 낮은 정확도를 보였다.
각 종양 두께 별 분류 정확도는 단일 에너지 영상화 기술 의 경우 0 mm와 1 mm 종양에 대해 100% 분류 정확도를, 2 mm, 3 mm, 4 mm 종양에 대해 각각 12%, 37%, 50% 정 확도를 보였다. 반면, 이중 에너지 영상화 기술의 경우 0 mm, 1 mm, 2 mm 및 3 mm 종양에 대해 100% 분류 정확도 를, 4 mm 종양에 대해 79% 분류 정확도를 보였다.
훈련 및 검증 데이터 비율에 따른 평균 분류 정확도는 단 일 에너지 영상화 기술의 경우 set 1, set 2 및 set 3에서 각각 74.5%, 66% 및 65%의 정확도를 보임으로써 데이터 비율에 따른 분류 정확도 향상 효과는 확인할 수 없었다. 반 면, 이중 에너지 영상화 기술의 경우 set 1, set 2 및 set 3 에서 각각 95%, 97.5% 및 100%의 정확도를 확인하였다. 이 와 같은 결과는 동일한 데이터 조건에서 단일 에너지 영상 화 기술에 비해 이중 에너지 영상화 기술이 분류의 정확도 를 향상시킬 수 있다는 것을 나타낸다. 또한 이중 에너지 영 상화 기술의 경우 훈련 데이터의 양이 증가할수록 분류 정 확도는 향상된다는 것을 보여준다.
Ⅳ. 고 찰
본 연구에서는 광자계수검출기 기반 이중 에너지 스펙트 럼 유방촬영에서 머신러닝 기술을 이용한 종양 검출 및 분 류 가능성을 확인하고자 하였다. 또한 분류 정확도 평가를 통해 일반적인 단일 에너지 유방촬영 기법과의 비교를 진행 하였다.
광자계수검출기를 이용하여 한 번의 X선 조사를 통해 방 사선량의 증가 없이 이중 에너지 영상화 기법 구현이 가능 함을 확인하였다. 영상화질의 정량적 분석 결과, 단일 에너 지 영상화 기술에 비해 이중 에너지 영상화 기술을 통해 획 득한 영상의 잡음 및 대조도 대 잡음비 특성이 저하되는 것 을 확인하였다. 이는 이중 에너지 영상화 기술 구현 시 입사 되는 X선 에너지에 대한 물질의 감약 차이를 최대화하기 위 해 일부 에너지 범위만을 선택적으로 사용하였기 때문이다. 이와 같은 선택적 에너지 사용은 영상 구현에 이용되는 유 효광자수를 감소시키고, 영상에서 통계적 잡음을 증가시키 는 효과로 이어진다. 그림 3에서 확인할 수 있듯이 유방조 직과 종양의 선감약계수 차이는 고에너지 영역보다 저에너 지 영역에서 상대적으로 큼에도 불구하고, 대조도 대 잡음 비는 오히려 저에너지 영역에서 획득한 영상보다 고에너지 영역에서 약 1.6배 높은 것을 볼 수 있다(Fig. 6(b)). 이와 같은 결과는 Fig. 5(b)에서 확인할 수 있듯이 저에너지 영역 에서 획득한 영상의 잡음 수준이 고에너지 영역에서 획득한 영상보다 약 4배 크기 때문이다. 즉, 광자계수검출기 기반 이중 에너지 기술을 통해 획득한 영상은 잡음에 민감하며, 본 연구와 같이 머신러닝 기술을 이용하여 종양 검출 가능 성 및 분류 정확도를 더욱 향상시키기 위하여 denoising 처 리와 같은 추가적인 영상처리가 필요하다[22]. 잡음 특성 개선에 따른 종양 검출 정확도 결과는 추후 연구에서 다룰 예정이다.
머신러닝 기반 종양 분류 결과, 그림 7에서 볼 수 있듯이 모든 알고리즘에서 단일 에너지 기술에 비해 이중 에너지 기술의 정확도가 높았다. 단일 에너지 기술의 경우 Fig. 6(a)에서 확인할 수 있듯이 0 mm 와 1 mm 종양의 대조도 대 잡음비는 타 종양과의 분리 정도가 크지만 2 mm, 3 mm 및 4 mm 종양의 대조도 대 잡음비는 서로 매우 유사하다. 이와 같은 결과는 Fig. 8(a)에서 확인할 수 있듯이 종양 검 출 및 분류 정확도 저하로 이어진다. 반면에 이중 에너지 기 술의 경우 Fig. 6(b) 및 Fig. 8(b)에서 확인할 수 있듯이 각 종양의 대조도 대 잡음비 차이를 극대화할 수 있을 뿐만 아 니라 그에 따른 종양 검출 및 분류 정확도를 향상시킬 수 있 다.
훈련 및 검증 데이터 비율에 따른 결과에서 단일 에너지 기술의 경우 훈련 데이터 증가와 종양 분류 정확도 사이의 상관관계를 확인할 수 없었지만, 이중 에너지 기술의 경우 훈련 데이터가 증가함에 따라 종양 분류 정확도가 향상되며 set 3의 경우 모든 알고리즘에서 100% 분류 정확도를 확인 하였다. 이와 같은 결과는 머신러닝을 이용한 광자계수검출 기 기반 유방촬영에서 알고리즘 훈련 데이터의 양을 증가시 킬수록 종양 검출 및 분류 가능성을 높일 수 있다는 것을 보 여준다.
Kourou K et al.가 제시한 암 예측을 위한 머신러닝 연 구의 경우 암의 유무만을 확인하기 때문에 종양의 두께를 추출하는 데에는 한계점이 있으며, 최저 68%, 최고 100% 및 평균 82%의 정확도로 암의 유무를 예측 및 분류함으로써 최저 95%, 최고 100% 및 평균 97.5%의 분류 정확도를 보이 는 본 연구에서 제시한 이중에너지 기반 머신러닝보다 낮은 분류 정확도를 보이는 것을 알 수 있다[23]. 뿐만 아니라 본 연구에서 제시한 방법의 경우 0 cm 종양 두께를 통해 종양 의 유무를 알 수 있을 뿐만 아니라 다양한 종양의 두께를 분 류할 수 있음을 알 수 있다.
본 연구에서는 머신러닝을 이용한 에너지 선택적 유방촬 영의 진단 정확도 향상 가능성을 확인하는 것에 중점을 두 고 있기 때문에 광자계수검출기의 단점인 펄스중첩과 전하 공유는 고려하지 않았다. 펄스중첩과 전하공유는 검출기에 서 측정되는 X선 에너지 스펙트럼의 정확도를 감소시키기 때문에 본 연구결과에 대조도 감소 및 잡음 증가와 같은 영 향을 미칠 수 있을 것이다. 하지만 이 두 현상은 분석적 모 델 및 pixel binning을 통해 보정 가능하며, 추후 연구에 적 용하여 본 연구에서 제안하는 방법의 신뢰성을 더욱 향상시 킬 것이다[24]. 본 연구의 경우 유방 팬텀을 이용한 시뮬레 이션 결과이며, 동일한 유방 두께를 기반으로 연령별로 대 표적인 치밀도를 이용하여 팬텀을 모사하였기 때문에 동일 한 연령대라도 다양한 두께 및 치밀도를 가지는 실제 임상 데이터 적용 시 결과 값의 양상이 다르게 나타날 수 있다. 또한 1 mm 간격으로 종양의 두께를 분류하였기 때문에 1 mm 이하의 두께 차이를 보이는 종양에 대해서는 분류 정확 도가 상이할 것이다. 따라서 더욱 다양한 유방 두께 및 치밀 도를 고려하고, 종양 두께의 분류 간격을 세밀화하여 분류 기를 추출한다면 더욱 향상된 분류 및 진단 정확도를 보일 것으로 사료된다. 뿐만 아니라 유방 치밀도의 조합을 다양 하게 설정하여 머신러닝 알고리즘 훈련 시 적용한다면 종양 검출 및 분류 정확도를 더욱 향상 시킬 수 있을 것이라 생각 된다.
Ⅴ. 결 론
국내 여성의 높은 유방 치밀도와 유방암의 증가 추세, 구 조물의 중첩과 같은 디지털 유방영상의 한계점을 고려하였 을 때 유방암의 진단 정확도 향상은 중요하다. 의료분야에 서 인공지능의 활용을 통해 의료영상 화질 및 진단 정확도 향상을 기대할 수 있다.
본 연구에서는 유방 팬텀을 이용하여 광자계수검출기 기 반 이중에너지 디지털 유방촬영에서 종양 두께 추출을 위한 머신러닝 입력데이터를 증가시켜 평균 95% 이상의 분류 정 확도를 확인하였다. 일반적인 유방촬영에서 불가능한 종양 두께를 추출할 수 있는 방법을 제안하였으며, 추가적인 검 사 없이 실제 종양과 근사한 두께로 종양을 분류할 수 있는 데 의의가 있다.
에너지 선택적 유방촬영에서 종양 두께 추출을 위한 머신 러닝 기술은 진단 대상의 연령에 국한되지 않고 유방촬영 기술 개발 및 인공지능 기반 의료영상 진단 정확도 향상을 위한 기초자료로 활용될 수 있으며, 유방암 조기 발견에 일 조할 수 있을 것이다.