물리학과 첨단기술

특집

물리학과 첨단분석법: KIST 특성분석데이터센터

딥러닝 기반 첨단분석법

작성자 : 임민아·임수연·박수형·김홍규 ㅣ 등록일 : 2023-07-12 ㅣ 조회수 : 3,352 ㅣ DOI : 10.3938/PhiT.32.020

저자약력

임민아 연구원은 XPS 스펙트럼의 원소 자동정량 딥러닝 모델 개발 연구를 수행하여 2023년 고려대학교 산업경영공학과에서 공학 석사를 취득하였다. (mina1203@kist.re.kr)

임수연 연구원은 TEM 스펙트럼을 이용한 소재공간군 판단 딥러닝 모델 개발 연구를 수행하여 2023년 고려대학교 산업경영공학과에서 공학 석사를 취득하였다. (yeen0707@kist.re.kr)

박수형 선임연구원은 2019년 연세대학교 물리학과에서 이학박사를 취득하고, 헬름홀츠연구소 및 훔볼트대학(독일)의 박사후연구원 과정을 거쳐, 2019년부터 한국과학기술연구원의 특성분석·데이터센터에 재직 중이다. (soohyung.park@kist.re.kr)

김홍규 책임연구원은 2017년 고려대학교 신소재공학으로 공학 박사 학위를 취득했고, 2017년부터 한국과학기술연구원 특성분석센터에서 박사후 연구원으로 근무한 후, 2018년부터 동기관 특성분석‧데이터센터에서 책임연구원으로 재직 중이다. 딥러닝을 이용한 측정‧분석데이터의 자동해석 연구를 수행 중이다. (hkkim@kist.re.kr)

Advanced Analysis Using Deep Learning Method

Mina LIM, Sooyeon LIM, Soohyung PARK and Hong-Kyu KIM

X-ray Photoelectron Spectroscopy (XPS) is an important analytical method utilized to determine not only the electronic structure of a material, but also the elemental content of the material. However, it requires a high level of expertise to interpret XPS data, and the reliability of XPS analysis depends on the competence of the expert. To overcome these challenges, this article introduces the process of developing a deep learning model that can automatically interpret XPS data without human intervention. Furthermore, by understanding how a deep learning model can quantify elemental content in a spectrum, we provide insights into XPS analysis methods and the interpretation of the spectrum itself.

들어가며

2016년 알파고(AlphaGo)1)와 이세돌의 세기의 대결은 인류에게 큰 충격을 안겨주었다. 그동안 인공지능 기술은 주로 경우의 수를 계산하는 방식에 의존하였기 때문에, 우주에 존재하는 원자 수보다 경우의 수가 많다고 알려져 있는 바둑이 인공지능에 의해 정복되는 순간이었기 때문이다. 유전알고리즘, 의사결정나무알고리즘, 신경망알고리즘 등 모든 경우의 수 계산에서 벗어나기 위한 다양한 방법들이 연구개발되어 왔으나, 이러한 알고리즘들의 조합을 통해 해당 분야의 전문가와 유사하거나 그 이상의 능력을 구현할 수 있음을 증명해보인 순간이었다. 알파고에 의한 인공지능 기술의 실증은 단순히 그동안 불가능이라고 여겨졌던 분야가 인공지능에 의해 정복되었다라는 사실 그 이상의 것을 암시한다. 온전히 인간의 것이라고 여겨지고 있던 감각적인 추론 능력이 수치화될 수 있으며 연산될 수 있다는 사실이다. 다시 말해, 인간이 수행하는 모든 일들을 인공지능으로 대체할 수 있다는 사실을 내포하고 있는 것이다. 최근, 소설가, 기자, 화가 등 창작의 영역까지 인공지능 기술이 정복해가고 있는 모습들이 이러한 사실을 증명한다.

인공지능 기술에 대한 파급력은 측정·분석분야를 포함한 과학기술 연구분야에도 빠르게 퍼져나가고 있다. 측정·분석장비를 이용하여 소재의 구조·물성 등을 측정하는 기술은 나날이 발전하고 있음에도 불구하고, 측정한 결과물을 해석하는 기술은 오랜 기간 제자리걸음에 멈추어 왔다. 측정결과를 처리하는 기술은 크게 두 범주로 나눌 수 있는데, 첫 번째는 신호·이미지 처리 기술이며 나머지는 각 측정과정의 물리적 이론에 근거한 수학적‧물리적 수식에 의한 처리 기술이다. 이러한 두 범주의 데이터 처리 기술들은 모두 수학적 계산에 의한 연산처리에 의존적이다. 정해진 틀에서 주어진 수식에 의한 연산만 수행하기 때문에, 인간의 판단 없이는 데이터 처리가 불가능해지는 순간에 도달하게 된다. 이는 기존 경우의 수 연산에 의존적이었던 과거의 인공지능 기술과 동일한 상황이다. 하지만, 앞서 언급한 바와 같이, 최근 소개된 다양한 추론형 인공지능 기술을 적용함으로써 인간의 판단 혹은 추론이 필요한 부분까지 기계화할 수 있게 됨에 따라 측정‧분석데이터의 처리 혹은 해석의 전 과정을 자동화할 수 있는 시대적 환경이 주어진 셈이다. 이러한 연구 패러다임의 변화에 발맞추어, 한국과학기술연구원(KIST) 특성분석‧데이터센터에서는 전자현미경, X-선 회절분석, X-선 광전자분광법 등 다양한 측정‧분석장비에서 생산되는 데이터를 기반으로 한 딥러닝 기술을 개발하고 있다. 본 특집호에서는 특성분석‧데이터센터에서 연구개발 중인 다양한 인공지능 기술 중 X-선 광전자분석법(X-ray photoelectron spectroscopy, XPS)에 적용된 기술에 관하여 소개하고자 한다.

서 론

XPS는 소재의 전자구조를 관찰하기 위하여 활용되는 가장 활용도가 높은 분석 장비 중 하나이다. XPS 측정을 통하여 원소별로 산화가(valence electron)의 변화를 관찰할 수 있을 뿐만 아니라, 밴드구조(band structure)를 직접적으로 관찰할 수 있어 소재 분석에 중요한 역할을 수행한다. 뿐만 아니라 소재의 표면을 구성하는 원소별 정량분석을 수행할 수 있어, 소재의 기초조사를 위한 정량분석이나 샘플의 두께에 따른 조성 차이를 분석하기 위하여 활용된다. XPS 측정결과 스펙트럼에서 나타난 피크(peak)의 위치(binding energy)는 원소의 종류와 직접적으로 연관되며 피크의 높이 혹은 면적(intensity)은 해당 원소의 함량과 연관되어 있다. 따라서, XPS 측정결과 스펙트럼만으로 어떤 원소가 얼마나 존재하는지를 정량적으로 연산할 수 있어야 하나, 서로 다른 원소에서 발생한 피크가 오버랩될 때가 있어 샘플 내에 어떤 원소가 있는지에 대한 사전정보 혹은 전문가의 개입 없이는 정량분석이 어려운 경우가 발생하기도 한다.

XPS 스펙트럼을 온전히 분석하기 위해서는 (1) 높은 숙련도의 전문 지식을 요구한다. 앞서 언급한 바와 같이, 스펙트럼에 존재하는 피크에 오버랩이 발생할 경우, 이에 대한 해석은 사람의 판단에 의존적이다. 판단하는 사람의 숙련도에 따라 잘못된 해석 결과가 발생할 수 있게 된다. 또한, (2) 측정결과의 품질(signal-to-noise ratio 등)과 원소간 화학결합에 의하여 발생한 피크의 chemical shift 등이 원소정량 해석에 어려움으로 존재하기도 한다. 또는, 장비 및 샘플의 상태에 따라 노이즈(noise), 백그라운드(background)가 서로 다르게 발생하여 사람의 개입 없이 상용 소프트웨어만을 활용한 해석이 불가능해지기도 한다.

Fig. 1. Schematic of the deep learning process for automatic elemental quantification from XPS measurement data.

이 글에서는, 이러한 난관을 극복하기 위하여, 원소별 함량을 정량하기 위한 XPS 측정 결과 스펙트럼을 이용하여 인간의 개입 없이 자동으로 해석하는 딥러닝 기술을 소개한다(그림 1). 개발된 모델은 99% 이상의 정확도로 원소별 함량을 예측할 수 있었으며, 전문가에 비하여 비슷하거나 더 우수한 해석 능력을 나타내었다. 그리고, 설명 가능한 인공지능 기법을 일부 차용하여 인공지능 모델이 어떤 원리로 원소정량을 수행하는가에 대하여 토의하고자 한다.

딥러닝 모델 훈련데이터셋 구축

Fig. 2. The process of generating training dataset with different hypothetical compositions using pure material XPS data.

원소별 함량을 정량하기 위하여 0‒1300 eV 범위로 측정한 XPS 데이터를 활용하였다. 다양한 조성의 소재를 포괄적으로 포용할 수 있는 인공지능 모델 개발을 위하여, 순물질의 XPS 측정결과를 조합하여 가상의 데이터를 생산하는 방식으로 딥러닝 모델 훈련데이터셋을 구축하였다. 이를 위하여 원자번호 3번부터 81번까지의 순물질을 준비하였으며, 표면의 탄화물 오염층을 제거하기 위하여 측정 전 sputtering treatment한 후 순물질의 XPS 측정을 수행하였다. 이렇게 구축한 순물질 XPS 측정데이터를 이용하여, 2‒5개 원소로 구성된 가상의 XPS 데이터셋을 생성하였다. 가상의 조성을 갖는 소재의 XPS 데이터는 Atomic Sensitivity Factor (ASF)를 고려하여 순물질 데이터의 선형 합을 통하여 생성하였다. 이렇게 합성한 데이터는 실제 측정데이터와는 달리 스펙트럼 내 노이즈, 백그라운드, SNR 및 chemical shift 요소가 반영되어 있지 않다. 따라서 이러한 요소들을 고려하여, (1) 원소 2‒5개로 구성된 랜덤한 조성을 갖는 가상의 소재, (2) 다양한 수준의 랜덤한 노이즈, (3) 다양한 수준의 백그라운드, (4) 실험데이터에서 추출한 평균적인 SNR 수치, (5) 원소별 발생할 수 있는 평균적인 chemical shift의 5가지 요소를 랜덤하게 반영하여 학습용 데이터셋의 개수를 증폭시켰다(그림 2).

딥러닝 모델 선정

스펙트럼 데이터셋으로부터 효율적인 특징(feature) 추출을 수행하기 위하여 합성곱 신경망(convolutional neural network, CNN) 알고리즘에 기반한 딥러닝 모델을 선정하였다. 모델 아키텍쳐에 따라 특징 추출 능력에 차이가 있어 이에 따른 정확도의 변화가 발생할 수 있기 때문에, (1) 일반적인 CNN 구조, (2) GoogLeNet-Inception V3, (3) ResNet-27 모델 등 다양한 모델에 동일한 데이터셋을 학습시켜 정확도에 대한 비교를 수행하였다. 각 모델에서는 평균제곱근오차(root mean square error, RMSE)를 손실함수로 사용하였다.

\[ \mathrm{RMSE = \sqrt \frac{\sum_{i=1}^{n} ( y^\prime_\mathrm{i} - y_\mathrm{i} )^{2}}{n} }\]

여기서, i는 n개의 원소 중 특정 원소를 의미하며, \(\small \mathrm y^\prime_\mathrm{i}\)는 원소별 함량의 예측값, 는 실제값(ground truth)을 나타낸다. 또, 각 원소함량의 정량 예측값의 정확도를 단일 수치로 평가하기 위하여 다음과 같이 0부터 1 사이의 값을 갖는 맞춤형 정확도를 개발하여 적용하였다.

\[ \mathrm{Accuracy = 1- \frac{\sum | y^\prime_\mathrm{i}-y_\mathrm{i}|}{2}} \]

딥러닝 모델 정확도 평가

구축한 학습용 데이터셋을 8:2로 학습용 및 검증용 데이터셋으로 구분하였으며, 훈련된 각 딥러닝 모델별로 검증용 데이터셋의 정확도 결과와 실험적으로 측정한 약 1만여 개의 데이터셋의 정확도 결과를 표 1과 같이 나타내었다. 여기서 실험적으로 측정한 데이터셋은 상용소프트웨어의 보조로 사람의 판단에 의하여 도출된 원소함량의 정량값으로 라벨링되었다. 다만, 10여 년간 축적되는 과정에서, 숙련자와 비숙련자에 의한 라벨링 결과가 혼용되어 있다.

[Table 1] Validation and test accuracy, which are calculated with synthesized and experimental dataset respectively, of various deep learning models.

Table 1. Validation and test accuracy, which are calculated with synthesized and experimental dataset respectively, of various deep learning models.
	Validation Accuracy	Experimental Dataset Accuracy
Vanilla CNN	99.28%	90.6%
DNN	64%	30%
GoogLeNet	94%	82%
ResNet	93%	83%

DNN 모델을 제외한 일반적인 CNN, GoogLeNet (Inception V3), ResNet-27 모델 등 합성곱 신경망 계열의 모델들은 93‒99%로 높은 정확도를 나타내었다. 이는 스펙트럼 데이터로부터 특징을 추출하는 데 있어, 합성곱 방식이 유효하였다는 것을 의미한다. 다만 특이한 점은, 딥러닝 모델의 층깊이가 깊을수록 정확도가 미세하게 낮아진다는 점이다. 여기서 구축한 Vanilla CNN은 은닉층(hidden layer)이 3개로 구성된 간단한 구조로 구성되어 있었음에도 불구하고 가장 높은 정확도를 나타내었다. 반면, GoogLeNet2)과 ResNet3) 모델은 각각 18, 27개의 은닉층으로 구성되어 있으며, 앞선 결과와 종합해볼 때 은닉층 개수가 많아질수록 검증용 데이터셋의 정확도가 조금씩 낮아짐을 확인할 수 있다. XPS 데이터로부터 원소별 함량을 정량함에 있어 특징을 과도하게 추상화하는 것이 오히려 정확도를 하락시키는 요인임을 알 수 있다. 이는, XPS 데이터의 차원을 고려하면 이해할 수 있는데, 스펙트럼의 피크의 위치가 직접적으로 원소의 종류를 대표하며, 피크의 높이(intensity) 혹은 넓이가 해당 원소의 함량을 직접적으로 나타냄을 고려하면 XPS 스펙트럼 자체가 원소정량에 직접적으로 활용되기 때문에 과도한 추상화가 오히려 정량값의 오차를 발생시키는 요인이 되는 것이다. 따라서, 이렇게 딥러닝의 목적과 데이터 간의 상관관계가 직접적일수록 얕은 딥러닝 모델을 구축하는 것이 유리하다는 사실을 알 수 있다.

딥러닝 모델 작동원리 분석

Fig. 3. Local Interpretable Model-agnostic Explanations (LIME).

딥러닝 모델은 여러 은닉층으로 구성되어 있어 훈련된 모델이 어떤 방식으로 판단을 하여 예측값을 도출하는지에 대한 분석이 어렵다. 다시 말해, XPS 스펙트럼에서 어떤 피크를 기준으로 원소별 함량의 정량값을 예측하는지를 알기가 어렵다는 것이다. 여러 설명 가능한 인공지능 방법론 중 각광받는 LIME (Local Interpretable Model-agnostic Explanations)4) 방법(그림 3)을 적용하여 XPS 딥러닝 모델의 판단 기준을 엿보았다. LIME 방법론은 입력데이터를 임의로 분해하여 모델에 적용함으로써 분해된 데이터의 각 부분이 예측값에 어떻게 기여하는지를 확인하는 방법이다. XPS 스펙트럼에 이 방법론을 적용하는 것은, 스펙트럼을 구성하는 피크를 분해하여 한 개 혹은 두 개의 피크만을 모델에 입력데이터로 적용했을 때 조성 예측값 변화를 관찰함으로써 딥러닝 모델이 각 피크를 어떻게 바라보고 있는가를 확인하는 과정이다. 특히 XPS 스펙트럼의 피크는 Gaussian, Lorentzian, Voight profile로 대표할 수 있으며, 여기서는 그중 가장 간단한 Gaussian 함수를 이용하여 가상의 피크를 생성, LIME 방법론을 적용하였다. 예를 들면, 불소(flourine) 원소의 XPS 측정결과에서의 주요 피크는 30, 685, 832 eV에서 발생하며, 각 위치에 가상의 Gaussian 피크를 생성하여 훈련된 딥러닝 모델에 적용했을 때 불소 원소가 정량이 되는가, 정량이 된다면 예측값에 대한 기여도(중요도)가 얼마나 되는지를 관찰하는 식이다(그림 4).

Fig. 4. Schematic of applying the LIME methodology to the XPS deep learning model with a hypothetical gaussian peak.

Fig. 5. The quantitative predictions of elemental content that result from applying hypothetical Gaussian peaks to the deep learning model, sorted by the position of the peak representing the highest intensity of the spectrum for each element.

일반적으로 각 순물질 원소의 XPS 스펙트럼에서 높이가 가장 높은 피크가 해당 원소의 존재유무와 함량의 정량에 핵심적인 역할을 할 것으로 기대하게 된다. 이러한 피크를 활용한 판단 방식은 숙련도와 관계없이 전문가의 데이터 해석 방식이다. XPS 원소정량 딥러닝 모델도 역시 일반적으로는 이와 동일한 방식으로 데이터를 해석하고 있는 것으로 보인다. 그림 5는 가상의 Gaussian 피크를 0‒1300 eV 위치에 위치시켰을 때의 원소 함량의 정량 예측값을 각 원소의 가장 높은 피크 위치로 정렬한 그래프이다. 예를 들어, 탄소(C) 원소의 경우 285 eV에서 가장 높은 intensity를 나타내는 피크가 스펙트럼 상에서 나타나며, 이 위치에 가상의 Gaussian 피크를 입력데이터로 생성하여 딥러닝 모델에 적용하였을 때 딥러닝 모델은 탄소가 100 at%의 함량으로 존재한다고 예측하고 있다. 가장 이상적인 결과는 선형적으로 원소 함량의 정량값이 예측되는 것이다. 그림 5를 보면, 대부분의 원소 함량의 정량 예측값이 선형적으로 나타나고 있어, 딥러닝 모델도 사람과 마찬가지로 대부분의 원소 함량의 정량을 intensity가 가장 높은 피크를 이용하고 있음을 알 수 있다.

하지만, 특이하게도, Point 1과 2의 영역에서는 intensity가 가장 높은 피크를 이용하지 않고 있다. 이는, 해당 원소의 XPS 스펙트럼에서 낮은 intensity를 나타내는 피크를 기준으로 원소 함량의 정량값을 예측하고 있다는 것을 의미한다. 대표적인 예로, 카드뮴(Cd) 원소의 함량을 정량하기 위해서 딥러닝 모델은 카드뮴 XPS 스펙트럼의 406 eV에서 나타나는 가장 높은 intensity의 3d 피크를 이용하지 않고, 오히려 617 eV에서 나타나는 낮은 intensity의 3p 피크를 주로 이용하고 있음을 확인할 수 있었다. 이러한 이유는 406 eV 위치에 카드뮴 원소의 가장 높은 intensity 피크뿐만 아니라 스칸듐(Sc) 원소의 2p 피크와 오버랩되기 때문인 것으로 추측된다. 즉, 406 eV 위치에서 피크가 있을 때, 카드뮴 원소에 의해 나타난 피크인지 스칸듐 원소에 의해 나타난 피크인지 판단할 수가 없기 때문에, 딥러닝 모델은 이 위치의 피크를 스칸듐 원소로 판단하기로 결정한 것이다. 한편, 카드뮴 원소를 판단하는 가장 주요한 피크는 3p 피크로 관찰되었으며, 617 eV의 3p 피크 위치는 그 어떤 다른 원소와 겹치지 않는 피크이기 때문에 카드뮴 원소의 존재유무와 함량의 정량에 용이한 피크로 판단한 것으로 추측된다.

이러한 방식으로 딥러닝 모델이 99%의 높은 정확도로 원소 함량의 정량을 수행하는가를 모든 원소별로 살펴보았을 때, 딥러닝 모델이 매우 효율적으로 피크 위치를 배분하여 원소 함량을 정량하고 있음을 알 수 있었다. (1) 각 원소의 XPS 스펙트럼에서 가장 높은 intensity를 갖는 피크 위치가 다른 원소와 겹치지 않는다면, 해당 원소의 함량 정량은 그 원소의 가장 높은 intensity 피크 위치에 발생하는 피크의 넓이를 계산하여 정량하고 있었다. XPS 스펙트럼에서 가장 높은 intensity를 갖는 피크가 다른 원소와 겹칠 때는, (2) 해당 위치에 가장 높은 intensity 피크를 나타내는 원소를 위한 자리로 배정하였고, (3) 이미 해당 위치에 다른 원소가 배정되었다면 상대적으로 낮은 intensity 피크 위치를 그 원소의 함량 정량을 위한 위치로 배정하였다. 마지막으로, (4) 함량의 정량 위치에 대한 배정이 하나의 위치만으로 부족한 경우에는 가장 높은 intensity 피크와 상대적으로 낮은 intensity 피크의 위치까지 함께 고려하여 함량의 정량 예측을 수행하고 있음을 확인할 수 있었다.

XPS 이외에 스펙트럼에서 피크의 위치가 원소의 종류를 대표하는 경우는 다양하다. 특히, 주사전자현미경(SEM)이나 투과전자현미경(TEM)에서 주로 측정하는 에너지분산 X-선 분광법(energy-dispersive X-ray spectroscopy, EDS)이 대표적인 예이다. 일반적으로 EDS 스펙트럼 내에서 원소의 함량을 정량할때도 딥러닝 모델과 유사한 방식을 사용하고 있다. 즉, XPS 원소정량 딥러닝 모델은 단순히 XPS에 대한 특징 추출을 수행한 것이 아니라, 피크의 위치가 원소 종류 및 함량 정량에 직접적으로 연관되는 스펙트럼의 보편적인 특징을 추출한 것으로 추측된다. 따라서, 이러한 모델에 학습용 데이터셋을 EDS 스펙트럼으로 대체하는 것만으로도 높은 정확도의 모델이 개발될 것으로 예측된다.

맺음말

딥러닝 모델 개발은 컴퓨터과학(Computer Science) 분야와 도메인(Domain Science) 분야의 융복합의 연구개발이다. 컴퓨터과학 분야에서는 효율적인 학습이 가능한 모델, 특징을 잘 추출하는 모델 구조를 개발하며, 각 도메인영역에서는 필요한 데이터셋을 구축, 적절한 모델 구조를 취사선택하여 응용 모델을 개발하는 역할을 수행한다. 앞서 살펴본 것과 같이, 데이터로부터 특징을 추출하는 것은 분석장비와는 무관하며, 이는 분석장비에 따라 데이터와 모델 구조의 의존성은 크지 않음을 의미한다. 즉, 데이터와 해석 목표 간의 물리적 연관성이 유사하다면, 동일한 모델 구조로 딥러닝 모델 개발이 가능하다는 것이다. 이 글에서 소개한 딥러닝 모델 개발 과정이 소재의 다양한 측정‧분석데이터에 확장‧적용되어 소재 연구개발의 효율화에 도움이 될 수 있을 것으로 기대한다.

각주: 1)D. Silver et al., Nature 529, 484 (2016).; 2)C. Szegedy, CVPR2015 (2015).; 3)K. He, CVPR2016 (2016).; 4)M. T. Ribeiro, Knowledge Discovery and Data Mining (2016).