[머신러닝]

[머신러닝] CNN 을 사용한 마이크로바이옴 데이터의 분류 (T2D vs healthy)

" " 2023. 11. 26. 20:18

 
오늘은 마이크로바이옴 데이터를 CNN 을 사용하여 학습, T2D 환자를 분류하는 논문이 있어서 해당 아이디어를 소개하고자 가져왔습니다.
 

Classification of Microbiome Data from Type 2 Diabetes Mellitus Individuals with Deep Learning Image Recognition

Microbiomic analysis of human gut samples is a beneficial tool to examine the general well-being and various health conditions. The balance of the intestinal flora is important to prevent chronic gut infections and adiposity, as well as pathological altera

www.mdpi.com

 
 
먼저 간단하게 T2D 관련해서 찾아보면 다음과 같습니다. 기본적으로 장내 미생물 군집이 비만과 깊은 관련이 있다는 것은 어느 정도 받아들여진 것 같습니다. 그렇기에 비만도와 높은 관련이 있는 T2D 또한 마이크로바이옴과 어느 정도의 관련이 있겠다고 예측해 볼 수 있습니다.

 
 
 
해당 논문을 소개하고 싶었던 이유는 CNN 을 사용하여 마이크로바이옴 데이터를 숫자 데이터의 형태로 학습시키는 것이 아닌 그림의 형태로 학습시켰다는 부분의 아이디어가 괜찮다고 생각했기 때문입니다.
 
relative abundance 를 python 사용하여 heatmap 으로 변환하였습니다. 변환시킨 그림을 resNet-50 (CNN) 에 학습시켜 T2D group, healthy group 을 분류하도록 하였습니다.
 

 
 
 
그 결과 꽤 높은 정확도와 특이도, 민감도를 보여줬습니다. (n=946) 
해당 논문에서는 기본적인 숫자 데이터로 RF, SVM 등을 수행했을 때 보다 더 좋은 성능을 보여줬다고 합니다.

 
 
# reference
 
1) Pfeil, Juliane, et al. "Classification of Microbiome Data from Type 2 Diabetes Mellitus Individuals with Deep Learning Image Recognition." Big Data and Cognitive Computing 7.1 (2023): 51.