마이크로바이옴 데이터에 머신러닝 기법을 적용해보려 할 때 가장 먼저 생각나는 것은 Bacteroides, Prevotella, Ruminococcaceae 분류이다. (이하 B, P, R) 위의 3개의 gut microbiota phenotype 중에서 탄수화물 위주의 섭취 시 나타나는 P type 은 단백질을 많이 섭취하는 현대식단에서 찾아보기 어려운 유형이다. 실제 연구들에서도 단백질 및 동물성 지방 섭취와 관련된 B type의 수는 많지만, P type의 유형은 상대적으로 적은 경우가 적지 않게 보인다. 그런 데이터의 불균형 자체로 어떤 문제가 있는 것은 아니지만, 마이크로바이옴 데이터를 가지고 B, P, R 타입에 대해 분류를 수행할 수 있는 예측모델을 만든다고 했을때는 문제가 생길 수 있다. 데..