마이크로바이옴 데이터를 분석하다 보면 '거리' 의 개념을 자주 필요로 합니다. 마이크로바이옴 데이터의 특성상, 일반적인 숫자 데이터가 아닌 서로 다른 미생물로 구성되어 있기 때문에 새로운 개념을 도입합니다. '거리' 라고 하면 가장 먼저 생각나는 것은 당연히 유클리드 거리입니다. 이것을 사용해서 우리는 (1,2) 와 (4,6) 사이의 거리를 계산하여 5 라는 것을 알 수 있습니다. 그러나 우리가 알고 싶어하는 것을 단순하게 나타내보면 아래와 같습니다. 아래의 A, B 샘플 간의 거리는 어떻게 될까요? 이러한 미생물 간의 거리를 나타내기 위해서 'Unifrac distance' 라는 개념을 도입하게 됩니다. 해당 개념은 위의 예시에서 알 수 있듯이 샘플 간의 미생물 구성에 대한 차이를 계산하는데 이는 미생..