주로 박테리아를 대상으로 시퀀싱 한다고 했을 때 가장 많이 사용되는 것이 16s rRNA gene 의 variable region 을 증폭하여 short read 를 생성하는 것입니다.
16s rRNA 에는 대부분의 박테리아가 공유하는 conserved region 과 박테리아의 종류에 따라 달라지는 variable region 이 있는데 이 variable region 은 앞글자를 따서 V1 부터 V9 까지 총 9개의 구역으로 나눠져 있습니다. 아래의 그림에 잘 나타나 있습니다.
제가 아는 한 각 region 별로 어떤 장점이나 단점이 있다기보다는 어떤 기기로 시퀀싱 하느냐에 따라 증폭시키는 영역이 다르다고 알고 있습니다. short read 를 생성하는 Illumina 의 경우 V3~V4 region 또는 V4 region 을 단독으로 시퀀싱하고, long read 에 특화되었다고 알려진 pacbio 등의 기기를 사용하면 V1-V9 region 전체를 합성하여 시퀀싱 할 수 있다고 합니다.
(위의 그림처럼 각 region 을 증폭하기 위해 필요한 프라이머에 대한 정보는 어렵지 않게 얻을 수 있습니다.)
기본적으로, DNA polyermase 에 의해 합성되는 과정에서 합성되어야 하는 길이가 길수록 정확도가 감소하고 전체적인 품질이 낮아집니다. 그러므로 short read 를 생성하는 Illumina 가 V3~V4 region 에 집중하는 것을 보면, 아마 그 부분이 더욱 시퀀싱에 유리한 부분이 아닐까 생각하고 있습니다.
실제 그런 variable region 의 변화에 따라 시퀀싱 양상이 변화하는지 알아보고자 관련 논문을 찾아봤는데 몇 개의 논문을 찾을 수 있었습니다.
위 논문에서는 폐 샘플의 마이크로바이옴을 확인하였는데, V1-V2, V3-V4, V5-V7, V7-V9 을 각각 증폭하여 시퀀싱 결과를 비교하였습니다.
먼저, 미생물 군집 내 다양성의 측면에서 V3-V4 region 의 풍부도가 가장 높은 것을 확인할 수 있습니다. 직관적으로 해석해 보면 가장 많은 종류의 미생물이 잡힌다고 생각할 수 있습니다. 그러한 관점에서는 V1-V2 region 이 그다음으로 성능이 좋다고 할 수 있습니다.
beta diversity 결과를 통해서는 어느 정도 유의한 클러스터의 분류가 확인되었습니다.
추가로, 실제 taxa plot 을 통해 각 미생물 분류군 간의 차이가 있는지 확인하였습니다. 사실 폐의 마이크로바이옴에 대해서 아는 바가 전혀 없기 때문에 어떤 양상이 나타나는 것이 좋은지 알 수가 없었습니다. 논문 상에서는 해당 샘플을 우점하는 genus 는 Pseudomonas 이기 때문에 가장 좋은 해상도를 보여준 것은 V1-V2 라고 결론짓고 있습니다.
이런 부분에 대해서는 장 또는 분변 샘플로도 한번 실험해 보면 재밌을 것 같다고 생각하였고 추가로 하나 더 논문을 찾을 수 있었습니다.
이 논문에서는 분변 샘플의 마이크로바이옴을 V1-V2, V3-V4, V4 region 을 각각 증폭하여 시퀀싱 수행했고 그 결과를 비교하였습니다.
바로 결과 데이터를 확인해 보면,
항상 우점하고 있는 Bacteroidales 는 모든 그룹에서 많이 잡히는 걸 볼 수 있습니다.
다만 조금 특이한 건 Bifidobacteriales 가 V3-V4, V4 region 을 증폭했을 때 많이 보입니다. 장 내의 비피도박테리움을 확인하는 부분에 초점이 맞춰질 때가 많아서 이런 건 확실히 V4 region 쪽을 증폭하는게 유리할 것 같습니다.
그렇게 많은 차이는 아니지만 확실히 패턴이 보이는 부분이 있고 V4 region 을 증폭하면 장내 미생물을 해석하는 데 있어서 중요한 비피도박테리움을 더 많이 확인할 수 있기에 좋은 선택인 것 같습니다.
이렇게 하나씩 확인해 보면, Enterobacteriaceae 쪽이 V1-V2 region 을 증폭했을 때 더 많이 확인되는 것도 보이네요.
논문의 결론 부분에서는 어떤 것이 좋다 나쁘다 보다는 어떤 variable region 을 증폭하냐에 따라 결과가 상이하게 나타나는 부분이 있고, 이것을 극복하기 위해서는 pacbio 등의 long read 를 생성하는 시퀀싱 기법이 빠르게 발전하고 있기 때문에 이런 쪽으로 고려해 보는 것이 좋을 것 같다고 합니다.
# reference
1) López-Aladid, Ruben, et al. "Determining the most accurate 16S rRNA hypervariable region for taxonomic identification from respiratory samples." Scientific Reports 13.1 (2023): 3974.
2) Chen, Zigui, et al. "Impact of preservation method and 16S rRNA hypervariable region on gut microbiota profiling." Msystems 4.1 (2019): 10-1128.
3) https://www.cd-genomics.com/blog/why-do-we-perform-16s-rrna-sequencing/
'기타' 카테고리의 다른 글
Gut Microbiota and SCFA (1) | 2023.11.25 |
---|---|
마이크로바이옴 데이터의 시각화 (taxa plot) (0) | 2023.11.11 |
FDR (false discovery rate) (0) | 2023.11.03 |
qiime2-2023.9 업데이트 내용 (1) | 2023.10.14 |
Intestinal Permeability : 3 (Intestinal permeability related proteins) (0) | 2023.10.02 |