bioinfo

인코렌탈 체험, 마이크로바이옴 데이터 간단 분석 (CLC Genomics Workbench Premium , incoRENTAL)

" " 2024. 4. 22. 14:44

이번에 인실리코젠에서 ‘인코렌탈’ 이라는 생물정보 분석 솔루션을 일정 기간 대여하여 사용할 수 있는 서비스를 론칭하였는데 체험해 볼 수 있는 기회가 생겨 CLC Genomics Workbench 24.0.1을 사용하여 간단하게나마 마이크로바이옴 데이터를 분석해 보면서 기존 사용 프로그램들과 비교해 보고자 합니다.

 

 

 

# incoRENTAL

 

기본적으로 생물정보를 기반으로 연구하시는 많은 연구자가 CLC Genomics Workbench 또는 IPA 등의 생물정보 분석 솔루션을 자주 사용하시는 것으로 알고 있습니다.

 

저는 CLC Workbench  프로그램을 평소에 사용하고 있는데 가장 큰 장점은 유전체를 분석하는 데에 있어 필요한 도구들이 (trimming, assembly, taxonomic profiling ) 통합되어 있고 다양한 운영체제를 기반으로 그래픽 환경에서 더욱 직관적으로 데이터 분석을 진행할 수 있다는 것입니다.

 

다만 CLC Genomics Workbench의 라이선스 가격이 꽤 높게 형성되어 있어 해당 프로그램이 필요함에도 도입하지 못하거나 고민하게 되는 부분이 있습니다.

 

인실리코젠에서는 이러한 부분에서 해당 프로그램을 효율적으로 사용할 수 있도록 ‘인코렌탈’ 이라는 서비스를 론칭하였는데, 생물정보 분석에 있어 유용한 프로그램을 단기간 대여할 수 있는 서비스입니다.

 

기존 1년 단위의 라이선스를 구매했던 것 대신, 하루 단위로 구매하여 필요한 만큼만 프로그램을 대여하는 방식으로 사용할 수 있게 됩니다. 추가로, 단순 프로그램을 대여해주는 것이 아닌 해당 프로그램이 설치되어있는 클라우드를 대여해줌으로써 사용자는 편리하게 원격으로 접속하여 분석을 진행할 수 있습니다.

 

 

# CLC Genomics Workbench Premium (24.0.1)

 

이번에 제가 대여하여 사용했던 프로그램은 CLC Genomics Workbench Premium (24.0.1 version) 입니다.

 

해당 프로그램은 CLC Genomics Workbench의 확장 버전으로서 Metagenomics, Microbiome profiling, Pathogen typing, Genome-based outbreak, Single Cell Analysis, Genome finishing 분석 기능과 Hereditary NGS FASTQ에서부터 VCF까지의 과정을 초고속으로 분석하는 파이프라인을 제공합니다.

 

마이크로바이옴 데이터를 간단하게 분석해 보면서 기존의 리눅스 기반 프로그램을 사용한 분석과 비교했을 때 어떻게 차이가 나는지를 중점으로 확인해 보고자 하였습니다.

 

 

 

# microbiome data analysis (OTU clustering & diversity analysis)

 

1. Raw data import

 

 

CLC 상에서 위의 import 버튼을 누르고 시퀀싱에 사용된 플랫폼 또는 회사를 선택하면 간단하게 raw Sequencing data import 할 수 있습니다.

 

 

2. OTU clustering

 

(실제 분석이라면 adapter trimming, read assembly 등의 후가공 단계가 필요하지만, 마이크로바이옴 데이터 분석의 메인인 OTU clustering, diversity analysis에 집중하기 위해 건너뛰도록 하겠습니다.)

 

 

 

Quick launch 버튼을 누르면 위와 같이 사용할 도구를 검색하여 찾을 수 있습니다.

 


 

+ OTU가 아닌 ASV를 사용하여 분석을 진행할 수도 있습니다.

 


 

 

OTU clustering을 선택하여 분석할 데이터를 넣어주고 다음으로 넘어가면 아래와 같은 다양한 선택사항을 고르도록 되어있는데, 리눅스 상에서 다양한 파라미터를 설정하는 것을 아래와 같이 화면에서 선택함으로써 조금은 더 간단하게 조절할 수 있습니다.

 

 

이후에, 다양성 분석을 위해서는 multiple alignment -> rooted tree를 그리는 과정이 필요합니다. 이러한 분석들도 추가적인 도구의 설치 없이 간단하게 수행할 수 있습니다

 

저는 Align OTUs using MUSCLE, Maximum Likelihood Phylogeny를 사용하였습니다.

 

 

3. Diversity analysis

 

 

 

이후 해당 OTU, alignment, tree 파일을 사용하여 다양성 분석을 수행할 수 있습니다.

 

 

 

해당 도구에서도 마찬가지로, 다양한 파라미터들을 온, 오프기능으로 간단하게 조절할 수 있는 것이 가장 큰 장점인 것 같습니다.

 

(beta diversity - unweighted Unifrac distance result)

 

 

# 정리

이번에 인코렌탈 - CLC Genomics Workbench Premium을 사용하여 간단하게 마이크로바이옴 데이터를 분석해 보았습니다.

 

기본적으로 인코렌탈을 통하여 프로그램을 대여하게 되면 구글의 Chrome 원격 데스크톱과 유사한 화면공유 프로그램을 사용하여 접근할 수 있습니다.

 

이러한 방식의 장점은 클라우드를 통해 인실리코젠에 있는 분석 환경을 화면만 빌려오기 때문에 자체적으로 구축할 필요 없이 낮은 사양의 노트북으로도 쉽게 분석이 가능하다는 점입니다.

 

물론 단점도 존재하는데, 분석할 데이터를 해당 클라우드로 전송해야 하고 꺼내올 데이터 또한 자신의 노트북이나 컴퓨터로 프로그램을 사용하여 전송해 줘야 한다는 점이 조금은 까다롭게 느껴졌습니다.

 

CLC, IPA 등의 생물정보 분석 솔루션이 필요한데 1년 단위의 라이선스 구매에 부담을 느껴 구매를 주저하고 있다면 해당 서비스를 사용하여 필요시에 단기간 대여하는 방식으로 분석을 진행해 보는 것도 괜찮은 방법이라고 생각됩니다.

 

제가 대여했던 24.0.1 버전에서는 위와 같은 마이크로바이옴 분석뿐만 아니라 Pathogen typing, Genome-based outbreak, Single Cell Analysis, Genome finishing 분석 기능 등 다양한 도구를 지원하는데, 제가 만약 이러한 분석을 처음 진행해야 한다면 해당 솔루션을 단기 대여하여 분석 워크플로우를 전체적으로 이해하는 데 사용해 보는 것도 좋은 선택이 될 것 같습니다.

 

 

'해당 포스팅은 업체로부터 제품과 원고료를 지원받아 실제 사용한 후기를 작성하였습니다.'