bioinfo 29

AMRFinderPlus : 항생제 내성 유전자 탐지

오늘은 균주 시퀀스 파일로부터 Antimicrobial Resistance genes 를 찾아내는데 사용할 수 있는 AMRFinder (AMRFinderPlus) 에 대해 간단하게 소개하려고 합니다. 이 프로그램을 사용하면 nucleotide sequence file 또는 protein sequence 를 .fa 형식으로 넣어주면 항생제 저항성 유전자들을 확인할 수 있으며 구동이 쉽고 어쨋든 이런 프로그램을 사용할때 가장 중요한 점은 얼마나 최신화된 데이터베이스를 기반으로 서치해주는지인데 NCBI DB 와 BLAST 를 기반으로 찾아주기 때문에 높은 신뢰도의 결과를 얻을 수 있습니다. 또한 이 툴은 뉴클레오타이드 또는 단백질 시퀀스에 point mutation 등 변형된 시퀀스에 대한 데이터도 포함하고 ..

bioinfo 2024.08.13

PICRUST2; Custom database 사용하기 - 2 (중단)

PICRUST2 에서 커스텀 데이터베이스를 사용하기 위해 필요한 것은 아래와 같습니다.  A multiple-sequence alignment (with the extension .fna or .fasta and can optionally be gzipped)A tree in newick format (extension .tre)A hidden-markov model of the multiple-sequence alignment (extension .hmm)A modelfile output by RaXmL specifying the best parameters for the tree (extension .model) 1. A multiple-sequence alignment (with the extens..

bioinfo 2024.08.03

PICRUST2; Custom database 사용하기 - 1 (중단)

마이크로바이옴 분석을 하다 보면 미생물 구성만으로는 많은 것을 말하기가 어렵습니다. 물론 특정 균주에 집중할 수도 있지만 16S 데이터의 경우 genus level 까지의 한계도 있고 전체적인 군집의 구성에 대해서는 다양성 분석 정도를 제외하면 할 수 있는 것이 많지는 않습니다.  그래서 이후에 미생물 군집의 대사경로로 넘어가는 경우가 많은 것 같습니다. 실제 질량분석기로 측정해서 어떤 대사물질들이 생성되는지도 확인할 수 있지만 PICRUST2 라는 소프트웨어를 사용하면 16S 데이터를 기반으로 대사경로를 예측, 정량해 줍니다. 물론 정확도의 차이는 있겠지만 질량분석이 가격이 조금 나가기에 하기 전에 한번 확인하는 용도로 괜찮습니다.  해당 소프트웨어에 대해서는 잘 설명되어있는 글들이 많아 참고하시면 될..

bioinfo 2024.07.28

FDR correction in LEfSe

이전에 differential abundance analysis 수행하는 것에 대한 논문리뷰를 한 적이 있습니다. 해당 논문에서 저자는 LEfSe 는 CoDa (compositional data analysis) methods 를 사용하지 않으며, FDR correction 을 지원하지 않기 때문에 사용을 지양하는 것이 좋아보인다는 언급을 마지막에 하고 있습니다. 그런데 LEfSe 는 K-W test -> wilcoxon test 로 두 번에 걸쳐 유의한 차이가 있는지 검정을 수행하는데 fdr correction 까지 수행할 필요가 있는지 궁금해서 관련 글을 찾아봤습니다. 그러다 아래의 링크에서 관련 내용을 찾을 수 있었습니다.  Multiple comparison correctingHello, I fo..

bioinfo 2024.05.12

Beta diversity - Uniform Manifold Approximation and Projection (UMAP)

마이크로바이옴 데이터를 분석할 때 자주 사용되는 분석 워크플로우는 있을 수 있지만 마이크로바이옴 데이터의 특성상 아직까지 정형화된 것은 없습니다.  데이터를 분석하는 데에 있어 다양한 도구들이 교차 사용되고 있으며 현재까지는 자신의 데이터 특성에 맞는 도구를 선택하여 시각화하고, 독자를 설득하는 방식으로 많은 분석이 진행되고 있습니다.  이와 같은 방식으로, 미생물군집의 유사도를 분석하는 베타 다양성 분석 시에도 많은 분석 알고리즘이 있는데, 오늘은 미생물군집의 베타 다양성 분석시 사용할 수 있는 Uniform Manifold Approximation and Projection (UMAP) 에 대해 간단히 소개해보려 합니다.. 미생물군집의 샘플 간 유사도를 확인할 수 있는 beta-diversity 분석..

bioinfo 2024.05.07

ECTyper - E. coli serotype identification

안녕하세요, 오늘은 E. coli 의 serotype prediction 을 간단하게 수행할 수 있는 리눅스 기반 프로그램을 소개해드리려 합니다. 최근에 많은 수의 대장균의 항원형을 확인해야할 일이 있어 많은 파일을 간단하게 처리해 주는 프로그램이 없나 찾아보다가 ECTyper 라는 프로그램을 알게 되어 수행해 본 결과 실행코드도 간단하고 많은 파일을 빠르게 처리해 줘서 공유해드릴만 하다고 생각되었습니다.   ECTyper: in silico Escherichia coli serotype and species prediction from raw and assembled whole-genome sequence datais a priority foodborne pathogen of public health ..

bioinfo 2024.04.27

인코렌탈 체험, 마이크로바이옴 데이터 간단 분석 (CLC Genomics Workbench Premium , incoRENTAL)

이번에 인실리코젠에서 ‘인코렌탈’ 이라는 생물정보 분석 솔루션을 일정 기간 대여하여 사용할 수 있는 서비스를 론칭하였는데 체험해 볼 수 있는 기회가 생겨 CLC Genomics Workbench 24.0.1을 사용하여 간단하게나마 마이크로바이옴 데이터를 분석해 보면서 기존 사용 프로그램들과 비교해 보고자 합니다. # incoRENTAL 기본적으로 생물정보를 기반으로 연구하시는 많은 연구자가 CLC Genomics Workbench 또는 IPA 등의 생물정보 분석 솔루션을 자주 사용하시는 것으로 알고 있습니다. 저는 CLC Workbench 프로그램을 평소에 사용하고 있는데 가장 큰 장점은 유전체를 분석하는 데에 있어 필요한 도구들이 (trimming, assembly, taxonomic profiling..

bioinfo 2024.04.22

DNA Methylation 탐지를 위한 시퀀싱 기법

최근 후성유전학과 관련해 많은 연구들이 진행되고 있습니다. 그중에서 가장 활발하게 연구되는 부분은 DNA Methylation 인 듯합니다. DNA Methylation 은 cytosine의 5번 탄소에 메틸기가 결합하여 DNA 염기서열이 유지되면서 유전자 발현 등의 일부 기능의 변화를 매개하는 대표적인 DNA modification 입니다. ( Adenine 의 Methylation 기전도 존재합니다.) 장내 마이크로바이옴 관련해서도 이러한 메틸화와의 상관관계를 연구하는 논문들이 출판되고 있는데 그 중심에는 DNA Methlyation 을 촉매하고 유전자 발현을 조절하는 효소인 DNA methyltransferases (DNMTs) 가 있습니다. 해당 효소는 장내 존재하는 일부 영양성분의 가용 여부에 ..

bioinfo 2024.04.07

phylogeny for diversity analysis (qiime2 align-to-tree-mafft-fasttree)

다양성 분석을 수행하기 전에 representative sequence 로 부터 phylogeny 를 만들어야 합니다. 이를 통해 rep-seqs 의 계통수를 계산하고 rooted tree 를 기반으로 Unifrac metrics 등을 생성할 수 있습니다. 해당 부분에 대해 qiime2 코드와 함께 알아보겠습니다. 1. Representative sequences alignment phylogeny 를 만들기 전에 multiple sequence alignment (MSA) 를 생성해야 합니다. MSA 란, 다수의 서열의 공통된 부분을 찾아 정렬하는 것입니다. MSA 는 생물학적 서열의 진화 분석을 하는데에 중요한 역할을 하며 QIIME2 에서는 MAFFT (Multiple Alignment using ..

bioinfo 2024.01.15

Annotation (RAST)

미생물을 분리해서 전장유전체분석을 수행하면 시퀀스 정보를 획득할 수 있습니다. 그 유전체 정보를 가지고 해당 미생물이 어떤 기능을 할 수 있는지 확인하기 위해 annotation 과정을 수행하게 됩니다. Annotation 이란, 단백질 서열을 분석하여 해당 단백질들이 어떤 역할을 하는지 확인함으로써 해당 미생물을 특성을 파악하는 과정입니다. 다양한 annotation 도구들이 있지만 2008 년 개발된 RAST (Rapid Annotation using Subsystem Technology) 는 여전히 주요한 annotation 도구로 사용되고 있습니다. (일반적으로 RAST + @ 등의 조합으로 상호보완하는 식으로 진행됩니다.) 사실 RAST 사용 방법에 대해서는 많은 곳에 정리가 잘 되어있어 소개하..

bioinfo 2023.12.28