전체 글 67

인코렌탈 체험, 마이크로바이옴 데이터 간단 분석 (CLC Genomics Workbench Premium , incoRENTAL)

이번에 인실리코젠에서 ‘인코렌탈’ 이라는 생물정보 분석 솔루션을 일정 기간 대여하여 사용할 수 있는 서비스를 론칭하였는데 체험해 볼 수 있는 기회가 생겨 CLC Genomics Workbench 24.0.1을 사용하여 간단하게나마 마이크로바이옴 데이터를 분석해 보면서 기존 사용 프로그램들과 비교해 보고자 합니다. # incoRENTAL 기본적으로 생물정보를 기반으로 연구하시는 많은 연구자가 CLC Genomics Workbench 또는 IPA 등의 생물정보 분석 솔루션을 자주 사용하시는 것으로 알고 있습니다. 저는 CLC Workbench 프로그램을 평소에 사용하고 있는데 가장 큰 장점은 유전체를 분석하는 데에 있어 필요한 도구들이 (trimming, assembly, taxonomic profiling..

bioinfo 2024.04.22

DNA Methylation 탐지를 위한 시퀀싱 기법

최근 후성유전학과 관련해 많은 연구들이 진행되고 있습니다. 그중에서 가장 활발하게 연구되는 부분은 DNA Methylation 인 듯합니다. DNA Methylation 은 cytosine의 5번 탄소에 메틸기가 결합하여 DNA 염기서열이 유지되면서 유전자 발현 등의 일부 기능의 변화를 매개하는 대표적인 DNA modification 입니다. ( Adenine 의 Methylation 기전도 존재합니다.) 장내 마이크로바이옴 관련해서도 이러한 메틸화와의 상관관계를 연구하는 논문들이 출판되고 있는데 그 중심에는 DNA Methlyation 을 촉매하고 유전자 발현을 조절하는 효소인 DNA methyltransferases (DNMTs) 가 있습니다. 해당 효소는 장내 존재하는 일부 영양성분의 가용 여부에 ..

bioinfo 2024.04.07

Proksee (visualization & annotation with Prokka)

세균의 유전체 분석을 하다 보면 아래와 같은 원형 유전체 지도로 시각화하는 것들을 자주 볼 수 있습니다. 이와 같은 그림으로 시각화할 수 있게 해주는 도구 중에 간편하게 접근가능한 Proksee 라는 도구가 있는데요, 이러한 시각화뿐만 아니라 Prokka 등의 다른 소프트웨어가 해당 도구에 통합되어 있어 다양한 분석까지 쉽게 수행할 수 있게 해 줍니다.       Proksee - Genome AnalysisProksee is an expert system for genome assembly, annotation and visualization. To begin using Proksee, provide a complete genome sequence, sequencing reads or a CGView/..

기타 2024.02.04

분변 내 엑소좀 분리

이전 포스팅을 통해 장내 미생물 군집에서 유래한 엑소좀들이 위장관 질병에 다양한 방식으로 관여한다는 것을 확인하였습니다. 장내 미생물 군집에서 유래한 엑소좀에 다양한 곳으로 이동하여 영향을 주는 것이 알려져 있지만 (위장관, 간 등) 이런 부분의 샘플을 확보하는 것은 상당히 어렵습니다. 이런 어려움은 사실 장내 미생물 군집 자체를 샘플링하는 것에도 존재하는데, 장내 미생물의 가장 확실한 확인 방법은 장 상피 세포를 채취하여 DNA 를 추출하는 것이지만 이런 방식으로 샘플을 채취하는 것은 현실적으로 어려움이 있어 분변 샘플을 채취함으로써 그를 대체하고 있습니다. 그렇기에 장내 미생물 군집에서 유래하는 엑소좀도 분변을 채취하여 분석할 수 있는지에 대해 찾아보고 싶었고 몇 가지 논문들을 참고하여 포스팅합니다...

기타 2024.02.02

마이크로바이옴 + 대사체 데이터 기계학습

마이크로바이옴 데이터를 가지고 기계학습 모델에 학습시켰을 때 경험상 나타나는 가장 큰 문제는 과적합입니다. 샘플의 수가 충분하지 않은 점 (사람의 분변에서 데이터를 얻는데 백 명, 천명 단위의 데이터를 얻는 게 쉽지 않습니다.) + 데이터 특성상 feature 의 수가 상당히 많은 것 그중 대부분이 0 또는 그에 가까운 아주 작은 값을 갖는다는 점 등이 주요한 이유라고 생각됩니다. 그래서 마이크로바이옴 데이터만으로는 성능 좋은 모델을 만들기 어렵다고 생각하였고 mass spec 사용해서 확보한 대사체 데이터를 함께 사용했을때 조금 더 좋은 예측모델을 만들 수 있지 않을까 생각하여해 보기로 했습니다. 일단 데이터를 전처리 하는 과정에서 몇개의 분기점들이 있었는데 그것들을 중심으로 결과를 보여드리겠습니다. ..

[머신러닝] 2024.01.21

phylogeny for diversity analysis (qiime2 align-to-tree-mafft-fasttree)

다양성 분석을 수행하기 전에 representative sequence 로 부터 phylogeny 를 만들어야 합니다. 이를 통해 rep-seqs 의 계통수를 계산하고 rooted tree 를 기반으로 Unifrac metrics 등을 생성할 수 있습니다. 해당 부분에 대해 qiime2 코드와 함께 알아보겠습니다. 1. Representative sequences alignment phylogeny 를 만들기 전에 multiple sequence alignment (MSA) 를 생성해야 합니다. MSA 란, 다수의 서열의 공통된 부분을 찾아 정렬하는 것입니다. MSA 는 생물학적 서열의 진화 분석을 하는데에 중요한 역할을 하며 QIIME2 에서는 MAFFT (Multiple Alignment using ..

bioinfo 2024.01.15

Exosome (엑소좀과 마이크로바이옴)

최근에 채용 공고를 조금 찾아보다가 마이크로바이옴 분야와 관련해서 엑소좀에 대한 관심이 많아진 것 같다고 느꼈습니다. 엑소좀은 세포 간 신호전달 물질로 최근 약물을 안전하게 전달할 수 있다는 것을 이점으로 주목받고 있는 세포 유래 물질입니다. 엑소좀 관련해서는 한글로 너무 잘 정리되어 있는 글이 있어 링크를 걸어놓겠습니다. 엑소좀(exosome) 개념, 역할과 향후 임상응용 엑소좀(exosome)은 세포내에서 생성되어 외부로 방출되는 소낭(extracellular vesicles, EVs)의 일종으로... blog.naver.com 오늘 주로 포스팅할 내용은 마이크로바이옴과 엑소좀을 어떻게 연관짓고 있는지에 대하여입니다. 이번 기회에 저도 자료 조사를 하면서 연구하는 것과 관련지을만한 것이 있는지 생각해..

기타 2024.01.13

MicrobiomeAnalyst Pro (웹사이트 기반 마이크로바이옴 분석)

마이크로바이옴 데이터 분석을 웹사이트 기반해서 수행할 수 있는 사이트를 간단하게만 소개하려고 포스팅합니다. MirobiomeAnalyst 라는 사이트인데 최근에 사이트가 들어가지지 않다가 MicrobiomeAnalyst Pro 라는 사이트로 들어가면 사용이 가능합니다.  MicrobiomeAnalyst-ProMicrobial Metabolomics Co-analyze microbiome & metabolomics datapro.microbiomeanalyst.ca   아래의 페이지를 가면 각 튜토리얼에 대한 설명이 있는 파워포인트 파일들을 받을 수 있습니다. 생각보다 자세하게 나와있어서 쉽게 접근할 수 있도록 잘 해놓은 것 같습니다.  MicrobiomeAnalyst-Pro pro.microbiomean..

기타 2023.12.30

Annotation (RAST)

미생물을 분리해서 전장유전체분석을 수행하면 시퀀스 정보를 획득할 수 있습니다. 그 유전체 정보를 가지고 해당 미생물이 어떤 기능을 할 수 있는지 확인하기 위해 annotation 과정을 수행하게 됩니다. Annotation 이란, 단백질 서열을 분석하여 해당 단백질들이 어떤 역할을 하는지 확인함으로써 해당 미생물을 특성을 파악하는 과정입니다. 다양한 annotation 도구들이 있지만 2008 년 개발된 RAST (Rapid Annotation using Subsystem Technology) 는 여전히 주요한 annotation 도구로 사용되고 있습니다. (일반적으로 RAST + @ 등의 조합으로 상호보완하는 식으로 진행됩니다.) 사실 RAST 사용 방법에 대해서는 많은 곳에 정리가 잘 되어있어 소개하..

bioinfo 2023.12.28

BIOM(The Biological Observeation Matrix) format

QIIME2 사용해서 분석하다 보면 biom 형식의 파일을 자주 만나볼 수 있습니다. 해당 형식에 대해 이해가 필요하다고 생각하여 간단하게 알아본 내용을 포스팅합니다. # 아래의 biom project 공식 홈페이지의 내용을 기반으로 합니다  The Biological Observation Matrix (BIOM) format — biom-format.orgThe Biological Observation Matrix (BIOM) format The BIOM file format (canonically pronounced biome) is designed to be a general-use format for representing biological sample by observation continge..

기타 2023.12.19