[RNA-seq] 4

RNA-seq 분석 : 3. read 의 mapping 및 normalization

이번에 전사체 데이터 분석을 진행해 보면서 개인적으로 공부했던 부분들, 분석 과정 등을 하나씩 올려보려고 합니다. 원래 자주 하던 분석이 아니라 중간중간 틀린 부분이 있을 수 있는데 댓글로 수정해 주시면 바로 반영하겠습니다. 이전 포스팅에서와 같이 필요에 따라 알맞은 형태의 reference genome 을 얻으면 그 위에 시퀀싱을 수행하여 얻은 수 많은 reads 들을 maping 하는 과정이 필요합니다. 이 과정은 일반적인 alignment 과정과 다르지 않고 일반적으로 프로그램을 통해 수행되기 때문에 그 과정에 대해서는 소개하지 않겠습니다. (HISAT2, STAR, Bowtie2 등) 수행하고 나면 reference genome 상에 우리의 reads 들이 mapping 되는데, 우리의 목표는 어..

[RNA-seq] 2023.11.20

# log2 fold change

이번에 전사체 데이터 분석을 진행해보면서 개인적으로 공부했던 부분들, 분석 과정 등을 하나씩 올려보려고 합니다. 원래 자주 하던 분석이 아니라 중간중간 틀린 부분이 있을 수 있는데 댓글로 수정해주시면 바로 반영하겠습니다. 아직 소개하지 않았지만 reference genome 에 시퀀싱 결과 얻은 reads 를 mapping 하면, 각 유전자를 정량할 수 있습니다. 각 유전자를 정량하여 샘플 간에 결과를 수행할 수 있는데 일반적으로 DEG 분석 (differentially expressed gene) 을 진행하게 됩니다. 그러면 RNA-seq 분석에서 주로 만날 수 있는 volcano plot 을 그릴 수 있는데요, 아래의 그림을 보시면 특별히 색깔로 표시된 점 (유전자) 들이 있습니다. 그것은 엄청나게 ..

[RNA-seq] 2023.11.17

RNA-seq 분석 : 2. reference genome 의 종류

이번에 전사체 데이터 분석을 진행해 보면서 개인적으로 공부했던 부분들, 분석 과정 등을 하나씩 올려보려고 합니다. 원래 자주 하던 분석이 아니라 중간중간 틀린 부분이 있을 수 있는데 댓글로 수정해 주시면 바로 반영하겠습니다. NGS 를 수행하여 확보한 reads 들을 실험의 대상으로 사용한 유전체 데이터에 mapping 하는 작업이 필요합니다. 해당 유전체를 기반으로 reads 들을 mapping 함으로써 보다 쉽게 alignment 를 수행하고, 유전자들의 발현량을 mapping 된 reads 수를 기반으로 측정하게 됩니다. 다만, 참조 유전체의 종류에는 여러가지가 있어서 처음에 헷갈리는 부분이 있었습니다. 그 부분에 대해 정리해 보겠습니다. 참조 유전체를 다운로드할 수 있는 여러 가지 데이터베이스들이..

[RNA-seq] 2023.11.16

RNA-seq 분석 : 1. 기본개념

이번에 전사체 데이터 분석을 진행해 보면서 개인적으로 공부했던 부분들, 분석 과정 등을 하나씩 올려보려고 합니다. 원래 자주 하던 분석이 아니라 중간중간 틀린 부분이 있을 수 있는데 댓글로 수정해 주시면 바로 반영하겠습니다. 1. RNA-seq 과 transcriptome (전사체) 가장 가본적인 부분부터 천천히 공부해보려 합니다. 그러기 위해서는 central dogma 를 다시 한번 상기시켜볼 필요가 있습니다. DNA 에서 RNA 를 합성하는 과정을 transcription (전사) 라고 합니다. 그러므로 transcriptome (전사체) 는 'mRNA 등을 포함하는 전사 과정에서 합성되는 물질들' 이라고 정의할 수 있습니다. 그럼 전사체를 시퀀싱, 분석한다는 의미는, 이 과정에서 합성된 물질 (m..

[RNA-seq] 2023.11.14