전체 글 67

virtualbox ubuntu qiime2 설치 + 오류 해결 관련

최근에 qiime 분석을 하려고 오랜만에 우분투를 들어가려다가 애를 좀 많이 먹어서 파일들을 옮기고 가상머신을 다시 설치하였다. 그 과정에서 너무 오랜만에 설치를 하다 보니 시간이 조금 오래 걸렸고, 이번에는 조금 더 여유 있게 만들고자 RAM 용량, 하드디스크 용량을 조금 알아보고 설치하였다. 그 과정에서 한 가지 오류가 또 있었어서 나중에 같은 오류가 나면 해결하고자 기록한다. 1. 우분투 설치 오류 가상 머신을 만들고, 우분투를 설치하고 나서 자동으로 재부팅이 된다. 재부팅이 되고 나면 검은 화면에서 Enter를 누르라고 하는데 여기서 엔터를 아무리 눌러도 검은 화면에서 아무것도 바뀌지 않았다. 해당 문제 해결 방법은 1. virtualbox 관리자에서 설정 - 디스플레이 2. 그래픽 컨트롤러를 "..

기타 2023.08.27

edge effect (PCR)

최근 추출한 DNA 를 증폭하기 위해 PCR 을 수행하다가 플레이트의 가장자리 부분 well 의 PCR product 양이 PCR 수행 전과 후의 차이가 너무 많이 나는 것을 계속 확인하였습니다. 그래서 관련해서 찾아보다가 edge effect 라는 단어로 정의되는 것을 알게 되었고 관련해서 조금 공부해보았습니다. microplate 를 사용할 때 'edge effect' 란 플레이트의 가장자리 있는 웰에서 얻은 측정값이 플레이트의 중앙부분에 있는 웰에서의 측정값과 통계적으로 유의한 차이를 보이는 것을 말합니다.  실제 다음과 같은 두 가지의 주요한 증상이 나타납니다. 1. microplate 를 사용하는 것이 온도의 변화와 큰 관련이 있다면 플레이트 전체에 대한 열 전달의 차이에 의해 발생할 수 있습니..

기타 2023.08.25

제 6회 빅데이터분석기사 자격증 취득 후기

안녕하세요. 뒤늦게 작성하는 빅데이터분석기사 자격증 취득 후기입니다. 저는 빅데이터분석기사 취득을 목표로 관련 자격증인 ADSP를 먼저 취득하고 빅데이터분석기사를 준비하였는데요, 기본적으로 빅데이터분석기사 필기와 ADSP는 상당 부분 겹치는 것들이 많아 어떻게 보면 ADSP를 취득하면 빅데이터분석기사 필기를 상대적으로 수월하게 취득할 수 있다는 이점이 있지만 지금 생각하면 굳이?라는 생각이 들긴 합니다. ADSP 가 ADP 를 취득하기 위한 요건이기 때문에 ADP를 최종목표로 하신다면 ADSP -> 빅분기 -> ADP 순이 맞겠지만 ADP 취득을 목표하지 않으시는 분들이라면 굳이 ADSP를 먼저 공부할 필요가 있을까 싶습니다. 개인적으로 ADSP 는 의미가 그렇게 크지도 않고 시험의 퀄리티 자체도 높지 ..

[머신러닝] 2023.08.24

차원축소 (PCA, PCoA, LDA) in microbiome data 와 LEfSe : 2 (microbiome)

지난번 글에 이어서 LDA와 LEfSe에 대해 작성하겠습니다. # statquest 유튜브를 참고하였습니다. 3. LDA (Linear discriminant analysis)앞서 살펴봤던 PCA 와 PCoA와 유사한 방법인 것처럼 보이지만, LDA는 지도학습입니다. labeling 되어있지 않은 데이터를 가지고 수행하는 PCA와 PCoA와 달리, labeling 되어있는 데이터를 가지고 차원축소를 진행합니다. 그렇기 때문에, 각 그룹에 속하는 데이터의 seperatibility를 최대화하는 것에 목표가 있습니다.  PCA는 축에 정사영한 거리의 합이 최소가 되도록, 정사영하여 내린 점이 (0,0)으로부터 떨어진 거리가 최대가 되도록 축을 설정한다면, LDA는 그룹 내의 데이터 분산이 최소가 되도록, 그..

bioinfo 2023.08.23

차원축소 (PCA, PCoA, LDA) in microbiome data 와 LEfSe : 1 (microbiome)

저는 마이크로바이옴 관련해서 공부하기 전에 머신러닝을 먼저 공부했었습니다. 그래서 PCA 가 가장 제가 익숙한 차원축소 기법이었는데요. 최근에 마이크로바이옴 데이터를 분석하면서 주로 만난 것들은 PcoA (beta diversity plot), LDA (LEfSe) 로 차원축소를 진행하는 것을 보고 그 차이에 대해 공부해야겠다고 생각했습니다. 어렴풋하게나마 그것들의 차이에 대해 알고는 있었지만 이번에 LEfSe에 대해 자세히 공부하던 도중 한번 정리하고 넘어가면 좋을 것 같다고 생각하여 각각의 특징, 공통점이나 차이점 등을 정리해 보았습니다. # statquest 유튜브를 참고하였습니다. 0. motivation 차원 축소란, 말 그대로 차원을 축소시켜 복잡한 데이터를 단순하게 만드는 것을 말합니다. 여..

bioinfo 2023.08.21

differential abundance tools for microbiome data (상대적 풍부도)

서로 다른 그룹 간의 상대적 풍부도를 비교하는 differential abundance 분석은 마이크로바이옴 데이터가 갖는 특정 표현형에서 어떤 taxon이 중요한지, 유의한 차이가 나는 것들이 무엇인지 알기 위해서 필수적입니다. 해당 분석을 위해서 정말 다양한 분석 툴들이 있는데, 우리 연구실에서 사용하는 LEfSe 나 RNA-seq에 주로 사용되지만 마이크로바이옴 데이터를 분석하는 데에도 가끔 사용되는 DESeq2, edgeR 등이나 compositional data의 분석을 용이하게 한다는 ALDEx2, ANCOM-II 등 정말 많은 도구들이 있고 아직까지 어느 정도 혼용되고 있습니다. (LEfSe 가 가장 많이 사용되는 것으로 알고있습니다.) 다만, 앞서 언급한 것과 같이 compositional..

bioinfo 2023.08.20

OTU 와 ASV, 어떻게 ASV 는 선택되는가 (microbiome)

OTU와 ASV의 개념은 microbiome data 분석하시는 분들은 모드들 너무나 잘 알고 계실 것이라고 생각합니다. 저 역시 익숙한 개념이지만 최근에 주로 사용되는 ASV 개념에 대해 조금 더 자세히 공부해 보고자 관련 자료를 포스팅합니다. * 해당 포스팅은 Zymo research의 유튜브 영상을 참고하였습니다. - https://www.youtube.com/watch?v=azI9taClDhQ0. Motivation기본적으로 OTU 와 ASV라는 것이 왜 필요한가에 대해 알아보겠습니다. paired-end sequencing을 수행했다는 가정하에, 양쪽 방향으로 생성된 두 개의 read를 merging 하게 되면 Miseq 기준 샘플 당 평균 30,000 개 정도의 read들이 생성되게 됩니다. ..

bioinfo 2023.08.19