R/R_Usage [KOR.] 11

[R.라딘] 미생물 군집 분석 [Alpha-diversity] in Rstudio

안녕하세요, 미생물 군집 분석의 기초라고 할 수 있는 다양성에 대한 포스팅이에요. 우리는 미생물들과 공존하고 있어요. 몸 속에도 수많은 미생물들이 존재하고, 담수, 토양, 공기 중에도 미생물 군집이라고 할 수 있는 집단이 있어요. 미생물 군집이 얼마나 다양하게 있는지, 그리고 얼마나 균등하게 있는지 평가하여 많은 분석과 해석이 이루어지곤 해요. 군집간의 차이는 Beta diversity를 분석하지만, 군집내의 다양성은 Alpha diversity를 이용하기도 해요. 아래는 R을 이용해서 Alpha diversity를 분석하는 방법에 대한 command 설명이에요. 1. 패키지 설치 install.packages("vegan") install.packages("ggplot2") install.package..

R/R_Usage [KOR.] 2022.11.30

R을 이용한 미생물군집 기능분석 [Tax4Fun2]

안녕하세요, 16S rRNA의 미생물 군집 분석에 자주 이용되는 detail하고 deep한 내용인 functional prediction 분석에 관한 포스팅입니다. 16S의 Functional Prediction 분석이라고 하면 유명한 tool이 3개 있어요. PICRUSt, FAPROTAX, Tax4Fun2가 있지요. 각각의 장 단점은 모두 있으나, 개인적으로 Tax4Fun2가 가장 좋다고 생각하고 있어요. 이유는 Pipeline을 보면 알 수 있는데요. 간단히 설명해서, 16S rRNA 데이터를 NCBI의 Reference Sequence (RefSeq)에 Blast하여 99 ~ 100%의 similarity를 갖는 chromosome을 불러옵니다. 해당 chromosome을 KEGG에 Blast하여..

R/R_Usage [KOR.] 2022.11.22

R을 이용한 Correlation 분석

안녕하세요, factor에 대한 상관 관계 분석에 대한 포스팅이에요. 상관 관계 분석은 다양한 분야에 이용되곤 하는데요, 저는 주로 마이크로바이옴의 박테리아와 다른 환경인자 사이에서 분석을 하곤 합니다. RStudio의 이용 패키지는 "Hmisc"을 이용해요. 아래 Step에 따라 상관 관계 분석을 해봐요. 1. 패키지 설치 install.packages("Hmisc") install.packages("xlsx") 2. 패키지 실행 library(Hmisc) library(xlsx) 3. 계산 Matrix 설정 flattenCorrMatrix

R/R_Usage [KOR.] 2022.11.15

R을 이용한 Correlation Plot "Corrplot" 시각화

안녕하세요, 두 가지 팩터에 대한 상관 관계 분석에 대한 포스팅이에요. 상관 관계 분석은 다양한 분야에 이용되곤 하는데요, 저는 주로 마이크로바이옴의 박테리아와 다른 환경인자 사이에서 분석을 하곤 합니다. RStudio의 이용 패키지는 "corrplot" 이랑 "PerformanceAnalytics" 에요. 다음 스텝에 따라 없어도 있어 보이는 시각화 그림을 만들어 보세요. 1. 패키지 설치 #+++++++++++++++++++++++++Install Packages++++++++++++++++++++++++++++++++++++# install.packages("corrplot") install.packages("PerformanceAnalytics") 2. 패키지 실행 #++++++++++++++++..

R/R_Usage [KOR.] 2022.11.14

R을 이용한 Heatmap 시각화

안녕하세요, 많은 논문에서 시각화로 쓰이는 방법 중 하나는 Heatmap이 있어요. Rstudio에서 data를 Heatmap으로 시각화하는 방법이에요. 1. 패키지 설치 # Install Library install.packages("stats") install.packages("gplots") install.packages("RColorBrewer") 2. 패키지 실행 # Loads Library library(stats) library(gplots) library(RColorBrewer) 3. Heatmap 색 설정 # Heatmap color scalegreenbluered=colorRampPalette(colors=c("white","chartreuse4","darkgreen","black"))..

R/R_Usage [KOR.] 2022.11.08

Rstudio의 working directory 디폴트 설정

안녕하세요, RStudio 작업할 때, 내가 어느 폴더에서 작업을 하고 있는지 반드시 인지하고 있어야 Output file이 어디 생성되었는지 알 수 있는데요. 이 번 포스팅은 Working Directory를 Default로 설정하는 방법에 대한 내용이에요. 1. R Studio를 실행시키면 오른쪽 아래 이런 칸이 보여요. 이 부분에서 Default 값으로 폴더를 지정할 수 있어요. 2. 상단 옵션 중에 아래와 같은 Global Option창에서 R sessions 아래 Default working directory를 설정해 주세요. 이 설정의 편리함은 R script 명령어를 저장해두고 바로 불러올 수 있다는 장점도 있어요. 3. 명령어로 설정하는 Working Directory getwd() #현재..

R/R_Usage [KOR.] 2022.11.07

R 언어 header 의미와 column 이름 지정

안녕하세요, R에서 데이터를 불러오면, header = TRUE & hearder = FALSE 이라는 문구를 종종 보입니다. 의미는 아래와 같아요. header = TRUE 행] 첫 줄을 변수로 입력하여 같이 가져온다. header = FALSE 행] 첫 줄 변수 없애고, 첫 줄부터 데이터로 가져온다. 간단하죠? header = FALSE를 입력하고, 첫 줄의 데이터로 가져온 다음, 변수 이름을 default 지정 할 수도 있어요. colnames(dataset)

R/R_Usage [KOR.] 2022.11.03

R을 이용한 ANOSIM 통계 분석

안녕하세요, Group간의 수치 차이를 통계 분석에는 대표적으로 ANOSIM, ANOVA, PERANOSIM, PERANOVA 등등이 있습니다. 이 번 포스팅에서는 Analysis of Similiarity (ANOSIM)에 대해 다뤄볼게요. 아래 Google WIKIPedia에 가면 설명은 너무 잘 되어있습니다. https://en.wikipedia.org/wiki/Analysis_of_similarities ANOSIM의 원리, 공식, 정의, 결과 값 해석이 기술되어 있습니다. 저는 R program에서 어떤 명령어를 사용하여 분석하는지 설명합니다. 패키지는 "vegan"을 이용합니다. 1. 패키지 설치 ################### Install Packages #################..

R/R_Usage [KOR.] 2022.11.03

R을 활용한 미생물 군집 3D plot (mds, pcoa)

안녕하세요, 미생물 분석에 자주 이용되는 군집 분석 중 하나는 Beta-diversity 입니다. Diversity에도 종류가 있는데 Alpha-, Beta-, Gamma- Diversity가 있죠. 차이점은 무엇일까요? alpha에서 Gamma로 갈 수록 그룹 집단이 소규모에서 대규모로 간다고 이해하시면 됩니다. Alpha diversity는 생태계에서 특정 지역 내에서 다양성 분석이며, 주로 종 개수가 표현됩니다. Beta diversity는 종의 양 변화에 따라 측정 됩니다. Gamma diversity는 지역적 스케일로 다양성이 평가됩니다. 아래 코드는 Beta diversity에 관한 분석과 3D로 시각화 하는 방법입니다. 패키지는 "rgl"과 "car"라는 패키지를 이용합니다. 아래 총 8단계..

R/R_Usage [KOR.] 2022.11.02