🟦 간단 요약
[RNA-seq Data 결과 해석]
Fold change > 0 : 발현 증가
Fold change < 0 : 발현 감소
P-value : 분포 양상이 통계적으로 유의하게 차이가 나는지 ( p-value < 0.05 -> 유의)
🟦 Fold change와 p-value의 차이
Fold change는 크기 비교이며, FDR/P-value는 분포 비교이다.
예시 이미지로 간단하게 이해해 보자.
WT(Wild Type)과 KO(Knock Otu)타입을 비교한 데이터이다.
각각 이미지에서 평균 값의 차이는 같지만, 분포양상(분산)이 다르다.
각 값의 Fold change 값이 같을 때,
위는 p value 작으며, 아래는 p value가 크다. 왜 그런가?
이는 분포가 좁은 WT과 KO 타입에서 각 값들이 우연히 겹칠 확률이 작기 때문에 p-value값이 작다.
🟦 Log2 fold change값을 쓰는 이유는?
어느정도 정규분포에 가까운 값을 얻을 수 있기 때문이다.
🟦 출처
https://biocorecrg.github.io/CRG_Bioinformatics_for_Biologists/differential_gene_expression.html
https://seqqc.wordpress.com/2015/02/16/should-you-transform-rna-seq-data-log-vst-voom/
반응형