Bioinformatics/└ 기타

Alpha Diversity 지수 정리

김해김씨99대손 2022. 5. 25. 11:44

- 수정  2023-03-22 : 오개념 수정


 

 

 

🟦 Alpha diversity란? 

- Alpha diversity는 한 sample내의 종 다양성을 말한다. Alpha diversity를 이해하기 위해 아래 데이터를 사용해보자. 이 데이터는 한 바다에 5종의 생물이 발견되었음을 가정한다. 

Species Number (n) n(n-1) p pInp p^2
Sea holly 2 2 0.1333333 -0.26862 0.017769
Sand couch 8 56 0.5333333 -0.33527 0.284409
Sea bindweed 1 0 0.0666666 -0.18042 0.004436 
Sporobolus pungens 1 0 0.0666666 -0.18042 0.004436 
Echinophora spinosa 3 6 0.2 -0.32189 0.04
Total 15  64 1 -1.2866 0.35105

    - Number(n) : 해당하는 종이 몇 개체나 발견 되었는가

    - p : 상대적인 풍부도, 각 값을 전체 대체의 수로 나눈다  = n/ total_number 

 

 

그렇다면 이 바다가 다양성이 높다고 할 수 있을까? 이는 다양한 alpha diversity를 측정하는 지수, 지표로 부터 알 수 있다.

한 샘플에서의 다양도를 측정하는 지수는 다양도, 풍부도, 집중도, 균등도 등이 있다.

먼저 풍부도 지수 먼저 살펴보자. 

 

 

🟦 Margalef 's Richness index ,  종 풍부도 지수

- 가장 단순한 Richness는 가장 간단한 풍부도 지수로, 단순히 그 환경(샘플)에서  관찰된 종의 수(observed richness)를 말한다. 그러나 이는 종의 풍부도를 과소평가(각 종이 "얼마나" 존재하는지는 따지지 않음으로)하는 경향이 있다. 

- 풍부도 지수 중 Margalef(1958)의 종 풍부도는 각 개체의 값으로 나누여 값을 표준화 해준다.   

 

 

$$ R' = \frac{(S-1)}{Iog (N)} $$

- S : 종의 총 합

- N : 존재하는 개체의 합   

 

위 예제 데이터에서 종의 풍부도 R'은 (5-1)/Iog(15) =  약 1.4771 값이다. 

 

+) 또 다른 richness는 개체의 총 수를 고려하지 않고, 종의 총 수(즉 5값)만 가지는 지수도 있다. 

 

 

🟦 Pielou's evenness index ,  종 균등도 지수 

- 종 균등조 지수는 단순히 종이 존재하는지 아닌지를 따지는 풍부도와 다르게, 그 종이 얼마나 존재하는지를 고려한다. 균등도는 여러가지가 있지만 일반적인 균등도는 Pielou’s evenness(1975)를 뜻한다.  이는 shannon diversity를 observed richness(풍부도)로 나눈 값이다. 

 

$$ J' = \frac{H'}{H'_{max}} $$ 

H'는 shannon index를 말하며 H'max는 모두 비슷하다는걸 가정할 때H'값의 가능한 최대 값을 말하며 아래와 같다.

 

- S : 종의 총 수

$$ J' = \frac{H'}{In S}$$

 

위 예제데이터에서 Pielou의 균등도 값은 J'는 약 0.79940이다.

이 값은 0에서 1 사이값을 보이며, 값이 작을 수록 균등도가 높다.

 

 

🟦 Shannon-Wienner index , 종 다양도 지수(샤넌 지수)

$$ H' = - \sum^S_{i=1} p_i  \textrm{in} p_i $$

- pi : i 번째 종 비율

- S  : 군집의 종 수

한 종만 존재하면 S = 1, Pi = 1, 즉 H = 0, 0일 수록 종 풍부도가 낮다

위의 예시에서 shannon index는 1.2866이다 

 

🟦 Simpson index , 종 집중도 지수(심슨 지수)

$$ D = \sum P_i^2 =   \sum (\frac{n(n-1)}{N(N-1)}) $$

D는 0~1 값을 가지며, 클수록 다양성이 낮다

위 예시에서 D = 0.35105

 

 

🟦 Gini-Simpson = Simpson's index of diversity  

$$  1-D = 1 - \sum P_i^2 =  1-  \sum (\frac{n(n-1)}{N(N-1)}) $$

0일 수록 다양성이 낮고 1일 수록 높다 

위 예시에서는 1-D = 1- 0.35105 = 0.64895 

 

 

🟦 Inverse Simpson index

$$ 1/D $$ 

위 예시에서는 1/D = 2.848597

 

 

🟦 faith's pd index 계통 다양도 지수 

-  다른 다양성 지수와 다르게  Phylogenetic diversity(pd)는 sample 내 종의 계통적 정보도 고려하여 다양성을 따진다

간단하게 말하자면, Faith’s PD는 sample내의 모든 종의 branch length의 합산으로 계산된다

 

$$ PD' = \sum l(b) $$

한 sample에서 a, b, c, d, e가 관찰되고 PD는 각각의 branch length의 합을 말한다

즉 PD = 20+5+4+2+1+5+1+3 = 42이다 

 

 

 

+) 

 

 

 

+) 여러 index를 간편하게 계산해 주는 사이트 

-  https://virtue.gmbl.se/english-content/biodiversity-calculator

원하는 종의 수를 입력하고, 얻길 원하는 index를 체크한다 .

 

예시 데이터 입력 -> Start Analyses 클릭

결과값

위 결과에서 다른 계산법을 사용한 eveness, richness 를 제외하고는 값이 동일하게 나온다.

 

 

 


🟦 Reference

https://geographyfieldwork.com/Simpson'sDiversityIndex.htm

https://en.wikipedia.org/wiki/Diversity_index#Simpson_index

https://microbiome.github.io/OMA/alpha-diversity.html

- https://danielpfaith.wordpress.com/phylogenetic-diversity/

Allen B, Kon M, Bar-Yam Y. A new phylogenetic diversity measure generalizing the shannon index and its application to phyllostomid bats. Am Nat. 2009 Aug;174(2):236-43. doi: 10.1086/600101. PMID: 19548837.

- 수학 공식 계산식 : https://www.codecogs.com/latex/eqneditor.php

반응형