Alpha Diversity 지수 정리

2022. 5. 25. 11:44· Bioinformatics/└ 기타
목차
  1. 🟦 Alpha diversity란? 
  2. 🟦 Margalef 's Richness index ,  종 풍부도 지수
  3. 🟦 Pielou's evenness index ,  종 균등도 지수 
  4. 🟦 Shannon-Wienner index , 종 다양도 지수(샤넌 지수)
  5. 🟦 Simpson index , 종 집중도 지수(심슨 지수)
  6. 🟦 Gini-Simpson = Simpson's index of diversity  
  7. 🟦 Inverse Simpson index
  8. 🟦 faith's pd index 계통 다양도 지수 
  9. 🟦 Reference

- 수정  2023-03-22 : 오개념 수정


 

 

 

🟦 Alpha diversity란? 

- Alpha diversity는 한 sample내의 종 다양성을 말한다. Alpha diversity를 이해하기 위해 아래 데이터를 사용해보자. 이 데이터는 한 바다에 5종의 생물이 발견되었음을 가정한다. 

Species Number (n) n(n-1) p pInp p^2
Sea holly 2 2 0.1333333 -0.26862 0.017769
Sand couch 8 56 0.5333333 -0.33527 0.284409
Sea bindweed 1 0 0.0666666 -0.18042 0.004436 
Sporobolus pungens 1 0 0.0666666 -0.18042 0.004436 
Echinophora spinosa 3 6 0.2 -0.32189 0.04
Total 15  64 1 -1.2866 0.35105

    - Number(n) : 해당하는 종이 몇 개체나 발견 되었는가

    - p : 상대적인 풍부도, 각 값을 전체 대체의 수로 나눈다  = n/ total_number 

 

 

그렇다면 이 바다가 다양성이 높다고 할 수 있을까? 이는 다양한 alpha diversity를 측정하는 지수, 지표로 부터 알 수 있다.

한 샘플에서의 다양도를 측정하는 지수는 다양도, 풍부도, 집중도, 균등도 등이 있다.

먼저 풍부도 지수 먼저 살펴보자. 

 

 

🟦 Margalef 's Richness index ,  종 풍부도 지수

- 가장 단순한 Richness는 가장 간단한 풍부도 지수로, 단순히 그 환경(샘플)에서  관찰된 종의 수(observed richness)를 말한다. 그러나 이는 종의 풍부도를 과소평가(각 종이 "얼마나" 존재하는지는 따지지 않음으로)하는 경향이 있다. 

- 풍부도 지수 중 Margalef(1958)의 종 풍부도는 각 개체의 값으로 나누여 값을 표준화 해준다.   

 

 

$$ R' = \frac{(S-1)}{Iog (N)} $$

- S : 종의 총 합

- N : 존재하는 개체의 합   

 

위 예제 데이터에서 종의 풍부도 R'은 (5-1)/Iog(15) =  약 1.4771 값이다. 

 

+) 또 다른 richness는 개체의 총 수를 고려하지 않고, 종의 총 수(즉 5값)만 가지는 지수도 있다. 

 

 

🟦 Pielou's evenness index ,  종 균등도 지수 

- 종 균등조 지수는 단순히 종이 존재하는지 아닌지를 따지는 풍부도와 다르게, 그 종이 얼마나 존재하는지를 고려한다. 균등도는 여러가지가 있지만 일반적인 균등도는 Pielou’s evenness(1975)를 뜻한다.  이는 shannon diversity를 observed richness(풍부도)로 나눈 값이다. 

 

$$ J' = \frac{H'}{H'_{max}} $$ 

H'는 shannon index를 말하며 H'max는 모두 비슷하다는걸 가정할 때H'값의 가능한 최대 값을 말하며 아래와 같다.

 

- S : 종의 총 수

$$ J' = \frac{H'}{In S}$$

 

위 예제데이터에서 Pielou의 균등도 값은 J'는 약 0.79940이다.

이 값은 0에서 1 사이값을 보이며, 값이 작을 수록 균등도가 높다.

 

 

🟦 Shannon-Wienner index , 종 다양도 지수(샤넌 지수)

$$ H' = - \sum^S_{i=1} p_i  \textrm{in} p_i $$

- pi : i 번째 종 비율

- S  : 군집의 종 수

한 종만 존재하면 S = 1, Pi = 1, 즉 H = 0, 0일 수록 종 풍부도가 낮다

위의 예시에서 shannon index는 1.2866이다 

 

🟦 Simpson index , 종 집중도 지수(심슨 지수)

$$ D = \sum P_i^2 =   \sum (\frac{n(n-1)}{N(N-1)}) $$

D는 0~1 값을 가지며, 클수록 다양성이 낮다

위 예시에서 D = 0.35105

 

 

🟦 Gini-Simpson = Simpson's index of diversity  

$$  1-D = 1 - \sum P_i^2 =  1-  \sum (\frac{n(n-1)}{N(N-1)}) $$

0일 수록 다양성이 낮고 1일 수록 높다 

위 예시에서는 1-D = 1- 0.35105 = 0.64895 

 

 

🟦 Inverse Simpson index

$$ 1/D $$ 

위 예시에서는 1/D = 2.848597

 

 

🟦 faith's pd index 계통 다양도 지수 

-  다른 다양성 지수와 다르게  Phylogenetic diversity(pd)는 sample 내 종의 계통적 정보도 고려하여 다양성을 따진다

간단하게 말하자면, Faith’s PD는 sample내의 모든 종의 branch length의 합산으로 계산된다

 

$$ PD' = \sum l(b) $$

한 sample에서 a, b, c, d, e가 관찰되고 PD는 각각의 branch length의 합을 말한다

즉 PD = 20+5+4+2+1+5+1+3 = 42이다 

 

 

 

+) 

 

 

 

+) 여러 index를 간편하게 계산해 주는 사이트 

-  https://virtue.gmbl.se/english-content/biodiversity-calculator

원하는 종의 수를 입력하고, 얻길 원하는 index를 체크한다 .

 

예시 데이터 입력 -> Start Analyses 클릭

결과값

위 결과에서 다른 계산법을 사용한 eveness, richness 를 제외하고는 값이 동일하게 나온다.

 

 

 


🟦 Reference

- https://geographyfieldwork.com/Simpson'sDiversityIndex.htm

- https://en.wikipedia.org/wiki/Diversity_index#Simpson_index

- https://microbiome.github.io/OMA/alpha-diversity.html

- https://danielpfaith.wordpress.com/phylogenetic-diversity/

- Allen B, Kon M, Bar-Yam Y. A new phylogenetic diversity measure generalizing the shannon index and its application to phyllostomid bats. Am Nat. 2009 Aug;174(2):236-43. doi: 10.1086/600101. PMID: 19548837.

- 수학 공식 계산식 : https://www.codecogs.com/latex/eqneditor.php

반응형
저작자표시 비영리 (새창열림)
  1. 🟦 Alpha diversity란? 
  2. 🟦 Margalef 's Richness index ,  종 풍부도 지수
  3. 🟦 Pielou's evenness index ,  종 균등도 지수 
  4. 🟦 Shannon-Wienner index , 종 다양도 지수(샤넌 지수)
  5. 🟦 Simpson index , 종 집중도 지수(심슨 지수)
  6. 🟦 Gini-Simpson = Simpson's index of diversity  
  7. 🟦 Inverse Simpson index
  8. 🟦 faith's pd index 계통 다양도 지수 
  9. 🟦 Reference
'Bioinformatics/└ 기타' 카테고리의 다른 글
  • 16S rRNA 시퀀싱과 Shotgun Metagenomic 시퀀싱 비교
  • [R] Vegan 패키지의 envfit 함수를 결과를 해석해보자
  • PERMANOVA (Permutational analysis of variance) 란?
  • ANOSIM(Analysis of similarities)이란?
김해김씨99대손
김해김씨99대손
kim.soyeon.bio@gmail.com 오류수정, 피드백, 질문 메일 언제든지 환영합니다!
김해김씨99대손
Bioinfo_newbie
김해김씨99대손

블로그 메뉴

  • 블로그홈
  • Github
  • 글쓰기
  • 설정
  • 분류 전체보기 (357)
    • 자기소개 (1)
    • Bioinformatics (210)
      • Sequencing data (24)
      • Taxonomy (12)
      • Metagenome (5)
      • Microbiome (5)
      • └ Qiime2 (13)
      • └ Dada2 (8)
      • └ R for microbiome (38)
      • └ 기타 (28)
      • Biopython (2)
      • 생물정보학 교육 (11)
      • Rosalind (18)
      • Article (25)
      • 기타 (18)
      • 채용 공고 (3)
    • Statistics (0)
    • Machine Learning (2)
    • Biology (16)
    • Big data (4)
      • 기타 (4)
    • Programming (59)
      • Python (2)
      • R (46)
      • R_Package function (2)
      • My R package (1)
      • Linux (7)
    • Database (2)
    • Management (0)
    • 대학원 (29)
      • 스크랩 (10)
    • 일상 (14)
      • Big picture (2)
      • 다이어리 (10)
    • 기타 (9)

공지사항

인기 글

최근 댓글

전체
오늘
어제
hELLO · Designed By 정상우.v4.2.2
김해김씨99대손
Alpha Diversity 지수 정리
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.