작성 : 2024.01.19. 금.
PICRUSt2에서 사용 중인 MetaCyc reference도 KEGG처럼 level1, level2, level3 등으로 계층적인 구조를 가진다. 그러나 하나의 기능 유전체가 중복된 기능을 가짐으로 이를 편하게 사용하기는 어렵다.
그러나 Peter D. Karp, A Comparison of the BioCycTM and KEGG® Pathway Databases and Web Portals (March 2023)에 따르면 MetaCyc가 KEGG에 비해 가진 정보가 많음으로, 향후 연구에서 활용성이 높을 것으로 생각된다.
MetaCyc vs KEGG
MetaCyc version 26.5 (December 2022)
- Pathways: 3,085
- Reactions: 18,391
- Metabolites: 18,785
KEGG v104.0+ (December 2022)
- Pathways: 425 metabolic modules
- Reactions: 11,860
- Metabolites: 19,019
그렇다면 MetaCyc의 주석정보를 어떻게 얻을 수 있을까?
MetaCyc superpathway 다운로드
1. Shotgun 분석 도구인 humann의 map_metacyc-pwy_lineage.tsv을 사용할 수 있다.
- 그러나 최근 몇 년간 업데이트되지 않은 자료를 담고 있다.
- 데이터는 3,661(중복 포함) 개의 기능 유전체에 대한 데이터를 담고 있다.
2. microeco 패키지의 file2meco 함수를 사용해 보자.
- 개발자가 MetaCyc정보를 얻고 싶어서 직접 개발했다고 한다(출처). 자세한 내용은 출처 확인 바람.
3. 웹 크롤링으로 직접 다운로드한다.
- changhu 유저가 제공해 준 코드를 사용한다. 코드 무작정 긁어오기 미안하니, 출처에서 직접 확인 바람.
- 데이터는 총 5,140(중복 포함) 개의 기능유전체에 대한 데이터를 담고 있다(2024.01.18 다운로드).
출처
https://forum.biobakery.org/t/metacyc-hierarchy-to-invetigate-identify-specific-pathways/1830/16
Ron Caspi, Richard Billington, Ingrid M Keseler, Anamika Kothari, Markus Krummenacker, Peter E Midford, Wai Kit Ong, Suzanne Paley, Pallavi Subhraveti, Peter D Karp, The MetaCyc database of metabolic pathways and enzymes - a 2019 update, Nucleic Acids Research, Volume 48, Issue D1, 08 January 2020, Pages D445–D453, https://doi.org/10.1093/nar/gkz862