biopython 프로젝트란 파이썬 언어 기반의 분자생물학적 데이터를 분석하는 도구를 만든 전 세계의 개발자 연합을 말한다. biopython 은 bioinformatics에 사용되는 다양한 파일의 형식(BLAST, Clustalw, FASTQ, Genebank,..)에 대한 다양한 도구를 지원한다.
- 공식 홈페이지 : https://biopython.org/
- 튜토리얼 및 cookbook : http://biopython.org/DIST/docs/tutorial/Tutorial.html
- Github의 README : https://github.com/biopython/biopython/blob/master/README.rst
Conda 확인하기
혹시모를 에러를 방지하기 위해 conda를 업데이트 한다.
conda update -all
conda update conda
파이썬 버전을 확인한다. 적어도 3은 넘어야 잘 작동한다.
python --version
pip를 이용한 다운로드
pip install biopython
pip install biopython –-upgrade
파이썬 환경 내에서 잘 깔렸는지 확인해보자.
python
>>> import Bio
>>> print(Bio.__version__)
# 1.8.1
(출처 : https://github.com/biopython/biopython/blob/master/README.rst )
Biopython 이용해보기
서열을 다룰때 "Seq" object형태로 처리된다. 아래 예시를 보자
from Bio.Seq import Seq
my_seq = Seq("AGTACATGGT")
my_seq
# Seq('AGTACATGGT')
print(my_seq)
# AGTACATGGT
서열 my_seq을 처리해보자
my_seq.complement()
# Seq('TCATGTACCA')
my_seq.reverse_complement()
# Seq('ACCATGTACT')
⬛ 참고
- conda를 이용해서 설치하기 : https://anaconda.org/conda-forge/biopython
반응형