Bioinformatics/기타

◼ 출처 - 2006 한국 생물 정보학 백서, 부록9 생물 정보학 관련 용어 및 정의 (생물학연구정보센터) ◼ 지필 - 생물학연구정보센터 소 장 : 김상욱 - 생물학연구정보센터 부소장 : 정동수 - 생물학연구정보센터 연구원 : 김수정, 박지민, 유숙희, 이강수 장영옥, 조점희, 최용주, 한건영 ◼ 링크 : https://ibric.org/myboard/read.php?id=2337&Board=report 2006 한국의 생물정보학 백서 - 목 차 -제1장. 연구단체 11. BIT 연구기관협의회 32. 바이오벤처 453. 대학 994. 연구센터 1175. 학회... ibric.org - 2006년 판이라 용어가 조금 다르거나, 오래된 프로그램 혹은 변동된 내용이 존재함. 그러나 매우 유익하다. - 2006..
- 수정 2023.04.12 Streptococcus와 Staphylococcus 속에서 NA 뜬 친구들의 blast결과를 보고자 했다. Streptococcus NA는 무려 1000개나 되어서 언제다 일일이 blast 돌리나 했는데, 그냥 fasta파일 형식으로 변환 후 돌리면 된다. 일단 아래 예시 서열로 돌려보자. 🟦 blast 돌리기 | 예시 파일 - ID가 NR_025000.1와 NR_0250002(가상의 서열)인 서열이 있다. >NR_025000.1 Mycobacterium kubicae strain CDC 941078 16S ribosomal RNA, partial sequence GTGCTTAACACATGCAAGTCGAACGGAAAGGCCCCTTCGGGGGTACTCGAGTGGCGAACGGG..
🟦 BLAST란? | BLAST = basic local alignment sequence tool -BLAST는 밝혀진 지놈 또는 단백질 서열들을 데이터베이스화 해서 새로 밝혀낸 서열들의 상동성(유사성)검사를 실시하여 새로 밝혀진 서열이 어떤 기능이나 어떤 종류의 서열인지 찾아내는 것이다. - NCBI는 command line 기반의 BLAST+프로그램을 제공한다. | BLAST 종류 : blastn, blastp, blastx, tblastm, tblastx (NCBI) - query(분석하고자 하는 서열)를 reference서열에 alignmet하여 어떤 친구와 가장 비슷한지 알아낸다. - blast : query(nucleotide) ▶ reference(nucleotide) - blastp : ..
⬛ 관련 글 | R상에서 fas/fasta로 바꾸기 | Linux에서 fastq 파일 다루기 ⬛ Input 일단 아래와 같은 포멧의 csv파일을 만들어 줍니다. less sequences.csv # Genex AAAAA # Geney TTTTT # Genez GGGGG 리눅스 상에서 아래 스크립트를 입력 합니다. awk -F , '{print ">"$1"\n"$2}' sequences.csv > sequences.fas ⬛ Output 결과 파일을 아래와 같습니다. less sequences.fas # >Genex # AAAAA # >Geney # TTTTT # >Genez # GGGGG ⬛ Reference - https://www.biostars.org/p/423573/ - https://www.bi..
- 작성 : 2022.12.01 🟦 알파폴드2 - 지난 2020년 11월, 알파고를 개발한 것으로 잘 알려진 인공지능 회사 구글 딥마인드가 ‘알파폴드2(AlphaFold2)’를 발표했다. 단백질 구조 예측 인공지능인 알파폴드2는 작년 12월에 있었던 단백질 구조 예측 능력 평가 대회(CASP)에서 92.4점으로 1위를 기록 - 이 프로그램은 먼저 그동안 축적된 단백질 구조 데이터와 아미노산 배열을 학습. 그다음 이를 토대로 하여 새로운 아미노산 서열로부터 구조를 예측. 이전 방식이 분석하는 데 몇 주에서 몇 달까지 소요하던 것에 비해, 딥러닝과 텐션 알고리즘을 결합한 알파폴드2는 고작 하루 이틀 만에 결과를 내놓 - 2021년 7월 15일 딥마인드측은 알파폴드2의 개발 과정이 담긴 논문과 소스코드를 공개..
🟦 간단 요약 [RNA-seq Data 결과 해석] Fold change > 0 : 발현 증가 Fold change 유의) 🟦 Fold change와 p-value의 차이 Fold change는 크기 비교이며, FDR/P-value는 분포 비교이다. 예시 이미지로 간단하게 이해해 보자. WT(Wild Type)과 KO(Knock Otu)타입을 비교한 데이터이다. 각각 이미지에서 평균 값의 차이는 같지만, 분포양상(분산)이 다르다. 각 값의 Fold change 값이 같을 때, 위는 p value 작으며, 아래는 p value가 크다. 왜 그런가? 이는 분포가 좁은 WT과 KO 타입에서..
자료 설명 ▶ 자료 출처 : https://www.edwith.org/ptnr/kobic/ 의 강의 ▶ 샘플 정보 - 3반복 실험 - CDA Knockout 과 Control - 총 6 sample ▶ DEG 파일 정보 (log2 read count table) - log2로 치환한 값 - raw name은 gene ID, column name은 sample ID R에서 heatmap 그리기 1. 파일 읽어 오기 DEG
| SeqMan이란? - Sanger Sequencing이란 초기 DNA시퀀싱 방법으로 DNA에 각 형광분자를 붙여서 각 염기를 읽을때마다 형광을 측정하여 가장 많은 빛을 띈 염기를 정리하여 하나의 consensus sequence(통합된 서열)로 만들어 준다 - Seqman은 보통 forward와 reverse로 시퀀싱된 서열을 합쳐주는 역할을 한다 - 유료 프로그램으로 무료로는 데모버전만 사용 가능하다 - 관련 강의 비디오(한국어) : https://www.youtube.com/watch?v=SjGGprEqXwA - 유료 프로그램이기도 하고 Bric에 문의글 별로 없는것을 보아 현재 많이 사용되지는 않는것 같다
김해 김씨 99대손
'Bioinformatics/기타' 카테고리의 글 목록 (2 Page)