분류 전체보기

로잘린드 문제 푸는 걸 위주로 코딩학습 + 알고리즘을 공부하기 위해서 교내 생물정보학 스터디 그룹을 만들고 싶다. 그런데 생각보다 잘 될 것 같지 않아서 설계단계부터 애를 먹고 있다 여러 글을 참고한 결과, 스터디는 장기보다는 단기가 성공적일 확률이 높고 공동목표와 개인 목표를 충족해야 한다. 또한 스터디는 만능이 아님으로 짧은 주제를 가지고 여러 번 하는 것이 더 나을 수도 있다. # 인원 그렇다면 지인들끼리 모이는 게 나을지 아니면 정말 모르는 사람이 나을지 고민했는데, 아무래도 지인위주로 모집 -> 그 이후에 인원이 모이지 않으면 다른 과 사람들을 모집하는 게 나을 것 같다. 인원은 10명 이내 이왕이면 한 5 명 정도면 좋을 것 같다. # 기록 일단 적지 않으면 의미가 없다는 말을 새겨들어서 모든..
| 사례 phyloseq객체를 사용할 때, read count abundance를 relative abundance로 바꾼 후, OTU table을 보았을때, NaN값이 뜨는 경우가 있다. ps.rel
약 800여 개의 fastq.gz파일은 4개의 카테고리로 구성되어 있다. 각 파일의 이름이 담긴 목록을 엑셀로 생성 후 이를 이용해 파일을 각 디렉터리에 옮기고자 한다. https://stackoverflow.com/questions/45111754/move-multiple-files-from-a-folder-to-list-of-directories-undo-a-move-command while read line; do fileName=$(basename $line) dirName=$(dirname $line) cp SourceDir/"$fileName" "$dirName" done < ListOfFile.txt 그러나 문제는 엑셀로 만든 파일이 뒤에 '\r'이 붙어서 이동이 되지 않았다. 또한 위 방법..
🟦 fastq파일이란? fastq파일이란 시퀀싱 결과물로서, 한 시퀀스(시퀀싱 된 read) 정보와 퀄리티 정보를 같이 가지고 있으며, 한 sequence당 총 4줄의 데이터를 가지고 있다. fastq파일의 예시를 보자. @SEQ_ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT +SEQ_ID !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65 @SEQ_ID - 시퀀싱 기계에서 지정한 read의 ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT - read의 서열 +SEQ_ID - 동일한 ID(혹은 다른 아이디지만 SEQ..
· Biology
작성 : 2022-12-21 4대 major human 미생물의 Genus는 Staphylococcus, Streptococcus, cutibacterium, corynebacterium이 있다. 그중 Staphylococcus는 사람의 피부와 코점막에 많이 서식한다. 그렇다면 Stapylococcus(포도상구균)에 대해서 알아보자. 🟦 Staphylococcus 란? ◼ Staphylococcus의 이름 - staphylo- : 포도송이(bunch of grapes)를 뜻하는 고대 그리스어이다 - coccus : grain, seed, berry를 뜻하는 고대 그리스어로 spherical bacterium을 말한다 - 구형(spherical) = cocci라고 한다 ◼ Staphylococcus의 특징..
- 수정 2023.04.12   Streptococcus와 Staphylococcus 속에서 NA 뜬 친구들의 blast결과를 보고자 했다. Streptococcus NA는 무려 1000개나 되어서 언제다 일일이 blast 돌리나 했는데, 그냥 fasta파일 형식으로 변환 후 돌리면 된다. 일단 아래 예시 서열로 돌려보자.  🟦 blast 돌리기 | 예시 파일- ID가 NR_025000.1와 NR_0250002(가상의 서열)인 서열이 있다.>NR_025000.1 Mycobacterium kubicae strain CDC 941078 16S ribosomal RNA, partial sequenceGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCCTTCGGGGGTACTCGAGTGGCGAACGG..
🟦 BLAST란?| BLAST = basic local alignment sequence tool   -BLAST는 밝혀진 지놈 또는 단백질 서열들을 데이터베이스화 해서 새로 밝혀낸 서열들의 상동성(유사성)검사를 실시하여 새로 밝혀진 서열이 어떤 기능이나 어떤 종류의 서열인지 찾아내는 것이다.  - NCBI는  command line 기반의 BLAST+프로그램을 제공한다.  | BLAST 종류 : blastn, blastp, blastx, tblastm, tblastx (NCBI)  - query(분석하고자 하는 서열)를 reference서열에 alignmet하여 어떤 친구와 가장 비슷한지 알아낸다.  - blast : query(nucleotide) ▶ reference(nucleotide)  - b..
· 자기소개
🎉안녕하세요 저는 생명과학 전공자로 석사과정(현재는 박사 중)에서 컴퓨터 분야에 첫 발을 내디뎠습니다. 현재는 바이오인포메틱 전반과 마이크로 바이옴 데이터 분석에 대해 공부하고 있습니다.메인 언어는 R이며, 간단한 마이크로바이옴 분석 및 시각화 패키지를 제작하고 있습니다. 이 과정에서 데이터의 시각화와 R을 이용한 웹 앱 개발에도 관심을 가지고 있습니다. 저의 최종적인 목표는 데이터 분석도 잘하고 개발도 잘하는 bio data engineer& developer입니다.(사실 연구보다 개발이 더 재밌습니다...) 📚이 블로그는제가 공부하면서 기록해야 할 것들과, 영어 때문에 검색이 어려웠던 여러 사람들을 위해 코딩 질문과 답을 번역해서 돌리거나, 분석 가이드를 작성합니다. 또한 어떻게 공부를 시작해야 ..
⬛ 관련 글 | R상에서 fas/fasta로 바꾸기 | Linux에서 fastq 파일 다루기 ⬛ Input 일단 아래와 같은 포멧의 csv파일을 만들어 줍니다. less sequences.csv # Genex AAAAA # Geney TTTTT # Genez GGGGG 리눅스 상에서 아래 스크립트를 입력 합니다. awk -F , '{print ">"$1"\n"$2}' sequences.csv > sequences.fas ⬛ Output 결과 파일을 아래와 같습니다. less sequences.fas # >Genex # AAAAA # >Geney # TTTTT # >Genez # GGGGG ⬛ Reference - https://www.biostars.org/p/423573/ - https://www.bi..
◼ 링크 : https://www.bioin.or.kr/EventEdc.do?num=316883&cmd=view&cl_code=all&searchType=all&pre_seq=&next_seq=&bid=semina&s_key=all&s_str=&sdate=2022/01/01&edate=2022/12/31 BioIN(바이오인) www.bioin.or.kr LAIDD는 보건복지부, 한국보건산업진흥원의 지원을 받아 구축한 국내 최초의 AI와 제약 바이오 분야의 융합 교육 플랫폼으로 신약개발에 필요한 AI, Chemoinformatics, Bioinformatics, 제약, 의료 등 관련 분야의 기초 지식 및 응용 기술을 습득할 수 있는 곳입니다. 🟦 LAIDD 목표 🟦 러닝트랙 🟦 강좌 - 총 90여 개의 강..
◼링크 : https://www.kola.kr/main/index.jsp 🟦KOLA란? - 구 k-gol강의 사이트 - 생물정보학, 바이오 데이터에 대한 분석 강의 사이트 🟦 특징 - 수강신청기간에 따로 제약이 있지 않음 - 수강 후 한 달 내에 수강 시, 수료증 제공 🟦 추천 강의 👍 '한국바이오협회 교육과정'인 생물정보학 기초 강의를 추천 - NGS 개념부터 여러 분석 기초 이론을 짧은 강의로 설명해줌(한 강의당 10분 * 5개) - 기본 이론을 다질 수 있음 🟦 아쉬운점 - 의료 인공지능 강의는 아주대 참여 교육생들만 들을 수 있다. 이런 강의가 절반을 넘는다. - 즉, 기초강의만 공개고 나머지는 들을 수 없음 - 강의 영상이 대학 강의 수준부터, 세미나처럼 깔끔한 강의까지 다양하다. 일부는 오디오..
· Biology
🟦 참고 링크 https://global.oup.com/uk/orc/medicine/collier5e/student/mcqs/ch23/ https://www.urmc.rochester.edu/encyclopedia/content.aspx?contenttypeid=40&contentid=GenitalHerpesStdQuiz&CustomAnswers_GenitalHerpesStdQuiz https://www.researchgate.net/topic/Herpes-Virus https://www.cram.com/flashcards/virology-quiz-2-herpesvirus-part-1-579650
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (20 Page)