Tistory 블로그를 제대로 시작한 지 1년 하고도 한 달이 넘었습니다. 그때는 생물정보학, 마이크로바이옴에 대해 아는 게 없는 바보였는데, 지금은 조금 안다고는 말할 수 있게 되었네요. 처음 시작은 단순한 공부의 기록이었지만, 지금은 다른 사람들에게 알리고자 하는 방향으로 나아가고 있습니다. 최종 목표는 마이크로바이옴 분석의 A to Z를 시리즈로 만드는 것이에요. 바로 이 분처럼요! 사실 저는 초등학교 때부터 블로그를 운영했습니다. 그 당시에는 네이버 블로그에서 친구들과 그림을 주고받고, 중학교 때는 영화 감상문을 적다가, 고등학교 때부터 일상글과 공부를 정리했습니다. 블로그라는 플랫폼을 이용한 지 10년이 넘었다고 말할 수 있겠습니다. (그 10년의 기간동안 일간 최고 방문수는 101이었습니다.)..
2023-06-19 거의 1년째 친구들과 오후 적게는 1시간, 많게는 3시간씩 줌으로 스터디를 하고 있다. 이건 목적이 있는 스터디가 아닌 각자 개인 공부를 하는 시간이다. 모임은 예체능계열 취준생과 이미 취직한 보건계열 친구, 그리고 나로 구성된다. 어쩌다가 이런 정기적인 모임이 되었는지는 모르겠지만, 지속적인 모임이 된 이유는 다들 강제적인 공부 시간이 필요하다고 느꼈기 때문이다. 취직한 친구는 공부보다 야근의 필요성을 느꼈다고 한다. 나도 취직한 이후에도 줌을 하게 될까? 이렇게라도 만나는 게 나쁘지 않은 것 같다. 모두의 발전을 위해서 지속되길 바란다.
풀이 날짜 : 2023-06-19(R)/ 2023-07-05(python) | 문제 consensus 서열이란 여러 리드에서 제일 빈도수가 많은 염기가 표기된 서열이다. 이는 시퀀싱 단계에서 일어날 수 있는 에러를 보정하기 위한 방법으로, 가장 빈도수가 높은 염기를 그 자리의 consensus 서열로 지정한다. | 데이터와 결과 Sample Dataset >Rosalind_1 ATCCAGCT >Rosalind_2 GGGCAACT >Rosalind_3 ATGGATCT >Rosalind_4 AAGCAACC >Rosalind_5 TTGGAACT >Rosalind_6 ATGCCATT >Rosalind_7 ATGGCACT Sample Output ATGCAACT A: 5 1 0 0 5 5 0 0 C: 0 0 1 ..
수정: 2024.03.04 1. Alzheimer’s disease 1) 알츠하이머란? 치매란? - 치매는 일반적인 노화정도를 넘어선 인지와 기억의 진행적인 파괴를 말한다. 그러나 치매는 의식에 영향을 미치지 않는다. - 치매의 신호: 기억력 감퇴, 집중의 어려움, 기본 루틴 수행의 어려움, 기분의 변화가 심함 - 치매는 여러 기억감퇴 질환을 포함하는 포괄적인 용어임 알츠하이머와 치매의 차이? - 알츠하이머는 인식에 영향을 미치며, 새로운 것을 떠올리기 어렵고 기분과 행동이 많이 바뀌는 증상을 보인다. - 알츠하이머는 85세 이상의 50%가 영향을 받는 신경퇴행성 질병이다. 대부분 65세 이상에서 발현되며 드물게 30전에 전에 발현되는 경우도 있다. 이는 대부분 유전의 영향이 크다. 알츠하이머의 위험요소..
수정: 2024.03.04. 화 Innate and adaptive immunity - 면역계는 크게 innate와 adaptive immunity로 나눌 수 있다. Adaptive immunity - 1차 림프기관_성숙 림프구의 생성장소 - 골수 → B cell (bone Marrow Derived) - antibody (X) - 흉선 → T cell (Thymus Derived) - antibody (O) - 2차 림프기관 (림프구 활성화) - 외래 항원을 만나서 성숙된 림프구가 활성화됨 - ex) 비장, 림프절 T cell T cell development - Naive CD4+, CD8+T cell 은 thymus에서 생산되어 lymph node로 이동 - node에서 antigen을 인식한 de..
- 원문 : https://www.kiet.re.kr/research/economyDetailView?detail_no=2821&year=2023&month=05&sval= - 저자 : 최은희 - 파일 : 보건데이터의 종류 - 활력징후 : 혈압, 혈당, 호흡, 체온 - 오믹스 : 유전체, 마이크로바이옴 - 기타 : 앱, 소셜미디어 보건 데이터의 형태 - 정형 : 진단명, 처방 코드 등 - 비정형 : 의료기록, 영상, 이미지 등 (보건데이터의 80~90%) - 반정형 : 의료진의 판독 소견 등 보건 데이터의 유통 - 공공기관 개방 플랫폼 : 질병관리청, 건강보험심사평가원, 국민건강보험, 통계청, 국립암센터, 국립중앙의료뭔, 국민건강보험일산병원, 국립장기조직혈액관리원, 국립재활원 - 민간영역 : 전자의무기록..
- 원문 : https://www.bioin.or.kr/board.do?num=320428&cmd=view&bid=issue - pdf : 구분 개념 및 차이점 AI AI(인공지능)은 학습, 문제 해결, 의사 결정 등 일반적으로 인간의 지능이 필요한 작업을 수행할 수 있는 지능형 시스템을 만드는 것을 지칭하는 포괄적인 용어이자 광범위한 분야 ML ML(머신러닝)은 데이터의 패턴과 인사이트를 사용하여 명시적인 지시 없이도 작업을 수행할 수 있도록 디지털 컴퓨터를 훈련시키는 AI의 하위 분야 DL DL(딥러닝)은 여러 계층으로 구성된 인공 신경망을 사용하여 학습하고 의사 결정을 내리는 ML의 하위 집합임. 이미지(예: DALL-E2) 또..
- 링크 : https://www.bioin.or.kr/board.do?num=320476&cmd=view&bid=report - 지구 마이크로바이옴 프로젝트가 대표적이다 -> 지역특성에 따른 데이터베이스 구축의 필요 - 토양미생물체를 이용한 토양 품질 개선, 작물 생산성 향상, 유기물 분해 공정 개선 연구 多 - 미생물보단 식물과, 토양미생물 전체의 군집과 뿌리 주변 미생물에 집중 -> 엔지니어닝 - 이를 활용한 스마트팜 농업이 증가할 것
- 작성 : 2023.05.08 primer를 잘라내는 프로그램은 여러 개가 개발되었다. 그중에서 대표적인 몇몇의 프로그램을 비교해 보자. 참고로 모두 큰 차이가 존재하진 않는다! 이 프로그램들의 목적은 primer를 제거하는 것임으로 그 이상의 의의를 두지 말자. | Cutadapt - 논문 : Cutadapt Removes Adapter Sequences From High-Throughput Sequencing Reads. 2011 - 인용수 20,605(2023.05.08 기준) Cutadapt란 NGS데이터 전반에서 사용되는 파이썬 기반의 도구이다. True seq, illuminz, SMART등의 여러 시퀀서의 아웃풋 결과물을 다룰 수 있다. Cutadapt 설치 및 사용해 보기 - Cutada..
진행 중인 공고 (주)클리노믹스 : 2023.03.15 ~ 자격요건 - 학력 : 대학원(석사)이상 (졸업예정자 가능) - 경력 : 경력2년↑ 우대사항 - 생명정보학 또는 이에 준하는 전공 우대 - 박사 학위자 - Linux 사용 경험자 - Python 및 R 등 프로그래밍 언어 사용 가능자 - 통계분석 가능자 - 머신러닝 경험자 (주)제놀루션 : 2023.04.13 ~ 2023.07.12 자격요건 - 학력 : 대졸이상 (사원 ~ 과장급) - 경력 : 경력 3년 이상 필요역량 - NGS 실험실 운영 및 관리 경험 - NGS 데이터 분석에 대한 이해도 - 유전체 관련 사업 동향에 대산 지식 우대사항 - 해당 분야 석사/박사 학위 소지자 - 바이오기업 실무 경험자 - Long read 시퀀싱 경험자 - 액체생..
| Error 🚨 base::stop("infinite or missing values in 'x'") 관련 글에서도 적었지만, 이 문제는 Github에 있는 문의글을 보니 아직 공식적으로 해결되지 못하고 있다. 일단 차선으로 결과를 얻을 수 있는 방법은 존재한다. | 해결법 1. 각 그룹의 샘플수가 많아야 한다. 모든 통계 방법이 그렇듯 샘플 수가 많아야 좋은 결과를 얻을 수 있다. 위의 에러 메시지는 보통 총 샘플수가 30, 40 이하이거나, 각 그룹 간의 샘플 수 차이가 많이 나거나, 한 그룹의 샘플 수가 10개 이하일 경우 나타났다. 2. bootstrap_fraction 값을 default값인 2/3보다 높게 잡아야 한다. 이는 bootstrap에서 반복할 샘플의 수를 전체 샘플에서 어느 정도를..
지난 36회 시험을 등록만 해놓고 입금을 까먹어서 놓쳐버린 일을 후회하며 37회를 준비했습니다. 공부 시간 투자는 목요일 3시간, 금요일 오후 6시~ 토요일 오전 8시로 시험 전까지 총 3일 정도 걸렸습니다. 저는 비 전공자는 아니지만, 빅데이터 분석에 발을 담고 있는 반 전공자로서, 이론을 이해하는 데에 조금 수월하였습니다.저는 지난번 시험을 준비한 경험이 있음으로, 초반에 이론부터 공부하는 것이 아니라 바로 기출로 들어갔습니다. 이번 시험을 준비하면서, 지난번 공부하던 내용이 머리에 남아있을 것이라는 자만으로 36회를 풀었지만, 생각보다 점수는 잘 나오지 않았습니다.(30~40점) 이후 문제만 푸는 것이 아닌 이론도 같이 학습해야겠다고 생각했으며, 이후 1과목을 간략하게 복습한 후, 35회를 풀었..