▢ 연구의 목적
◦ 정상적인 유전체와 특정 질병이 발현된 유전체를 비교하여 어떤 유전체의 변이가 특정 질병에 영향을 미치는지 탐색하는 연구
▢ 연구의 특징
◦ (Open Source 기반) 분석도구(Tool)은 대부분 Open Source을 사용
- 논문 제출 시 잘 알려지고 검증된 Open Source를 사용해야 결과를 인정받을 수 있는 학 계 풍토
◦ (데이터 개방 원칙) 논문 출간 시 잘 알려진 데이터베이스에 데이터를 업로드 - 논문 제출을 위해서는 반드시 데이터를 개방해야 하는 것이 학계 관행
◦ (공개 데이터베이스) 다양한 종류의 공개 데이터베이스 존재
- 유전체 데이터베이스, 유전체 변이 데이터베이스, 시퀀싱 원시데이터 데이터베이스, 단 백질 데이터베이스, 화합물 데이터베이스
◦ (연구그룹 간 협력) 유전체 전문가 그룹과 그 외 분야의 전문가 그룹이 목적 질병 규명을 위해서 협력하는 형태가 가능. 즉 한 가지 목적을 위해 다양한 연구그룹의 협력 가능 - 예) 치매 규명을 위해 유전체 전문가 그룹, 단백질 전문가그룹, 뇌과학 전문가그룹이
협력
▢ 연구 프로세스
◦ 샘플확보: 타겟군(질병군)과 대조군(정상군)의 조직 확보
◦ 샘플 QC(Quality Control) 수행: 확보된 샘플 조직의 상태 검사
◦ 시퀀싱3) 수행: 조직에서 DNA을 추출하여 무작위로 일정 단위씩 염기서열을 해독
< 그림 8 > 일반적인 시퀀싱 절차
출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014)
3) Sequencing: 유전정보를 해독하여 유전체를 구성하는 염기의 서열을 얻어내는 작업으로, 주어진 DNA 분자들을 증폭시킨 후 잘게 쪼개 어 각각의 쪼개어진 단편에 대해서 병렬적으로 염기들을 읽어내는 방식을 사용
Open Science 관점에서 연구수행 프로세스에 대한 분석
37
◦ 원시데이터(Raw data) 확보: 시퀀싱에서 얻은 DNA의 염기서열 단위데이터의 총합
◦ 원시 데이터 QC 수행: 확보된 염기서열의 상태 검사
< 그림 9 > 일반적인 전체 유전체 시퀀싱 절차
출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014)
◦ 염기서열 정렬4)분석 수행: 무작위로 얻어진 염기서열 단위데이터를 정렬
< 그림 10 > 유전체 어셈블리 절차
출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014)
◦ 정렬된 염기 서열 데이터 후처리: 통계기법 등을 통하여 염기서열 정렬을 보정 및 확정
4) 어셈블리(Assembly): 읽어진 단편의 염기 서열들은 염색체 염기 서열로 복원하기 위한 과정. 주로 Open Source 이용
< 그림 11 > 일반적인 염기서열 정렬의 예 출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014)
◦ 변이 검출: 정렬된 염기서열에서 유전체 변이를 검출
◦ 통계 분석: 통계적인 기법을 통하여 변이 검출의 유의성 검증
◦ 결과 분석: 얻어진 데이터의 의미를 분석
◦ 실험적 검증: 유전체 변이를 지닌 쥐를 만들어서 실제 변이가 일어나는지 검증
◦ 논문 출간 및 데이터 공유: 알려진 바이오 데이터베이스 사이트에 업로드
< 그림 12 > 유전체 변이탐색 R&D 프로세스
※ 변이 데이터베이스: 유전체 변이만 모으는 데이터베이스
※ 염기서열 데이터 센터: 염기서열 데이터 전체를 모으는 데이터베이스
Open Science 관점에서 연구수행 프로세스에 대한 분석