High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 1 / 11 BRIC View 2019-T08
High-Throughput sequencing-based 3D chromatin
architecture mapping 연구 동향
김 근 영
예일대학교 의과대학, 유전학과 E-mail: [email protected] 요약문 인간의 몸을 구성하는 모든 세포는 거의 동일한 유전 정보를 가지고 있음에도 불구하고 후성학적 변형과 유전자 발현 조절 네트워크에 따라 세포는 각각의 고유의 기능을 수행하고 있다. 따라서 염색질(chromatid)의 3차 구조 연구(3D chromatin architecture mapping)의 목표는 인간 게놈(genome)의 공간적, 구조적 다이니믹을 분석함으로써, 세포 특이적 유전자 발현 패턴을 규명하고 세포 고유의 기능을 정확히 이해하는 핵심정보를 제공하고자 함에 있다. 현재까지 알려진 바에 의하면 각 인간 세포에는 최소 2만 개에서 6만 개 이상의 원거리 전사조절인자(distal cis-regulatory element)가 존재하고 있으며 질병 관련 유전자들의 95% 이상이 먼 거리에서 존재하는 인핸서와 같은 비전사 지역에 의해 조절됨이 보고되었다. 따라서 이러한 원거리 전사조절인자의 통합적 상호작용을 이해하고 유전자 발현 조절 네트워크를 정확히 규명하는 일은 향후 인간이 발생과 발병을 연구하고 치료법을 개발하는데 중요한 정보를 제공할 것으로 여겨진다. 여기 본 연구 동향 보고서에서는 다양한 3D 연구 기법 더 나아가 현재 연구 추세인 4D 연구 기법들을 소개하고 현재 사용되는 현황과 의의에 대해 보고하고자 한다.Key Words:3D, 4D Nucleome, 염색질(Chromatin), Hi-C, 게놈(Genome)
목 차
1. 서론 2. 3차 구조 분석의 연구 동향 2.1 3C 기법 2.2 4C 그리고 5C 기법 BRIC View 동향리포트High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 2 / 11 2.3 Hi-C 기법 2.4 ChIP-PET 3. 3차 네트워트 기법의 적용 사례 및 의의 4. 4차 구조 네트워크의 구축 5. 3차 네트워크 연구의 당면 과제와 앞으로의 전망 6. 참고문헌
1. 서론
지난 10년간 The ENCODE, Roadmap Epigenome, International Human Epigenome Project, EpiGeneSys (http://www.epigenesys.eu/en/) 그리고 FANTOM과 같은 프로젝트를 통하여 인간의 게놈은 20,000개 이상의 유전자와 수만 개의 조절인자들로 이루어져 있음에 대한 방대한 연구 결과가 세포의 종류별로 모아져 왔다. 더불어 1세대 염기서열 분석방법인 Sanger sequencing 기술에 이어 차세대 염기서열 분석기술(next generation sequencing, NGS)의 획기적인 발전에 힘입어 염기서열 분석방법은 속도와 정확도가 매우 향상되었으며 시간과 비용은 획기적으로 줄일 수 있게 되었다. 그림1. 게놈의 염기서열 분석에 소모되는 비용 추세 이러한 급격한 유전학 기술의 발전은 초기 프로모터의 기능에 기반을 두고 진행되었던 1차원적 유전자 발현조절에 관한 연구들을 뒤로하고, 다수의 원거리 전사조절인자들의 복합적 상호 작용에 의한 유전자 발현조절 기전에 대한 연구를 활발히 이끌고 있다. 그 결과로 각 세포주 별로 수만 개의 원거리 조절 인자들이 존재하고 있음이 밝혀지게 되었고 이렇게 멀리 떨어진 유전자를 타겟으로 하는 현상이 DNA 접힘(looping)을 통해 가능하게 되었음을 설명할 수 있게 되었다 [1,2].
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 3 / 11 총 2미터에 달하는 인간의 유전자는 매우 작은 핵 안에 자연스러운 접힘 과정을 통해 존재하고 있다. 이러한 DNA 접힘은 무작위로 일어나기보다는 특정 패턴을 이루며 형성되어 있으며 이러한 패턴에 따라 유전자의 발현이 조절되고 있음이 보고되었다. 공간적으로 멀리 떨어져 있는 인핸서(Enhancer)가 타겟 유전자의 전사 기전을 조절할 뿐만 아니라 유전자의 3차원적인 위치가 핵막의 구성요소인 라미나(lamina)에 근접해 있는 경우 유전자는 억제기전(silencing)과 복제(replication) 시간에 조절 받고 있음이 확인되었다 [3,4]. 더불어 GWAS (genome-wide association study) 연구를 통하여 수많은 질병관련 조절인자의 위치를 확인하였고 그중 대부분은 해당 유전자로부터 멀리 위치에 있으며 non-coding 인자에 의해 조절되는 수많은 경우가 보고 되었다. 또한 특히나 암세포 내에서는 유전자의 3차 구조적 재조합이 매우 빈번히 일어나는 현상으로 이러한 염색질의 3차원적 재구성은 암세포의 발생과 악화에 중요한 역할을 하고 있음이 보고되어 왔다 [5]. 이러한 예로 볼 때 3차원적 염색질의 상호작용을 기반으로 한 유전자 발현 조절의 이해는 어떻게 게놈이 작동되고, 어떻게 3차원적 구조를 이루며 더 나아가 시간에 따라 어떻게 다이나믹한 현상을 보이는지를 이해하는 데 필수적이라 하겠다. 이를 충분히 이해하면 밝혀지지 않은 인간세포의 발생과 분화 그리고 특정 질병에 대한 근본적인 이해를 할 수 있는 중요한 기회라고 생각된다. 따라서 본 연구 동향 보고서를 통해 3D 염색질 네트위크를 이해하기 위한 현재의 기술과 연구 진행 사항을 요약해 보고자 한다.
2. 3차 구조 분석의 연구 동향
세포의 핵은 3차원적 입체 공간이기 때문에 특정 DNA 부분들의 염기 서열상 거리가 수십 또는 수백 kb 이상 떨어져 있더라고 이들의 3차원적인 공간적 거리는 매우 가까이 놓을 수 있다. 그 대표적인 예인 인핸서는 표적 유전자와 멀리 떨어져 존재하지만, 표적 유전자의 전사를 활성화 시키는 구조적 물리적 상호 작용을 하게 된다. 2002년 3C 기법의 개발로 인하여 이와 같은 특정 DNA 간의 물리적 위치를 실험적으로 증명할 수 있게 되었고 그 결과 염색질의 루프(loop) 구조가 제시되었다 [6]. 염색체(Chromosome)의 구조를 분석하는데 기본인 3C 분석 방법과 3C를 기반으로 한 기술의 발전은 주로 인간 혹인 인간과 유사한 모델로 사용되는 생쥐의 연구에 주로 이용되고 있다. 최근의 연구 결과에 따르면 인간 게놈 중에서 최대 6만 개 이상의 원거리 전사조절인자가 발견되었고 유전자의 루프를 통한 조절 기전은 발생과 분화 과정 동안 매우 중요한 역할을 수행하는 것으로 밝혀졌다. 그럼에도 불구하고 형성된 구조가 정확히 어떤 기능을 수행하는지에 대한 연구는 아직 미미하다 [7]. 따라서 3D 네트워크 프로젝트의 궁극적인 목표는 게놈의 다양한 구조를 단일세포 수준에서 완성하고 그와 관련된 생물학적 기능을 이해하는데 그 목적을 두고 있다. 3C를 기반으로 한 대표적으로 사용되는 분석 기법과 각 기법에 해당하는 세부 사항은 다음과 같다 (표1).High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 4 / 11 표1. 현재 사용 중인 대표적인 3D 게놈 분석 기법 어쎄이 이름 약어 특징 해상력 One to One Chromosome Conformation Capture 3C 게놈 내 특정 부위들 간의 상호작용을 분석가능 1 ~100 kb One to Many Chromosome Conformation Capture 4C 특정 부위의 상호작용을 게놈 와이드 수준에서 분석가능 1 ~100 kb Many to Many Chromosome Conformation Capture 5C 다양한 부위들간의 상호작용 분석가능 1 kb Chromatin-interaction analysis by paired end-tag sequencing ChIA-PET 특정 단백질이 결합되어 있는 부위를 게놈 와이드 수준에서 분석가능 200 bp Many to All Chromosome
Conformation Capture Hi-C 핵 내 존재하는 모든 결합을 게놈 와이드 수준에서 분석가능 1 kb-1 Mb Chromosome
Conformation Capture Single-cell Hi-C 단일세포 수준에서 Hi-C 분석가능 1 kb-1 Mb Chromosome
Conformation Capture In situ Hi-C 온전한 핵 내에서 절단(digestion)과 재결합(ligation)을 통하여 상호작용을 분석하는 Hi-C의 변형 1 kb-1 Mb Chromosome
Conformation Capture DNase Hi-C DNase를 이용하여 절단된 크로마틴을 분석하는 Hi-C의 변형 2-50 kb All to All
Chromosome
Conformation Capture Capture Hi-C Oligonucleotide 탐침을 이용하여 특정 게놈 부위들의 상호작용을 분석하는 Hi-C의 변형 1 kb-1 Mb Chromosome
Conformation Capture Micro-C Micrococcal nuclease에 의한 절단 부위를 기반으로 게놈 내의 상호작용을 분석하는 Hi-C의 변형 < 200bp Chromosome
Conformation Capture TCC 특정 비즈 (bead) 결합된 단백질 복합체를 분석할 수 있는 Hi-C의 변형 1 kb-1 Mb Chromosome Conformation Capture Distance Hi-C Photo-activated crosslinkers를 이용하여 상호 결합하는 부위의 거리를 분석할 수 있는 Hi-C의 변형 1 kb-1 Mb
RNA interaction with chromatin by paired-end-tag sequencing RICh-PET 전체 ncRNA와 크로마틴이 상호 결합을 게놈 와이드 수준에서 분석가능 1 kb-1 Mb Chromatin-immunoprecipitation aided RICh-PET ChIP
RICh-PET ncRNA, DNA loci 그리고 특정 단백질의 상호작용을 게놈 와이드 수준에서 분석 가능 1 kb-1 Mb
Replicated DNA
sequencing Repli–seq DNA 복제를 시간별로 게놈 와이드 수준에서 분석 가능 1 kb-1 Mb Thousands of
reporters integrated in parallel
TRIP 전사 혹은 전사 후 변형에 영향을 미치는 크로모좀의
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 5 / 11
2.1 3C (Chromosome Conformation Capture) 기법
3C 기술은 크로모좀의 구성을 연구하기 위한 목적으로 개발되어 왔으며 이는 기본적으로 크게 유전자 간의 결합을 구성하는 단백질의 결합 부위를 분석하는 방법과 먼 거리의 크로모좀 간의 상호 결합 부위의 염기서열을 분석하는 방법으로 발전해 왔다. 구체적인 실험 과정을 살펴보면 세포 내 핵을 분리한 후 포름알데하이드를 이용하여 핵 내 단백질과 그 결합 부위 DNA를 교차결합(crosslink)시켜 크로모좀의 구조를 고정시킨다. 이때 고정된 복합체는 특정 DNA 부분과 선택적 단백질들로 구성되어 있는데 고정된 복합체를 분석하면 세포 내 특정 DNA 부분이 어떤 단백질과 상호 결합되어 있는지를 확인할 수 있다(Chromatin Immunoprecipitation, ChIP). 또한 고정된 크로마틴에 DNA 절단 제한 효소를 이용하여 단백질과 결합되어 있지 않은 DNA 부위를 절단한 후 인접부의 DNA를 재결합(proximity ligation)시켜주면 한 복합체 내 고정된 DNA 절편들은 높은 빈도로 연결되게 된다. 그러나 복합체 안에 고정되지 않은 DNA는 절단된 흩어져 버리기 때문에 복합체 내에서 상호 작용을 하며 루프를 이루고 있었던 DNA의 염기서열을 분석할 수 있게 되는 것이다. 이를 통하여 거리상 서로 멀리 떨어진 두 locus의 DNA가 어떻게 상호작용을 하는지 분석할 수 있고 이를 통하여 입체 공간에서 염색질의 구체적 배열 상태를 확인할 수 있게 된다 [8, 9].
2.2 4C 그리고 5C 기법
3C의 기법의 단점은 부족한 정보의 양으로 유전체 수준에서 전체 염색체 구조를 규명하는 데에는 한계를 가지고 있다. 따라서 지난 10년간 3C 기술을 기반으로 microarray, ChIP, 그리고 gemone wide deep sequencing 기법 등과 같은 첨단 기법을 결합시키는 방향으로 발전되어 왔다. 3C 시료를 기반으로 추가적인 제한효소 처리 과정과 재결합 그리고 증폭 과정을 거친 후 microarray 분석을 하는 4C (chromosome conformation capture on chip) 혹은 gemone wide deep sequencing 분석을 하는 4C-seq 기술, 그리고 primer 결합 증폭방식을 기반으로 microarray 분석을 한 5C (chromosome conformation capture carbon copy) 등을 예로 들 수 있겠다 [10, 11]. 따라서 현재는 3차 구조를 이루는 DNA 절편들 사이의 연결 부위를 보다 좋은 해상력으로 광범위를 쉽고 빠르게 분석할 수 있게 되었다.2.3 Hi-C 기법
3C 기법을 기본으로 차세대 염기서열 결정법 기술을 결합한 Hi-C의 연구 기법은 2009년 개발되었다 [12]. Hi-C 기법의 기본 원리는 두 DNA locus의 접합(ligation) 빈도수를 바탕으로 유전체 전체의 공간상의 거리를 유추하는 것이다. 높은 접합 빈도수를 보이는 두 구간은 공간상에 가까이 존재하고 있다고 가정할 수 있다. Hi-C 기술의 활용한 세계적 몇몇 선도 그룹들의 연구 결과에 의하면 크로모좀은 3차 구조 관점에서 두 가지 영역으로 나누어져 있으며 이는 염색질의 활성도,
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 6 / 11 유전자의 밀도, DNA의 복제 시간 등의 다양한 생물학적 기능들과 직접적인 연관이 있음을 보여주었다. 또한 이러한 결합은 TAD (topologically associating domain)이라는 상호작용이 강하게 일어나는 작은 도메인 단위를 분석할 수 있었는데 이러한 작은 도메인 단위로의 세분화는 크로모좀의 구조 연구에 새로운 모델을 제시해 주었다 [13]. 지금까지 수행된 연구에 따르면 인간 유전체는 약 2,000개 정도의 TAD가 존재하는데 평균 1.5 Mbp의 크기로 이루어져 있으며 진화상으로도 잘 보전되어 있다. 이러한 TAD는 단순한 구조적 단위로 존재하는 것이 아니라 유전자의 기능을 조절하는 역할을 수행하는 먼 거리 인핸서를 발굴하는 데 큰 역할을 하고 있다. 현재의 Hi-C 기술을 이용하면 대략 40 kb 정도의 해상도를 갖는 염색체의 구조 정보를 알 수 있다 [14]. 최근 딮시퀀싱 기술과 결합하여 1 Kb 정도의 해상도로 염색체의 상호작용을 분석할 수 있는 것으로 알려져 있다 [15]. TAD의 구조적 기능적 연구는 현재 줄기세포 분야에서 활발히 진행되고 있다. 인간의 줄기세포를 여러 가지 타입의 세포주로 분화시킨 후 각각의 세포주에 대하여 Hi-C를 수행하여 비교 분석한 실험을 그 예로 들 수 있겠다. 각기 다른 방향으로 분화된 세포주라도 TAD의 경계는 줄기세포 분화 과정과 상관없이 잘 보존되어 있었으며, 이는 TAD가 염색체 3차 구조를 구성하는 기본 단위 임을 뒷받침해 주는 증거로 볼 수 있다. 하지만 TAD 내부 상호작용은 세포주마다 매우 특이적인 패턴으로 관찰되었으며 이러한 3차 구조의 변화가 특히 각각의 세포주의 특성과 관련된 유전자들 사이에서 나타나는 것으로 관찰되었다 [16].
2.4 ChIP-PET
크로모좀 내 존재하는 모든 상호작용의 보여주는 Hi-C의 전체 정보를 다루는 데에는 많은 비용과 분석 시간이 소모되고 있기 때문에 최근에는 유전자의 프로모터와 이를 조절하는 원거리 조절인자 사이의 관계만을 추출해 집중적으로 분석하는 Capture Hi-C 기술이 개발되어 사용되고 있으며, 이와 유사한 목적으로 ChIA-PET, HiChIP 등의 기술이 개발되어 있다 [17, 18]. ChIA-PET 기술은 CTCF, 혹은 Cohesin과 같은 특정 구조단백질에 의해 형성된 크로모좀이 구조를 분석하는 방법으로 고해상력의 장점을 가지고 있으며 특히 프로모터(promoter)와 인핸서(enhancer)의 결합 루프에 상호작용하고 있는 pol2의 결합부위의 분석은 타겟 유전자의 활성화 정도를 예측할 수 있게 해 준다. 현재 3C를 기반으로 한 분석의 한계는 formaldehyde를 이용한 고정 방식으로 인하여 중요도에 따른 거리를 특정하기 어려워 정확한 거리 정보가 부재되어 있다. 따라서 앞으로의 네트워크는 눈으로 보여지는 포토이미지 기술을 접목하여 정확한 염색체 정보를 구조, 공간 그리고 시간 정보에 따라 정확히 구현할 수 있으리라 여겨진다.3. 3차 네트워트 기법의 적용 사례 및 의의
염색체의 상호작용 정보를 바탕으로 한 전자조절인자의 타켓 유전자 발굴은 수많은 질병과 관련된 유전자들의 조절과 변형이 전사 지역이 아닌 비전사 지역에 의해 조절되고 있음을 보여 주었다. 그 실례로 유방암 연구 사례를 보면 암 관련 잠재적 위험 유전자를 GWAS 연구를 통하여High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 7 / 11 그림2. 지난 십 년간 발전된 High Throughput 염기서열 분석방법을 통하여 크로모좀의 기본 구조를 분석할 수 있다 [24]. 분석한 후 Hi-C 기법을 통하여 최종 33개의 타겟 조절인자를 골라 낸 최근 연구를 예로 들 수 있겠다 [19]. 또 다른 예로 비만 연관 유전인자인 FTO의 조절기전을 규명한 연구 사례를 들 수 있겠다. 기존의 전장유전체 연구를 통해 비만과 상관관계를 가지는 유전적 변이로 FTO 유전자의 첫 번째 인트론에 위치한 비전사 유전적 변이가 보고되었다. 하지만 이후 수행된 FTO 유전자와 비만과의 상관관계에 대한 연구는 명확한 분자 기전을 제시하지 못하였다. 그러다 최근에 염색질 3차 구조 정보를 기반하여 해당 비만 연관 유전적 변이는 인접한 FTO 유전자의 프로모터보다는 멀리 떨어져 있는 IRX3 그리고 IRX5라는 유전자에 의해 조절한다는 사실을 밝히고 이를 생쥐 모델을 기반으로 입증하였다 [20]. 원거리 조절인자의 유전자 조절기전은 질병뿐만 아니라 인간의 발생과 발달에도 중요한 역할을 하고 있다. 그 대표적인 연구 결과로 β-글로빈의 인핸서 조절 기전을 들 수 있겠다. β-글로빈은 여러 개의 글로빈 유전자들과 인핸서 역할을 하는 LCR (Locus control region)로 구성되어 있는데, 발생 단계에 따라 특정 글로빈 유전자들만 전사하게 된다. 이러한 발생 단계 특이적 전사 활성 기작에 대한 궁금증은 3C의 기법의 발달로 밝혀지게 되었는데, LCR과 루프 구조를 통하여 가까이 위치한 특정 글로빈 유전자만이 활발한 전사가 일어나고 있음을 보여주었다 [21]. 이처럼 3차원 구조 정보에 기반한 전사인자 타겟 유전자 발굴은 기존에 해석이 어려웠던 유전체 조절 정보를 보다 정확하게 제공하여 그동안 규명하지 못했던 인간 질병 발병 기작을 이해하고 치료법을 개발하는데 핵심적 정보를 제공할 것으로 기대된다.
4. 4차 구조 네트워크(4D Nucleosome)의 구축
최근 미국은 주요 6개 센터를 중심으로 NOFIC (Nuclear Organization and Function Interdisciplinary Consortium)을 설립하여 크로모좀의 3C 구조를 재현함은 물론이고 이에 세포핵의 다이나믹을 시간적 공간적으로 이미징화할 수 있는 기술을 접목하여 세포핵의 4DN (4D nucleosome) 구현을 목표로 하고 있다 [22]. 따라서 세포핵 3차원 구조실현의 궁극적인 목표인 살아있는 단일세포 내에서 특정 염색질 혹은 전체 핵의 특징을 실시간으로 구현해 낼 수 있을 것으로
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 8 / 11 기대되고 있다. 기존의 대표 이미지 분석법인 FISH (Standard and high-throughput fluorescent in situ hybridization) 기법은 현재 유전자 편집기술인 CRISPR 기법과 접목하여 CRISPR-dCas9FISH의 개발로 이어져 왔다 [23]. 이는 살아있는 단일세포에서 특정 염색질 부위를 표지함으로써 다이나믹한 구조를 실시간으로 이미지화할 수 있는 장점을 가지고 있다. 현재 dCas9FISH 기법은 유전자의 단일 위치뿐만 아니라 DNA의 루프 구조 그리고 TADs 구조까지도 분석 이미지화할 수 있는 수준으로 발전되었다. 또 다른 이미지 기술 분야는 수퍼 해상력 현미경(Super-resolution microscopy)을 이용한 기술의 발달이다. 살아있는 세포에 형광 혹은 화학 물질을 이용하여 다양한 단백질, RNA 그리고 유전자의 다이나믹한 상호 작용을 실시간으로 이미지화할 수 있게 되었다. 마지막으로 Soft X-ray 단층촬영 기술을 들 수 있겠다. 현재 4DN 구축 기술력은 3가지 방향으로 발전될 것으로 전망되는데 첫째는 4D nucleosome 모델링이 단일세포 수준에서 이루어져 크로모좀에서 합성되는 RNA를 추적하고 그 기능을 예측할 수 있도록 만들어 줄 것이다. 둘째는 세포 혹은 조직을 고정하지 않은 살아있는 상태에서 이미징 기술 혹은 라벨링(labeling) 기술을 이용하여 게놈의 활성 정도를 확인할 수 있는 기술의 구축이다. 이는 크로모좀의 다이나믹을 시간에 따라 혹은 세포의 분화 정도에 따라 혹은 세포분열 구간에 따른 고해상력으로 분석을 가능하게 해준다. 셋째는 단지 크로모좀의 구조 분석뿐만 아니라 DNA, RNA, 혹은 세포 내 단백질 탐침을 통하여 전체 핵막과 핵의 구조를 파악할 수 있도록 해줄 것으로 사료된다.
5. 3차 네트워크 연구의 당면 과제와 앞으로의 전망
세포질의 3차 구조 연구의 중요성은 많은 연구자에 의해 3C 기법을 기반으로 시작되었으며 특히 미국 국립보건원(NIH)은 2015년부터 4D Nucleome 컨소시움을 시작하여 전체 염색체의 3차 구조 연구를 준비하고 있다. 크로모좀의 3차 구조의 보다 정확하고 정밀한 규명은 인류의 발생과 분화를 이해하고 더 나아가 당면한 다양한 질환의 발병기작을 이해하고 새로운 치료 법의 전략적 타겟을 제시하는 데 매우 중요한 역할을 할 것으로 기대되다. 하지만 이를 위해서는 보다 정밀한 크로모좀의 3차 구조의 동정 시스템개발이 요구됨에 따라 연구를 통하여 얻어진 정보를 보다 정확하고 면밀히 분석할 수 있는 분석툴의 개발도 이어지리라 여겨진다. 이를 위해서는 다음과 같은 중요 단계의 확립이 필요한데 그 첫째 다양한 방법으로 확보한 데이터를 비교 분석하여 그 정확도를 비교할 수 있는 스텐다드 세포주를 확립하는데 있다. 세포주는 매우 안정적이며 정상적인 유전 핵형(karyotype)을 지니며 손쉬운 배양 그리고 손쉬운 유전자 편집기술 적용이 가능한 세포주여야 한다. 현재 ATCC, Coriell, 그리고 Wicell과 같은 대표 세포주 판매 기관을 통하여 H1/H9-human ESC, IMR90, GM12878, K562, HET293, hTert-RPE, HCT116과 같은 대표 세포주들이 각기 다른 방법으로 구축한 3C 데이터를 비교 분석하는 데 사용되고 있다 [22]. 두 번째 중요한 요소는 수집된 양질의 데이터를 표준화하여 많은 연구자들이 데이터를 공유화할 수 있는 시스템의 정립이라 할 수 있겠다. 유전체 분석의 가장 큰 걸림돌 중 하나는 분석한 대용량의 데이터의 효율적인 저장과 공유의 문제라 할 수 있겠다. 현재 많은 Globus Genomics, Google, DNANexus 등과 같은 대표적인High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 9 / 11 표2. 현재 사용 중인 혹은 개발 중인 4DN 이미지 기술의 예
어쎄이 적용 어쎄이 방법 특징
DNA와 RNA 구조의
이미지화 3D DNA 혹은RNA FISH, seqFISH, MERFISH 고정된 세포 내에서 단일 혹은 복수의 DNA 또는 RNA를 형광표지된 oligo나 BAC 탐침을 이용하여 분석하는 방법. HIPMap 고정된 세포에서 형광표지된 탐침의 High-throughput FISH이미지를 자동화하여 분석하는 방법
CASFISH, CRISPRainbow 살아있는 혹은 고정된 세포에서 특정 염기서열을 인지하는 gRNAs/CRISTR 탐침을 이용하여 확보된 이미지를 분석하는 방법
MS2, PP7, mSpinach, aptamers 살아있는 혹은 고정된 세포수준에서 특정 RNA 염기서열에 결합하는 형광표지 탐침을 이용하여 활성화된 전사부위를 이미지화하는 분석법
ParS-, LacO- or TetO 시스템을 이용한 특정 부위 라 벨링
형광표지된 ParB-, lac- 혹은 tet-조절 단백질을 탐침으로 사 용하여 살아있는 혹은 고정된 세포 내 특정 게놈 위치를 분석하는 방법
고해상 이미지 장비 를 통한 울트라 구조 분석
Transmission EM, SBEM, multiple-tilt 그리고 연속단 층화 가능한 EM
tomography
고해상 장비를 이용하여
마크로물질의 울트라 구조를 2D 혹은 3D차원에서 분석하 는 방법. Heavy metals, colloidal nanogold, inorganic 그리 고 ChromEM, Alexa 633, Fluoronanogold, Time-STAMP-YFP-MiniSOG와 같은 표식물질을 탐침으로 사용하는 방법 Multi-colour EM, ChromEMT (UD) 세포질의 전체 혹은 국소적 부분의 3차 구조를 메가스케일 단위로 분석하는 방법 X-ray tomography 메조스케일 해상력으로 (20–50 nm) 고정처리하지 않은 세포 내 분석 방법 SIM 그리고 X-ray tomography 울트라 구조와 그와 결합되어 있는 염색질이 특정부위 혹은 단백질을 선택적으로 이미지화하는 분석 방법 3D 핵의 구조의 다
이니믹을 공간적으로 이미징하는 분석
Wide-field, confocal/
multiphoton 살아있는 혹은 고정화된 세포 내 회절 한계 (diffraction limited) >250 nm의 해상력으로 분석 가능
초해상 이미지 분석법 (Super resolution): 3D SIM, PALM, STORM, STED, adaptive optics, tcPALM, SAIM 살아있는 혹은 고정된 세포의 핵 조직의 초해상 이지지 분 석법(circa 10–20 nm) LLS, LLS-PAINT 살아있는 세포의 3차원적 다이나믹 혹은 핵 내 조직화를 분석 하는 방법 기업들이 클라우드 저장 방식의 서비스를 제공하고 있다. 앞으로 클아우드 방식의 서비스 가격도 기술의 발전과 더불어 하락할 것으로 전망되기 때문에 많은 연구자들이 유전체 빅데이터를 손쉽게 분석, 공유할 수 있을 것으로 여겨진다. 셋째는 컴퓨터를 기반으로 한 분석툴(analysis tool)의 지속적인 개발이 수행되어야 한다. 이는 다른 실험적 기법으로 수집된 데이터 상호 간의 비교 분석이 가능케 하여 궁극적으로 다양한 데이터베이스를 통합하고 보다 정확하고 신뢰도 높은 분석
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 10 / 11 기능을 제공함은 물론 생물학을 전공하지 않은 연구자들도 큰 진입장벽 없이 손쉽게 유전체를 분석할 수 있게 될 것이다.
6. 참고문헌
[1] Sanyal et al., The long-range interaction landscape of gene promoters, Nature (2012)
[2] Leung et al., Integrative analysis of haplotype-resolved epigenomes across human tissues, Nature (2015) [3] Liberman-Aiden et al., Comprehensive mapping of long range interactions reveals folding principles of the human genome, Science (2009)
[4] Dixon et al., Topological Domains in Mammalian Genomes Identified by Analysis of Chromatin Interactions, Nature (2012)
[5] Chakraborty A et al., Identification of copy number variations and translocations in cancer cells from Hi-C data, Bioinformatics. (2017)
[6] Dixon et al., Chromatin Architecture Reorganization during Stem Cell Differentiation, Nature (2015)
[7] ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome, Nature (2012)
[8] Hansen AS. et al., CTCF abd Cohesin regulate chromatin loop stability with distinct dynamics, bioRxiv. (2016)
[9] Dekker J. et al., Capturing chromosome conformation. Science (2002)
[10] Németh A, et al. Initial genomics of the human nucleolus. PLoS Genet, (2010)
[11] Zhu Y, et al. Comprehensive characterization of neutrophil genome topology. Genes & development, (2017) [12] Lieberman-Aiden E. et al., Comprehensive mapping of long-range interactions reveals folding principles of the human genome, Science (2009).
[13] Schmitt et al., A Compendium of Chromatin Contact Maps Reveals Spatially Active Regions in the Human Genome, Cell Reports (2016)
[14] Tong Liu et al., Reconstructing high-resolution chromosome three-dimensional structures by Hi-C complex networks, BMC Bioinformatics (2018)
[15] Rao et al., A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping, Cell (2014)
[16] Emily M. Smith et al., Invariant TAD Boundaries Constrain Cell-Type-Specific Looping Interactions between Promoters and Distal Elements around the CFTRLocus, Am J Hum Genet. (2016)
[17] Fullwood MJ. et al., ChIP-based methods for the identification of long-range chromatin interactions, J Cell Biochem. (2009)
[18] Maxwell R. Mumbach et al., HiChIP: Efficient and sensitive analysis of protein-directed genome architecture, Neture methods (2017)
[19] Joseph S. et al., Capture Hi-C identifies putative target genes at 33 breast cancer risk loci, Nat Communinations (2018)
[20] Claussnitzer et al., FTO Obesity Variant Circuitry and Adipocyte Browning in Humans, NEJM (2015)
High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향 김근영 Page 11 / 11 Cell (2002)
[22] Job Dekker et al., The 4D Nucleome Project, Nature (2017)
[23] Wulan et al., CASFISH: CRISPR/Cas9-mediated in situ labeling of genomic loci in fixed cells, PNAS (2015) [24] Satish Sati et al., Chromosome conformation capture technologies and their impact in understanding genome function, Chromosoma (2017)
The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center.
김근영(2019). High-Throughput sequencing-based 3D chromatin architecture mapping 연구 동향. BRIC View 2019-T08 Available from http://www.ibric.org/myboard/read.php?Board=report&id=3183 (Mar 14, 2019)