• 검색 결과가 없습니다.

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향

N/A
N/A
Protected

Academic year: 2021

Share "단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향"

Copied!
12
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 1 / 12 BRIC View 2018-T28

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing)

기술 동향

박 종 은

Sanger Institute E-mail: jp24@sanger.ac.uk 요약문 한 개의 세포에서 수천 개의 유전자를 동시에 측정할 수 있는 단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술은 생물학의 시야를 다시 한번 비약적으로 넓혀주었다. 기존의 한 두 가지의 세포 타입, 유전자, 조직에 집중하던 기존 연구 방식의 한계에서 벗어나, 생명체의 모든 정보를 한번에 읽어 들이고 통합적으로 분석하는 일이 가능해지고 있다. 또한 다양한 분야들이 서로 시너지를 이루면서 실험 기법과 분석 기법이 나날이 새로 발전하고 있다. 본 리포트에서는 현재까지 개발된 단일 세포 시퀀싱 실험 기법과 분석 기법을 소개하고, 향후 발전 방향에 대해 논의해 보고자 한다.

Key Words: 단일 세포 시퀀싱, Single-cell RNA sequencing, Next-generation sequencing,

Bioinformatics, Single-cell genomics, Human Cell Atlas

목 차

1. 서론 2. 본론 2.1 단일 세포 시퀀싱 실험 기법 동향 2.2 단일 세포 시퀀싱 분석 기법 동향 2.3 단일 세포 시퀀싱의 향후 발전 방향 3. 결론 4. 참고문헌 BRIC View 동향리포트

(2)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 2 / 12

1. 서론

2000년대 개발된 차세대 RNA 시퀀싱 기술은 수천에서 수만 개의 유전자들을 동시에 측정하게 해 줌으로써 생물학의 시야를 급격히 넓혀주었다. 그 이후로 시퀀싱 기술은 발전에 발전을 거듭하여, 하나의 세포에서 수천 개의 유전자를 동시에 측정할 수 있는 단일 세포 시퀀싱의 시대에 이르렀다. 단일 세포 시퀀싱 기술도 날로 발전하고 있는데, 초기 수 개에서 수십 개의 세포를 다루던 수준에서 이제는 수백만 개의 세포를 동시에 처리하는 단계에 이르렀다. 이는 생명 현상을 관찰하는 우리의 시야를 비약적으로 늘려주었다. 생물학 전 분야에 걸쳐 기존의 연구 모델들을 단일 세포 수준에서 새롭게 접근하는 연구들이 진행되고 있는데, 기존에 알지 못했던 새로운 종류의 세포들이 속속들이 보고되고 있다. 이 흐름에 발맞춰, 사람의 모든 세포를 동정하고 그 관계망을 지도로 그리겠다는 사람 세포 지도 프로젝트(Human Cell Atlas Project)를 위해 다양한 국적의 연구팀들이 힘을 모으기 시작했다[1]. 건강한 세포들에 대한 지도를 그리는 동시에, 각종 질병 조직을 단일 세포 시퀀싱으로 분석하는 병리학적 접근도 매우 활발히 이루어지고 있다. 이러한 일련의 연구들은 질병의 메커니즘에 대한 이해와 그 치료법 개발에 새로운 전기를 마련해 줄 것으로 보인다. 이번 보고서에서는, 현재까지 개발된 단일 세포 시퀀싱 기술의 실험 기법과 분석 기법을 대략적으로 정리하고, 앞으로의 기술 발전 및 응용 전망에 대해 논의해 보고자 한다.

2. 본론

2.1 단일 세포 시퀀싱 실험 기법 동향

현재 발표된 단일 세포 시퀀싱 기술의 종류는 수십 가지에 이르지만, 그 근본 원리는 기존의 RNA 시퀀싱 기술과 크게 다르지 않다. 대체로 oligo-dT 프라이머를 이용해 poly(A) 꼬리가 달린 mRNA들을 선별적으로 역전사하고, 이 과정에서 달린 adaptor 시퀀스를 이용해 역전사된 DNA를 증폭하여 cDNA library를 만드는 과정을 거치게 된다. 단일 세포 시퀀싱 기술의 관건은 이 과정을 아주 효율적으로 만들어서 하나의 세포에서 나온 RNA를 최대한 증폭하면서, 동시에 세포 별로 각기 다른 바코드 서열을 달아서 각 세포에서 나온 RNA들을 분류할 수 있도록 만드는 것이다. 이를 구현하는 방법에 따라 현재까지 나온 단일 세포 시퀀싱 기술들은 크게 네 가지로 분류해 볼 수 있다.

2.1.1 Plate based 시퀀싱

Plate based 시퀀싱은 FACS를 이용해서 세포를 multi-well plate에 하나씩 넣어 주고, 각각의 well에서 cDNA library를 제작하는 방식이다. 이 때 well 별로 다른 바코드 시퀀스가 달린 프라이머를 사용해서 한 세포에서 나온 RNA에 독자적인 바코드를 달게 된다. 효율적인 cDNA 제작을 위해 SMART-seq이나 CEL-seq 등의 low-input high-sensitivity RNA 시퀀싱 기법들이 활용된다[2,3]. 좁은 공간에 단일 세포를 정확히 분리해서 넣어주기 위해서는 정밀한 FACS 또는

(3)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 3 / 12 microfluidics 기반의 세포 분리 작업이 요구되며, 분리 성능의 한계로 인해 한 plate 당 수백 개 정도의 세포만 처리할 수 있다. 그래서 이 방법을 사용한 연구들은 대개 수백-수천 개 정도의 세포를 분석하는 것이 일반적이다. 보통 다른 방법에 비해 RNA 검출 효율이 뛰어난 편이라서 소규모의 세포에 대해서 최대한의 정보를 얻어내고 싶을 때 많이 사용되며, 항체를 이용한 형광 표지나 이미징 정보를 동시에 얻을 수 있어서 하나의 세포에서 다양한 정보를 얻어낼 수 있다는 장점이 있다. 또한 DNA와 RNA를 동시에 검출하는 등 다양한 기술을 적용해 보기에 용이한 플랫폼이다. 조직 내에 미량 존재하는 세포를 분리해서 연구하는 경우에도 많이 사용된다.

2.1.2 Droplet based 시퀀싱

Droplet based 시퀀싱은 세포와 oligo-dT 프라이머로 코팅된 bead가 각각 한 개씩 들어간 아주 작은 방울을 만들어 그 방울 안에서 mRNA를 붙잡는 방법이다. Drop-seq, inDrop-seq, 10X Chromium 등이 이에 해당된다[4,5]. 각각의 oligo-dT 프라이머 bead는 특이적인 바코드 서열을 가지고 있어서, 이 정보를 이용해서 RNA를 단일 세포 단위로 분류할 수 있다. 보통 세포 당 정보의 양은 plate based 시퀀싱에 비해 조금 적은 편이지만, 훨씬 더 많은 수의 세포를 동시에 처리할 수 있어서(보통 수천에서 수만 개의 세포를 동시에 처리할 수 있다.) 실제 얻어지는 정보의 양은 더 다양하고 방대하며, 따라서 현재 가장 활발하게 사용되고 있는 플랫폼이다. 최근 항체에 바코드 서열을 달아서 항원에 대한 정량적 정보를 함께 얻는 기술이 개발되면서 기존의 plate based 시퀀싱이 가지고 있던 장점을 droplet based 시퀀싱에서도 구현할 수 있게 되면서 그 쓰임이 더욱 다양해지고 있는 추세이다.

2.1.3 Microwell based 시퀀싱

Plate based 시퀀싱과 droplet based 시퀀싱의 특징을 결합하여 만들어진 플랫폼이다. Bead 한 개와 세포 한 개가 들어가기에 적당한 크기의 아주 미세한 well을 이용한다. 바코드 서열이 달린 oligo-dT bead를 well에 하나씩 채워 넣은 뒤, 세포를 낮은 농도로 뿌려 주어서 한 개의 well에 한 개 이하의 세포가 들어가도록 해 준다. 그 이후의 과정은 기존의 라이브러리 제작 과정과 동일하다. Seq-well이나 Microwell-seq 등의 플랫폼이 이에 해당되며, 보통 복잡한 micro-fluidics 장비가 필요 없다는 장점을 가지고 있다[6,7]. 또한 droplet을 이용하는 방식에 비해 좀 더 쉽게 프로토콜에 변형을 줄 수 있다. 현재 다양한 그룹에서 최적화를 시도 중이며, 상용화될 경우 플랫폼 시장의 경쟁을 유도하여 단일 세포 시퀀싱의 비용을 상당히 낮춰줄 것으로 기대된다.

2.1.4 in situ Combinatorial indexing

세포를 고정하여 RNA를 세포 안에 가둔 뒤, 세포들을 384-well plate에 순차적으로 나누었다가 다시 합치는 것을 수 차례 반복하면서(split-and-pool) 바코딩 된 프라이머 혹은 어뎁터 시퀀스를 여러 조합으로 달아 주는 방식이다[8,9]. 한 plate에서 약 15만(384x384) 가지의 조합을

(4)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 4 / 12 만들어 낼 수 있기 때문에 아주 많은 세포를 동시에 처리하기에 유리한 방식이다. 또한 고정된 세포를 사용하기 때문에 샘플의 준비가 좀 더 용이하다. 복잡한 기계 없이 단일 세포 시퀀싱을 구현할 수 있기 때문에 어느 실험실에서나 쉽게 사용할 수 있다는 장점이 있다. 하지만 시료의 세포 농도가 낮을 경우 반복적인 처리 과정에서 적절한 양의 세포를 유지하기가 어려울 수 있어서, 세포 수가 제한적인 시료의 경우에는 적용하기 어려운 경우가 많다. 그림 1. 단일 세포 RNA 시퀀싱 실험과 분석법 개요.

(5)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 5 / 12

2.1.5 그 외의 고려사항

단일 세포 시퀀싱 실험에서 가장 중요한 것은 샘플을 건강한 단일 세포로 분리해 내는 준비 단계이다. 이 과정에서 세포가 많이 죽거나, 일부 세포만 선별적으로 분리되거나, 세포 자체의 성질이 변하는 문제가 생길 수 있다. 세포의 분리는 조직의 경우 collagenase와 protease, DNase의 조합을 많이 사용하며, 일반 세포나 오가노이드의 경우에는 trypsin을 쓰는 경우가 많다. 이러한 분리 과정에서 스트레스 관련 유전자들의 발현이 변하기 쉬운데, 이를 해결하기 위해 세포 분리시 저온에서도 작동하는 효소들을 이용하여 최대한 저온 상태를 유지하거나, 추후에 분석 과정에서 스트레스 관련 유전자 발현 패턴을 선별적으로 제거하는 방법을 고려해 볼 수 있다. 세포를 적절한 농도로 유지하는 것도 중요하다. 대부분의 단일 세포 시퀀싱 기법들이 일정 농도 이상의 세포 솔루션을 필요로 한다. 따라서 아주 적은 양의 세포 시료를 사용할 때는 세포 농도를 잘 유지할 수 있도록 주의를 기울일 필요가 있다. 한편, 너무 세포 농도를 높게 유지했을 경우 세포들이 서로 상호작용을 하거나 다시 결합해 버릴 수도 있으므로, 보통 밀리리터당 십만 개에서 백만 개 사이의 농도를 유지하는 것이 좋다고 알려져 있다.

2.2 단일 세포 시퀀싱 분석 기법 동향

2.2.1 분석 방법 개괄

단일 세포 시퀀싱 분석의 기본 단위는 하나의 세포이지만, 민감도의 한계로 세포의 모든 RNA 분자에 대한 정보를 얻어낼 수는 없기 때문에 세포 하나만 놓고 보면 놓치는 정보가 상당히 많다. 따라서 단일 세포 시퀀싱 분석의 관건은 여러 개의 세포에서 얻어진 정보들을 잘 분류해서 유사한 세포끼리 모아 준 뒤, 비슷한 세포들의 군집을 하나의 단위로 묶어서 분석하는 것이 일반적이다. 이렇게 하면 기존의 bulk RNA 시퀀싱과 다를 것이 없지 않은가 하는 의문이 들 수도 있다. 하지만 중요한 차이점은, bulk RNA 시퀀싱은 시료 내의 모든 세포의 평균값을 분석하는 것이라면, 단일 세포 시퀀싱은 시료 내의 세포들 각각을 개략적으로 들여다보고, 몇 종류의 다른 세포 타입이 존재하는지 파악한 뒤, 각각의 세포 타입에 대한 평균값을 따로 만들어 분석한다는 점이다. 따라서 세포군의 다양성을 파악하면서 동시에 각 세포군에 대해 기존의 RNA 시퀀싱에 버금가는 민감도로 정보를 얻어낼 수 있게 된다. 단일 세포 시퀀싱을 처음 시작할 때 보통 한 개의 세포에서 얻어내야 하는 정보의 깊이가 어느 정도인지에 대한 질문을 많이 던지게 된다. 이론적 답은 간단하다. 세포 간의 유사성 비교를 통해 각 세포군을 잘 분류할 수 있는 정도의 정보를 얻어내면 된다. 보통 한 세포에서 천 개에서 이천 개 정도의 유전자를 정량적으로 검출해 낼 수 있으면, 이 정보를 이용해서 세포군을 충분히 분류해 낼 수 있다. 이 때 헷갈리지 말아야 할 점은, 한 세포에서 이천 개 정도의 유전자를 검출한다고 해서 단일 세포 분석이 이천 개정도의 유전자만을 다루는 것은 아니라는 점이다. 대부분의 단일 세포 시퀀싱이 특정 세포군에 대해서 수십 개에서 수백 개의 세포를 얻어내는 단계에 와 있기 때문에, 이들로부터의 정보를 합쳐서 사용하면 사실 수천 개에서 수만 개의

(6)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 6 / 12 유전자들에 대해 통계적으로 유의미한 분석을 할 수 있다. 단일 세포 시퀀싱 결과의 분석은 구체적으로 어떻게 진행될까? 현재 단일 세포 시퀀싱 분석법은 점차 일반화되고 있는 추세인데, 그 과정은 대체로 (1) pre-processing (2) 차원 축소 (dimensionality reduction) (3) 그래프 형태로 데이터 변환 (4) 그래프 클러스터링 및 연결 구조 분석 (pseudotime) 으로 나눌 수 있다.

2.2.2 Pre-processing

각 과정들을 조금 풀어서 설명해 보자. 단일 세포 시퀀싱 기법들은 모두 세포를 물리적으로 분리하고, 이렇게 분리된 공간에 각기 다른 바코드 서열을 넣어 주어서 세포를 바코드 서열로 표지하는 방식을 따른다. 이 과정에서 세포가 건강하고, 잘 용해되었고, 차후 반응들이 모두 효율적으로 진행된 경우에 가장 이상적인 데이터를 기대할 수 있을 것이다. 그렇지만 때로는 세포가 죽어서 이미 RNA 를 상당히 잃어버리거나, 용해가 제대로 되지 않아 RNA가 노출되지 않거나, 또는 정상 세포가 아닌 죽은 세포로부터의 부유물만이 분리되어 바코딩 되는 경우들이 있다. 이런 정보들이 정상 세포의 결과와 뒤섞이면 추후 분석 과정에 큰 방해가 된다. 따라서 검출된 유전자의 수나 미토콘드리아 유래 RNA 의 비율 등 여러 지표를 이용해 정상 세포를 선별하는 작업을 잘 해 주어야 정확한 분석을 할 수 있다. 여느 RNA 시퀀싱과 마찬가지로 단일 세포 시퀀싱도 세포 당 총 읽힌 read 수가 각기 다르기 때문에, 이에 대한 normalization 과정도 필요하다. 여기에도 다양한 기준이 있을 수 있지만, 보통 세포 당 전체 read 개수로 나누어 주는 단순한 방식을 많이 사용한다.

2.2.3 차원 축소

단일 세포 시퀀싱 데이터는 수십만개에서 수백만개에 이르는 세포에 대해 적어도 이만 개에서 삼만 개의 유전자의 발현양을 수치화한 고차원 정보이다. 이런 고차원 정보를 있는 그대로 활용하면 계산 시간이 오래 걸릴뿐만 아니라, 각종 노이즈가 분석 결과에 포함될 가능성이 있다. 따라서 분석 과정에서 약 삼만 개의 유전자들을 잘 조합하여 수 개에서 수십 개 정도의 차원으로 축소시키는 과정이 아주 중요하다. 우선 발현이 아주 적어서 노이즈에 취약하거나, 여러 세포에서 변화가 거의 없는 유전자들은 분석에 큰 의미가 없기 때문에 이들을 제거하고 유의미한 유전자들만 남겨서 분석에 활용하며(이천 개에서 삼천 개 사이의 유전자를 남기는 것이 일반적이다), 추가적으로 principal component analysis (PCA)나 canonical correlation analysis (CCA) 등의 차원 축소 기법을 적용해서 비슷한 변화를 보이는 유전자끼리 모아 주는 작업을 거친다. 이 과정에서 가장 중요한 것은 최대한 노이즈를 배제하면서 생물학적으로 중요한 변수들을 놓치지 않고 포함시키는 것이다.

2.2.4 그래프 변환

(7)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 7 / 12 좌표를 갖게 된다. 비슷한 세포들은 비슷한 좌표를 갖게 되며, 따라서 이 저차원 공간에서 군집을 이루어 특정한 기하학적 형태를 구성하게 된다. 단일 세포 시퀀싱 분석에는 다양한 형태의 세포 군집을 이해하기 위해 여러 가지 기하학적인 접근 방법들이 활용된다. 가장 대표적인 것이 그래프 구조이다. 그래프란, 점들의 집합과 각 점을 연결하는 선의 집합으로 구성되는데, 복잡한 모양을 단순화하여 접근할 때 아주 유용하다. 단일 세포 시퀀싱에 가장 많이 활용되는 형태의 그래프는 k-nearest neighbor 그래프이다. 이는 공간 상의 각 점을 그 점으로부터 가장 가까운 k 개의 점과 이어준 그래프인데, 각 세포에 대해 가장 가까운 다른 세포가 무엇인지 찾고 이를 저장한다고 보면 이해가 쉽다. 이러한 그래프 구조는 각 세포들 간의 상관 관계를 파악하기 위한 시작점이 된다.

2.2.5 그래프 클러스터링 및 연결 구조 분석

그래프 구조로 변환된 데이터는 다양한 분석에 활용된다. 보통 하나의 세포 타입에 속하는 세포들은 그래프에서 아주 잘 연결된 덩어리를 이루며, 이 덩어리를 찾아 끊어내는 알고리즘을 이용하면 아주 손쉽게 세포를 분류할 수 있다. 여기에는 louvain clustering이라는 그래프 클러스터링 알고리즘이 주로 사용된다. 이렇게 찾아낸 세포 군집들에 대해서, 마커 유전자를 찾아내서 세포 타입을 동정하고 그 특징을 분석하는 것이 단일 세포 시퀀싱의 주요 작업이다. 클러스터링이 세포를 덩어리 별로 끊어내서 분류해 주는 작업이라면, 반대로 세포 군집간의 연결 상태를 분석하는 방향도 있다. 발생 및 분화 과정에 있는 세포들은 그 상태가 연속적으로 변하기 때문에, 그래프로 표현하면 부드럽게 연결된 원통 모양의 연결 형태가 된다. 이 연결 구조를 단순화 시키고, 중심 축을 찾아서 세포들을 축에 순차적으로 배분하면 세포를 변화의 순서대로 배열할 수 있게 되는데, 이는 시간이 공간에 투영된 개념으로 볼 수 있기 때문에 pseudo-time 이라고 한다. 이러한 psedo-time 분석법은 아주 다양하게 개발되어 있으며 구조의 다양성에 따라 최적의 분석법도 다르기 때문에 여러 가지를 시도해 보는 것이 좋다[10]. 한 가지 주의할 점은 이는 단순히 세포를 유전자 발현의 유사성에 따라 나열하기 때문에, 반드시 세포의 분화 단계와 일치하지 않을 수도 있다는 것이다. 예를 들면, 두 세포 타입이 자극에 의해 비슷한 세포 타입으로 변화하는 과정을 분석할 경우 어느 세포가 분화의 출발점이고 어느 세포가 도착점에 해당하는지 정확히 판단하기가 매우 어렵다. 이러한 문제를 해결하기 위해서, 최근 인트론과 엑손의 비율을 모델링하여 세포가 나아가는 방향성을 예측하는 velocyto 라는 분석법이 제시되었다[11]. 한창 새로 전사되고 있는 유전자들은 인트론 시퀀스의 비율이 높을 것이므로, 이들을 이용해서 세포가 나아갈 방향성을 예측할 수 있다는 것이다. 이러한 분석법은 그래프 구조에 방향성을 추가해 줄 수 있기 때문에 pseudo-time 분석에 새로운 차원을 더해줄 것으로 보인다.

2.2.6

분석 패키지의 개발

단일 세포 데이터를 저장하고 분석하기 위해서는 R이나 Python 등의 언어로 구현된 패키지를 사용하는 것이 편리하다. 주로 R의 Seurat이나 Python의 Scanpy가 널리 사용된다[12,13]. 이러한 패키지들은 데이터를 변환하고 저장하고 분석하는 데 필요한 일련의 툴을 한번에 제공하기

(8)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 8 / 12 때문에 아주 편리하다. Pseudo-time 분석법이나 실험간의 variation을 상쇄해 주는 등 다양한 용도의 분석 툴도 많이 나와 있어서, 이를 잘 파악하고 적절히 활용하는 것이 중요하다.

2.3 단일 세포 시퀀싱의 향후 발전 방향

단일 세포 시퀀싱 기법 자체는 이미 완성 단계에 있으며, 여러 분야에 널리 적용되어 데이터가 날로 쌓여가는 추세이다. 그렇다면 향후 10년간 단일 세포 시퀀싱의 발전 전망은 어떨까? 이제는 RNA에 국한되지 않고, DNA, 단백질 등 다양한 정보를 단일 세포 수준에서 분석하거나, 다양한 툴을 결합해 복합적인 정보를 얻어내는 쪽으로 발전해 나갈 것으로 보인다. 이러한 방향의 신호탄이 된 몇 가지 기술들을 소개해 보고자 한다.

2.3.1 RNA와 다른 마커를 동시에 시퀀싱하는 기술들

단일 세포 시퀀싱은 기본적으로 oligo-dT를 이용하여 poly(A) tail이 달린 mRNA를 선택적으로 붙잡는다. 이를 응용해서 생체 내 어느 분자든 poly(A) tail을 달아서 mRNA와 유사한 꼬리 구조를 만들어 주면, 단일 세포 시퀀싱 기법을 이용해서 mRNA외의 다른 분자를 동시에 검출하는 것이 가능하다. 이의 대표적인 예로서, 항체에 poly(A) 및 바코드 서열이 담긴 DNA 조각을 달아주어 항원에 대한 정보를 단일 세포 단위에서 정량적으로 얻을 수 있는 CITE-seq 또는 REAP-seq 이 있다[14,15]. 주로 세포 표면 단백질을 검출하며, mRNA의 양적인 한계로 인해 잃을 수도 있는 정보들을 추가적으로 얻거나, 단백질 단계의 post-translational modification 에 대한 정보를 추가적으로 얻을 수도 있기 때문에 아주 유용하다. 또한, 이 방법을 응용하면 여러 샘플을 multiplexing해서 한번에 단일 세포 시퀀싱 라이브러리를 만드는 것도 가능하다. 모든 세포에 비슷하게 존재하는 항원을 이용해서, 그 항원은 붙잡는 항체에 다양한 바코드를 달아 주어 서로 다른 샘플을 표지하는 데 사용하는 것이다.

항체 표지 이외에도 외부에서 poly(A)가 달린 RNA를 넣어주거나, DNA vector를 이용해서 genetic perturbation 정보를 함께 얻어내는 방법도 있다. 대표적인 예가 Perturb-seq으로 불리는 일련의 방법들인데, 타겟 유전자의 발현을 조절할 수 있는 CRISPR gRNA vector에 타겟 유전자별로 바코드를 달아 주어, 추후에 단일 세포 시퀀싱을 통해 바코드와 전체 transcriptome 에 대한 정보를 동시에 읽게 된다[16-18]. 각각의 세포에 어떤 gRNA가 작동하고 있는지, 즉 어떤 유전자에 변형이 가해졌는지, 그리고 그 변형이 전체 transcriptome에 어떤 변화를 일으켰는지를 동시에 알 수 있어서, 수많은 유전자들에 대한 조절 네트워크 분석을 동시에 할 수 있어서 아주 각광받는 방법이다. 다른 예로는 다양한 바코드 시퀀스로 마킹된 분화 초기 세포를 여러 계통으로 분화시켜서, 각 계통 별 연관 관계가 어떻게 되는지 분석하는 lineage tracing 기법이 있다[19]. Zebrafish 같은 모델 생물에서 잘 구현되어 있으며, 사람이나 쥐의 경우 T 세포나 B 세포는 자체적인 바코드 역할을 하는 반응기를 가지고 있기 때문에 유전공학적 처리 없이도 lineage tracing을 구현할 수 있다. 점차 복잡한 오가노이드 모델이 구현되고 있으므로, 이러한 기술들을 오가노이드에 적용해 보면 발생과 분화에 대한 흥미로운 결론들을 얻어낼 수 있을 것으로 보인다.

(9)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 9 / 12 그림 2. RNA와 다른 마커를 동시에 시퀀싱하는 기술들.

2.3.2 단일 세포 Genomics

DNA와 RNA, 또는 epigenome과 RNA 정보를 단일 세포 수준에서 동시에 얻어내고자 하는 시도들이 계속되고 있다. G&T 시퀀싱이 그 대표적인 예인데, 단일 세포에서 RNA와 DNA를 따로 분리해서 라이브러리를 만드는 방식으로, 암과 같이 유전체 변이와 그에 따른 세포 특성 변화가 중요한 샘플들에 적용하기 알맞은 방법이다[20]. 하지만 이렇게 물리적으로 DNA와 RNA를 분리하게 되면 민감도가 일부 떨어질 수 밖에 없는데, 이를 피하기 위해 RNA 시퀀싱 결과를 최대한 활용해서 이로부터 유전체에 대한 정보를 끌어내는 computational method 들도 개발되고 있다. 샘플의 유전체 정보를 사전에 가지고 있다는 가정하에, Copy number variation이나 SNP, imprinting 등에 대한 정보들은 단일 세포 RNA 시퀀싱 결과만을 이용해서 쉽게 알아낼 수 있을 것으로 보인다. Epigenome 정보를 단일 세포 단위에서 가장 쉽게 얻어낼 수 있는 방법은 ATAC-seq을 이용하는 것이다[21,22]. ATAC-seq은 트랜스포존을 이용해서 유전체의 접근도가 높은 부분을 알아내는 방법론으로, 다양한 단일 세포 시퀀싱 플랫폼을 통해 구현되어 있다. 아직 RNA와 동시에 정보를 얻어내는 단계는 아니지만, 역시 이를 해결하기 위한 다양한 computational method들이 만들어지고 있으므로 기대해 볼 만한 분야이다. 같은 샘플에 대해 ATAC-seq과 RNA 시퀀싱 데이터가 많이 쌓여간다면 유전체와 전사체의 상관 관계를 아주 높은 해상도로 이해하는 것도

(10)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 10 / 12 가능해질 것이다.

2.3.3 이미징과의 결합

단일 세포 시퀀싱의 단점은 세포를 단일 세포로 분리해 내는 과정에서 조직 내 세포의 위치 정보가 모두 사라진다는 점이다. 이를 보완하기 위해, 단일 세포 수준의 해상도에서 동시에 여러 유전자에 대한 정보를 얻어내기 위한 이미징 기법들이 끊임없이 새로 개발되고 있다. 현재까지 개발된 방법들은 전반적으로 해상도가 높아질수록 동시에 볼 수 있는 유전자 수가 제한되는 단점이 있다. 하지만 여러 항체 표지 기법과 검출 기법이 새롭게 개발되면서 단일 세포 수준에서 수십 개의 유전자를 검출하는 것이 이미 가능해지는 단계이다[23]. 단일 세포 시퀀싱 결과를 분석해서 효율적인 마커 조합을 찾아내면, 단일 세포 transcriptome을 이미징 결과에 이어 붙여서 전체 조직에서 모든 유전자의 발현 정보를 단일 세포 해상도로 얻어낼 수 있다. 생명의 여러 프로세스가 이루어지는 축을 시간 축, 공간 축, 유전자 발현 축으로 단순히 생각해 볼 때, 공간 축과 유전자 발현 축에서 손실 없이 모든 정보를 얻어내는 시대가 곧 찾아올 것이다.

3. 결론

단일 세포 시퀀싱 기법의 발달은 생명 현상을 관찰하는 시야의 넓이와 깊이를 비약적으로 늘려주고 있다. 이제 쌓여가는 정보의 양은 한 개인이 이해하고 처리할 수 있는 범주를 훌쩍 뛰어넘고 있으며, 이에 따라 여러 연구자들의 협업이 더욱 더 중요해지고 있다. 이러한 거대한 생명 정보를 어떻게 분석하고 관리, 저장하며 공개할 것인지에 대해 깊이 있는 고민과 논의가 필요한 시점이다. 생명의 지도를 만드는 작업이 끝나고 나면, 정보의 홍수 속에서 의미 있는 가설과 모델을 만들어 내서 실험을 통해 검증하는 작업도 더욱 활발해질 것이다. 이 모든 과정을 효율적으로 처리하기 위해서는 여러 연구 주체들이 모여서 함께 방법을 논의하고, 새로운 기술을 개발하고, 정보를 자유롭게 공유하는 허브 역할을 해 줄 공간이 꼭 필요하다. Human Cell Atlas 프로젝트의 경우, Broad Institute, Chan Zuckerberg Biohub, Sanger Institute 등 여러 핵심 연구소들이 그 중심 축 역할을 하고 있으며, 이런 연구 공간을 새롭게 마련하고 역량을 키우기 위한 연구비들이 새롭게 책정되고 있다. 우리도 협력 연구 문화를 꽃피게 해 줄만한 연구 공간과 연구비 체계를 마련하는 것에 대해 한번 더 고민해 볼 만한 시점이다.

4. 참고문헌

[1] Regev, A., Teichmann, S. A., Lander, E. S., Amit, I., Benoist, C., Birney, E., ... & Clevers, H. (2017). Science forum: the human cell atlas. Elife, 6, e27041.

[2] Picelli, S., Björklund, Å. K., Faridani, O. R., Sagasser, S., Winberg, G., & Sandberg, R. (2013). Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature methods, 10(11), 1096.

(11)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 11 / 12 amplification. Cell reports, 2(3), 666-673.

[4] Macosko, E. Z., Basu, A., Satija, R., Nemesh, J., Shekhar, K., Goldman, M., ... & Trombetta, J. J. (2015). Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets. Cell, 161(5), 1202-1214. [5] Klein, A. M., Mazutis, L., Akartuna, I., Tallapragada, N., Veres, A., Li, V., ... & Kirschner, M. W. (2015). Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells. Cell, 161(5), 1187-1201.

[6] Gierahn, T. M., Wadsworth II, M. H., Hughes, T. K., Bryson, B. D., Butler, A., Satija, R., ... & Shalek, A. K. (2017). Seq-Well: portable, low-cost RNA sequencing of single cells at high throughput. Nature methods, 14(4), 395. [7] Han, X., Wang, R., Zhou, Y., Fei, L., Sun, H., Lai, S., ... & Huang, D. (2018). Mapping the mouse cell atlas by Microwell-seq. Cell, 172(5), 1091-1107.

[8] Cao, J., Packer, J. S., Ramani, V., Cusanovich, D. A., Huynh, C., Daza, R., ... & Adey, A. (2017). Comprehensive single-cell transcriptional profiling of a multicellular organism. Science, 357(6352), 661-667.

[9] Rosenberg, A. B., Roco, C., Muscat, R. A., Kuchina, A., Mukherjee, S., Chen, W., ... & Pun, S. H. (2017). Scaling single cell transcriptomics through split pool barcoding. BioRxiv, 105163.

[10] Anthony Gitter. Single-cell RNA-seq pseudotime estimation algorithms. 2018. doi:10.5281/zenodo.1297422 [11] La Manno, G., Soldatov, R., Hochgerner, H., Zeisel, A., Petukhov, V., Kastriti, M., ... & van Bruggen, D. (2017). RNA velocity in single cells. bioRxiv, 206052.

[12] Butler, A., Hoffman, P., Smibert, P., Papalexi, E., & Satija, R. (2018). Integrating single-cell transcriptomic data across different conditions, technologies, and species. Nature biotechnology, 36(5), 411.

[13] Wolf, F. A., Angerer, P., & Theis, F. J. (2018). SCANPY: large-scale single-cell gene expression data analysis. Genome biology, 19(1), 15.

[14] Stoeckius, M., Hafemeister, C., Stephenson, W., Houck-Loomis, B., Chattopadhyay, P. K., Swerdlow, H., ... & Smibert, P. (2017). Simultaneous epitope and transcriptome measurement in single cells. Nature methods, 14(9), 865.

[15] Peterson, V. M., Zhang, K. X., Kumar, N., Wong, J., Li, L., Wilson, D. C., ... & Klappenbach, J. A. (2017). Multiplexed quantification of proteins and transcripts in single cells. Nature biotechnology, 35(10), 936.

[16] Dixit, A., Parnas, O., Li, B., Chen, J., Fulco, C. P., Jerby-Arnon, L., ... & Adamson, B. (2016). Perturb-Seq: dissecting molecular circuits with scalable single-cell RNA profiling of pooled genetic screens. Cell, 167(7), 1853-1866.

[17] Adamson, B., Norman, T. M., Jost, M., Cho, M. Y., Nuñez, J. K., Chen, Y., ... & Pak, R. A. (2016). A multiplexed single-cell CRISPR screening platform enables systematic dissection of the unfolded protein response. Cell, 167(7), 1867-1882.

[18] Datlinger, P., Rendeiro, A. F., Schmidl, C., Krausgruber, T., Traxler, P., Klughammer, J., ... & Bock, C. (2017). Pooled CRISPR screening with single-cell transcriptome readout. Nature methods, 14(3), 297.

[19] Wagner, D. E., Weinreb, C., Collins, Z. M., Briggs, J. A., Megason, S. G., & Klein, A. M. (2018). Single-cell mapping of gene expression landscapes and lineage in the zebrafish embryo. Science, 360(6392), 981-987. [20] Macaulay, I. C., Haerty, W., Kumar, P., Li, Y. I., Hu, T. X., Teng, M. J., ... & Smith, M. (2015). G&T-seq: parallel sequencing of single-cell genomes and transcriptomes. Nature methods, 12(6), 519.

[21] Buenrostro, J. D., Wu, B., Litzenburger, U. M., Ruff, D., Gonzales, M. L., Snyder, M. P., ... & Greenleaf, W. J. (2015). Single-cell chromatin accessibility reveals principles of regulatory variation. Nature, 523(7561), 486. [22] Cusanovich, D. A., Daza, R., Adey, A., Pliner, H. A., Christiansen, L., Gunderson, K. L., ... & Shendure, J. (2015). Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science, 348(6237),

(12)

단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향 박종은 Page 12 / 12 910-914.

[23] Goltsev, Y., Samusik, N., Kennedy-Darling, J., Bhate, S., Hale, M., Vasquez, G., ... & Nolan, G. (2018). Deep profiling of mouse splenic architecture with CODEX multiplexed imaging. bioRxiv, 203166.

The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center.

박종은(2018). 단일 세포 RNA 시퀀싱(Single-cell RNA sequencing) 기술 동향. BRIC View 2018-T28 Available from http://www.ibric.org/myboard/read.php?Board=report&id=3050 (Aug 09, 2018) Email: member@ibric.org

참조

관련 문서

Meterials and Methods: Our study involved three stem cell sources-subacromial bursal tissue, bone marrow, and umbilical cord-derived stem cells. Under consent we

Recent stem cell studies have reported that cultured hematopoietic stem cells (HSCs) are reactivated through fetal hemoglobin expression by treatment with

An RNN model is neural network architecture using a single layer or multiple layers, consisting of circulation connections, commonly applied for learning the

– Established the fundamentals of high temperature fuel cells such as the molten carbonate and solid oxide fuel cell.. – In 1958, he demonstrated an alkali cell using a

ES Cell Bone Marrow Stem Cell Matured Cell ES Cell Bone Marrow Stem Cell Matured Cell..

Green (University of New South Wales), and Reuben Collins (Colorado School of Mines) MRS Bulletin (2008)... World

 Often found connected to other molecules on the outsides of cells --- cellular recognition, cell signaling, cell

Effect of cell migration of JMJD6 transcript variants over- expressed MCF-7 cells using Transwell.. Effect of cell migration of JMJD6 transcript variants