암 유전체 데이터 분석

전체 글

(1)

암 유전체 데이터 분석

Whole Genome Sequencing in Cancer Research

염민선

한국과학기술정보연구원

슈퍼컴퓨팅응용실

(2)

목 차

제1장 유전체 데이터 분석 처리 ··· 1

1-1. Raw data processing – Quality Control ··· 1

1-2. Raw data processing – Mapping ··· 3

1-3. Raw data processing – Sorting, Duplicates ··· 4

1-4. Raw data processing – Realigning , Recalibration ··· 6

1-5. Variant Calling : GATK (Germline mutation) / Varscan (Somatic mutation) ··· 8

1-6. Annotation: AnnoVar ··· 10

1-7. CNV (Copy number variation) ··· 11

1-8. SV (structural variation) ··· 14

1-9. PathWay (structural variation) ··· 15

제2장 Post-MPN AML 유전체 데이터 분석 및 처리 ··· 16

2-1. SNP Analysis : Gemline calling(GATK) ··· 17

2-2. SNP Analysis : Somatic calling Variant (Mutect) ··· 18

2-3. CNV(Copy number variation) Analysis ··· 20

2-4. SV(structural variation) Analysis ··· 21

2-5. Pathway analysis ··· 20

부록 1. Annovar Filter-based Annotation ··· 24

부록 2. Bam File Depth Coverage ··· 40

(3)
(4)

1. 유전체 데이터 분석 및 처리

■ WorkFlow (Tools)

1-1. Raw data processing – Quality Control

- 유전자 분석을 통한 시퀀스 데이터를 얻게 되면 유전체 분석을 시작하기 전에 먼저 실제로 기계를 통해 얻어진 시퀀싱 데이터가 얼마만큼 정확하고 연구에 사용하기에 적합한 결과 값인지를 파악하기 위한 선행 검토를 실시. 대량의 시퀀스 중에서 잘못된 것은 없는지 확인하고 특정 값 이하인 부분은 모두 제외시키고 연구를 하는 것이 매우 중요함. 이를 품질관리라고 부르며 ‘Quality control’이라고도 함.

기본적으로 NGSshort에서는 모든 read들의 품질 점수가 20 이하인 값들을 모두 제거를 하게 됨. 하지만 본 소프트웨어에서는 사용자가 직접 어느 정도를 기준으로 잡고 추려낼지 개인적으로 설정이 가능하며 본 연구와 관련이 없는 부분을 모두 제거할 수 있음. (사용 가능한 분석 tool : NGSQCToolkit)

(5)

그림. Quality Control trimming.html

Ÿ QC Command : NGSQCToolkit - Trimming

◾Quality Control (QC)

Fastq 파일에서 low quality base를 잘라내어 분석의 정확도를 높임 QC tools: FastQC, NGSQCToolkit, NGSshort, Trimmomatic Input: file_R1.fastq, file_R2.fastq

Output: file_R1_trimmed, file_R2_trimmed

$ perl NGSQCToolkit/Trimming/TrimmingReads.pl –i

file_R1.fastq –irev file_R2.fastq –q (quality cutoff) –n (read length cutoff) –o file.out

*** -l : left side trimming / -r : right side trimming

Ÿ Output : Fastq file

① Header line : This line must start with "@", followed by the name of

(6)

the read (should be unique)

② The nucleotide sequence

③ A second header line : This line must start with "+". Usually, the information is the same as in the first header line, but it can also be blank (The "+" is still required though)

④ Quality Information : For each nucleotide in the sequence, an ASCII encoded quality score is reported. The idea is that better quality scores indicate the base is reliably reported, while poor quality scores reflect uncertaintly about the true identity of the base.

1-2. Raw data processing – Mapping

- 대량의 시퀀스를 검토하고 연구에 사용할 수 있는 정확한 값만을 추려낸 결과 값을 인간 유전체 프로젝트를 통해 밝혀진 인간 유전체에 read를 나열하여 붙여서 비교를 하는 과정이 필요함. 이 과정에서 사용하는 분석 프로그램은 DNA 염기서열을 정리해 놓은 FastQ 파일을 입력 값으로 사용하여 인간 유전체와 비교해 SAM파일을 결과 값으로 나타내게 됨. 하지만 이후의 분석을 하는 데에 SAM파일은 텍스트 파일로 되어 있어 용량을 크게 차지하고 인덱싱 되어있지 않아서 사용하기가 어려움. 따라서 텍스트 파일을 이진 파일로 바꾸어서 진행해야 더욱 빠른 분석이 가능함. 이 과정을 통해서 인간 유전체에 정렬시켜 같은 정확한 read 값들을 확인 할 수 있고 통계적 수치를 통해 염색체쌍이 정확히 연결 되었는지, 같은 염색체 상에서 정확히 mapping되었는지 확인이 가능하기 때문에 매우 용이함. (사용 가능한 분석 tool : BWA, samtools)

Ÿ Mapping Command : BWA (Burrows-Wheeler Aligner) option : mem

◾Mapping

개인의 sequence read를 reference genome에 mapping시켜 비교 Mapping tools: BWA

Input: file_R1_trimmed, file_R2_trimmed Output: file.sam

(7)

$ bwa/bwa mem -R (header line) reference.fa file_R1_trimmed file_R2_trimmed > file.sam

*** -t : multi-threading mode / -k : (minimum seed length) 일정 값 이하는 mapping되지 않도록 설정

Ÿ Output – Sam file** Alignment information

1-3. Raw data processing – Sorting, Duplicates

- BWA alignment 이후 과정은 정확한 유전체 분석을 하기 위해 한 번 더 데이터들을 검토하고 정리해 주는 과정. 이 분석과정을 통해서 유전자 정보를 레퍼런스에 맞도록 각 read를 다시 정리해 주고 좌표에 맞게 정렬하는 역할. 시퀀싱 과정에서 발생한 여러 가지 문제점들을 제거해 줌. 예를 들어 PCR과정을 통해 복제할 때 중복되어 나타나는 read들이나 오류가 일어난 이상한 read들을 다시 확인과정을 거침.

또한 DNA 염기쌍에 추가 되거나 제거가 된 부분이 생김에 따라서 인간 유전체에 분석 read를 정렬 시키는데 문제가 발생할 수 있기 때문에 염기들의 기본적인 추가 및 제거 데이터베이스와 비교하여 시퀀싱의 오류인지 재차 확인. (사용 가능한 분석 tool : Picard, GATK)

(8)

Ÿ Sorting & Duplicates Command : Picard(FixMateInformarion.jar)

◾Sorting

각각의 read를 mate pair와 비교하여 옵션에 따른 sorting 과정 Sorting tools: Picard, GATK

Input: file.bam Output: file_sort.bam

$ java –jar broadinstitute-picard/FixMateInformation.jar I=file.bam O=file_sort.bam SO=(sorting 옵션)

Duplicates

Sequencing 과정에서 생긴 duplicate read들을 제거하는 과정 Merge tools: picard

Input: file.bam (file_sort.bam) Output: file_sort_dup.bam

$ java –jar broadinstitute-picard/MarkDuplicates.jar I=file_sort.bam O=file_sort_dup.bam M=file.met REMOVE_DUPLICATES=true

*** M: duplicate reads matrix file 생성

Ÿ Output – Sam file(sorted bam, duplicated bam)

그림. Sorting Bam : chromosome과 position의 정렬되어서 출력됨

(9)

그림. Duplication : Chr, Position, CIGAR의 정보가 일치 시 PCR 중복된 시퀀스로 제거

1-4. Raw data processing – Realigning , Recalibration

- Local realignment 단계에서는 alignment 된 bam 파일에서

Indel(Inconsistenct indel, Cryptic indel) 부분의 Error로 인해 변이로 보이는 과정을 정렬하는 과정 Recalibaration 으로 Quality Score의 점수를 보정하여 재정렬 시킴

Ÿ

Realigning & Recalibration Command : GATK (

GenomeAnalysisTK.jar)

◾Realignment

Mismatch를 줄이고자 reference에 다시 mapping시켜 분석의 quality를 높임

Sorting tools: GATK Input: file_sort_dup.bam Output: file_sort_dup_rea.bam

(10)

$ java –jar GenomeAnalysisTK/GenomeAnalysisTK.jar –T RealignerTargetCreator –I file_sort_dup.bam –R (refence.fa) –known (other reference files such as indel vcf) –o file.intervals

$ java –jar GenomeAnalysisTK/GenomeAnalysisTK.jar –T IndelRealigner –targetIntervals file.intervals –I file_sort_dup.bam –R (reference.fa) –known (other reference files such as indel vcf) –o file_sort_dup_rea.bam

*** RealignerTargetCreator: mismatch 부분을 찾아내어 interval 파일 생성

*** IndelRealigner: interval 파일에 맞는 targeted mismatches(indels)에 맞춘 realignment 과정

◾Recalibration

Read base quality score를 기반으로 systematic error를 다시 한번 제거해 줌

recalibriation tools: GATK Input: file_sort_dup_rea.bam

Output: file_sort_dup_rea_recal.bam (Cleaned.bam 생성)

$ java –jar GenomeAnalysisTK/GenomeAnalysisTK.jar –T BaseRecalibrator –I file_sort_dup_rea.bam –R (reference.fa) –knownSites (other reference files such as snp or indel vcf) –o file.grp

$ java –jar GenomeAnalysisTK/GenomeAnalysisTK.jar –T PrintReads –I file_sort_dup_rea.bam –R (reference.fa) –BQSR file.grp --read_filter MappingQualityZero -o

file_sort_dup_rea_recal.bam

*** BaseRecalibrator: base quality score recalibration base call

*** PrintReads: base quality call에 맞도록 모든 filtering 과정 실행

*** BQSR: base quality score recalibration

*** --read_filter MappingQualityZero: filtering unmapped reads

(11)

Ÿ output : Bam file

그림. (좌)realignment, (우)recalibration : http://www.broadinstitute.org/gatk/

1-5. Variant Calling : GATK (Germline mutation) / Varscan (Somatic mutation)

- Variant calling이란 샘플을 시퀀싱해서 얻은 결과와 기본 인간 유전체 레퍼런스를 비교하여 염기서열이 얼마나 다른지를 유전형, 형질관계, 질병관련 변이를 찾아내는 것을 의미. 시퀀스가 다른 부분을 변이로 가정하고 여러 가지 방법을 통해서 실제로 변이일 확률을 계산해서 완벽한 변이들을 뽑아내서 분석하는 과정. 변이에는 정상인들의 시퀀싱 데이터를 레퍼런스와 비교하였을 때 흔히 가지는 변이들로 질병을 야기하는 확률이 매우 낮은 ‘Germline 변이’ 체세포나 특정 조직에서 후천적으로 발생하는 변이로서 질병(암)을 야기하는 ‘Somatic 변이’가 존재함.

(12)

Ÿ

Variant Calling Command : GATK, Mutect

◾Germline Muation : GATK Germline call tools: GATK Input: file_sort_dup_rea_recal.bam Output: file_germline_call.vcf

$ java –jar GenomeAnalysisTK/GenomeAnalysisTK.jar –T HaplotypeCaller –I file_sort_dup_rea_recal.bam –R (reference.fa) –dbsnp (SNP 데이터베이스) –o file_germline_call.vcf

◾Somatic Mutation : Mutect Somatic call tools: Mutect

Input: file_Normal_sort_dup_rea_recal.bam, file_Tumor_sort_dup_rea_recal.bam

Output: file_somatic_call.vcf

$ java –jar muTect/muTect.jar ––analysis_type MuTect ––reference_sequence (reference.fa) ––cosmic (cosmic 데이터베이스) ––input_file:normal

file_Normal_sort_dup_rea_recal.bam ––input_file:tumor file_Tumor_sort_dup_rea_recal.bam –vcf file_somatic_call.vcf

*** --intervals: 전체 genome에 대한 variant call대신에 특정 locus를 지정해서 target somatic call도 가능

Ÿ Output : VCF(Variant Call Format) File

*** GT: genotype

*** AD: Allelic Depth

*** BQ: Average base quality

(13)

*** DP: read depth

*** FA: Allele frateion of the alternate allele to reference

1-6. Annotation: AnnoVar

- 변이들을 나타낸 파일들은 vcf 형태로 나타나게 됨. 이 파일에는 레퍼런스와 비교했을 때 나타나는 변이가 존재하는 read들만을 따로 모아 둔 형태이지만 염기서열의 변화만으로는 연구자들이 무엇을 의미하는 변이이고 정확한 변이의 정보를 알 수가 없음. 변이에 대한 정보를 한눈에 보고자 모든 유전체 변이 분석 데이터를 모아놓은 파일과 비교 분석 하여야만 다음에 해당하는 변이가 어떤 문제를 일으키고 유전자 중심으로 어떠한 변화가 발생하게 되는지에 대해 이해가 쉬움. 좌표 자체가 염색체 유전체의 좌표이기 때문에 빠르고 간편하게 어떤 유전자와 어떤 관계에 있는지 알아볼 수 있음.

코딩부위가 아니고 프로모터 부분에 변이가 생기게 되면 단백질 시퀀스 자체에는 변화가 없지만 단백질 발현 양에 문제가 발생 할 수 있고 특정 유전자와는 관계가 없지만 멀리 떨어진 곳이나 유전자와 유전자 사이에 변이가 발생하여 또 다른 유전자에 영향을 끼치는 변이 생성 유무를 확인 가능.

Ÿ

Annotation Command : AnnoVar

◾Input file 제작

Germline call tools: annovar

Input: file_germline_call.vcf or file_somatic_call.vcf Output: file_input

$ convert2annovar.pl –format vcf4old file_somatic_call.vcf >

file_input

◾Mutation Annotation

Somatic call tools: annovar Input: file_input

Output: file_annot.variant_function file_annot.exonic_variant_function

$ annotate_variation.pl –out file_annot –build (reference 정보 eg. hg19) file_input (annovar reference 데이터베이스)

(14)

Ÿ Output : txt file

1-7. CNV (Copy number variation)

- 유전체 단위반복 변이는 DNA가 복제될 때 일부가 만들어 지지 않아 1kb이상이 결실되거나 혹은 반복적으로 만들어져 복제의 양이

달라지고 형질변화나 질병의 유무와 밀접한 관계가 있음. 이러한 문제 발생 시에는 유전자 발현 양에 큰 영향을 끼쳐 단일염기 다형성 변이와는 또 다른 문제점이 발생할 수 있음. 가장 대표적인 질병의 예로는 주의력결핍 과잉 행동장애로서 유전적으로 특정 염기서열이 결실되거나 증폭, 전위되어 유전자의 구조적 변이에 의해 일어남.

유전체 분석을 통해 유전자 발현양의 차이와 read depth 분석을 거쳐 유전적 형질변화를 알아내게 됨.

- CNVnator는 전체 유전체를 동일한 크기의 작은 read 조각들로 분리시 키거나 쌍으로 연결되어 있는 read들을 레퍼런스에 정렬시킨 뒤 read depth의 양으로 유전체 분석 실행. 혹은 각 read 조각에 주기적인 신호 를 보내면서 read조각들이 신호에 반응하는 차이를 분석하게 됨. 유전 체 단위반복 변이가 발생한 부위는 정상적인 부분들과 비교했을 때 같 은 염기서열들이 반복적으로 존재하기 때문에 신호에 반응하는 양의 차 이로 구분이 가능함.

(15)

Ÿ

CNV(Copy number variation) Command : CNVnator

◾Input file

Germline A fasta file of scaffolds/chromosomes A bam file

Individual fasta files for each scaffold/chromosome

◾CNVnator

1.Pre-processing step : $ cnvnator –root [out.root] –genome [ref.fa] –chrom [chr#] –tree [bam]

2.Making Histogram : $ cnvnator –root [out.root] –genome [ref.fa]

–chrom [chr#] –his [bin size]

3.Calculating Statistics : $ cnvnator –root [out.root] –genome [ref.fa] –chrom [chr#] -stat [bin size]

4.Partitioning : $ cnvnator –root [out.root] –genome [ref.fa]

–chrom [chr#] -partition [bin size]

5.Potential CNV : $ cnvnator –root [out.root] –genome [ref.fa]

–chrom [chr#] -call [bin size] > [out txt file]

6.Visualizing : $ cnvnator –root [out.root] –genome [ref.fa]

–chrom [chr#] -view [bin size] > [보고자 하는 chr, position 구간]

Ÿ Output : png file

그림. CNVnator Result image

- 특정부위가 반복되어 일어나거나 원래 read가 존재해야 할 부분에 다량 결실이 되어 정렬이 되지 않는 부분들이 발생한다면 정상의 경우와 비

(16)

교하였을 때 copy number의 차이로 변이가 발생한 부분의 위치와 발 현양의 차이를 확인 가능함. Whole Exome Sequencing을 통해 얻은 결 과를 CNVnator를 이용하여 염색체별로 각 위치에 나타나는 모든 copy number의 차이를 한눈에 비교하여 볼 수 있음. 한 사람의 정상조직과 암이 발생한 조직을 떼어내어 시퀀싱 한 결과를 이 툴들을 이용하여 분 석한 결과로 copy number 발현 패턴 차이로 비교가 가능.

1-8. SV (structural variation)

- 구조적 변이는 유전체의 염기 서열 중에서 일부분이 레퍼런스와 대비하 여 삽입되거나 삭제, 전위가 되어 염기 서열 구조에 변화가 있을 경우 의 변이를 나타낸다. NGS 분석을 이용하여 DNA 구조적 변이를 찾기 위해서는 read를 레퍼런스에 정렬시킨 뒤 특정한 위치에 얼마만큼의 read들이 mapping이 되는지와 염기쌍의 read들이 정확하게 mapping 되는지, read들이 원래 자리와 다르게 분리되어 mapping이 되는지의 여부를 분석함으로서 알 수 있음. 앞에서 언급했던 소프트웨어를 통해 시퀀싱 후 얻은 데이터를 레퍼런스에 mapping 시키고 또 다른 툴을 이 용해서 정보들을 가공하는 과정에서 레퍼런스에 정확히 일치하지 않는 부분들을 DNA 연구 분석에 사용하게 됨.

Ÿ

SV (structural variation) Command : BreakDancer, Delly, Pindel

◾BreakDancer

Read를 비교하여 insert size나 flag distribution을 나타내어 줌 Input: file_Normal_sort_dup_rea_recal.bam,

file_Tumor_sort_dup_rea_recal.bam Output: file.cfg

$ breakdancer-max/bam2cfg.pl –h file_Tumor_sort_dup_rea_recal.bam file_Normal_sort_dup_rea_recal.bam > file.cfg

*** -h: insert size histogram 생성 / -q: minimum mapping quality

(17)

◾Delly

1. Structure variation

Input: file_sort_dup_rea_recal.bam Output: file_(SV type).vcf

$ delly –t (SV type eg. INS, DEL, DUP, INV, TRA) –o file_INS.vcf –g (reference.fa) file_sort_dup_rea_recal.bam

2. Visualization

Input: file_sort_dup_rea_recal.bam Output: file.vcf.gz

$ python suave_bam_to_h5.py -s (control or tumor) -c gzip –o file.h5 file_sort_dup_rea_recal.bam

$ python suave_server.py –f control.h5 –f tumor.h5 –v file.vcf.gz

◾Pindel

Input: file_sort_dup_rea_recal.bam Output: file.pindel_input

$ pindel/bam2pindel.pl –i file_sort_dup_rea_recal.bam –o file.pindel_input –s normal

*** -s: sample name

Ÿ Output : BreakDancer(file.cfg) , Delly(file.ctx, file.png) , Pindel(file.vcf)

그림. BreakDancer(file.cfg) , Delly(file.ctx, file.png) , Pindel(file.vcf)

(18)

1-9. PathWay (structural variation)

- 추출된 유전자들에서 어떤 pathway에 속하며, 어떤 역할을 하는지에 대한 직관적인 시각화프로그램으로 발현정보의 반영이 되어 있어 위치 상에 발현의 증가 및 감소의 차이가 가능 함

그림. KEGG PathWay

- 연구자들이 이미 다양한 분야의 연구를 통해 작성하여 놓은 논문들이 게재되게 되면 pubmed에 등재되는 모든 논문을 실시간으로 수집하게 되고 각 논문들에서 관련이 깊은 핵심 단어들을 뽑아내어 모든 논문들 을 관련성 있게 하나의 네트워크로 표현을 할 수 있게 됨.

(19)

2. Post-MPN AML 유전체데이터 분석 및 처리

■ WorkFlow

■ Samples

(20)

2-1. SNP Analysis : Gemline calling(GATK)

- MPN 5 samples에서의 각각의 normal, tumor 데이터를 토대로 germline calling, somatic calling 의 variant Type, 유의성의 기준으로 matrix table 제작

- GATK로 germline 분석 평균 5백만 variant개수로 나타나며, 그중 exon 데이터에서 mutation의 영향으로 단백질이 변하는 Non-synonymous는 약 만개의 variant로 추출 됨. 또한 Stopgain, Stoploss 에서도 MPN에 서의 중요한 인자를 Annotation 및 DB Freq 비교를 통해 분석

-Matrix table에서와 같이 TRMT13(chr1_100598876),

RNF223(chr1_1007432), SASS6(chr1_100575933)등 nonsynonymous type 과 KRG, 1000 Genome Database에서의 Freq에서 유의성 나타냄

(21)

2-2. SNP Analysis : Somatic calling Variant (Mutect)

- Somatic Calling(Mutect)의 분석 평균 6백만 variant개수로 나타나며, exon 데이터에서 평균 mutation의 개수는 2만7천개의 variant로 보여 짐. mutation의 영향으로 단백질이 변하는 Non-synonymous는 약 1만 3천개 의 variant로 추출 됨. 또한 Stopgain, Stoploss 에서도 MPN에서 의 중요한 인자를 Annotation 및 DB Freq 비교를 통해 분석

그림. Mutect variant region

(22)

그림. Mutect exon region variant

- AML-Kor(n=11), MPN(n=4), TCGC(n=22)의 Variant-Sample matrix table에서 KMT2C, TUBB8, NBPF20, MST1, FOXD4L3, AHNAK, GOLGA8J 의 유전자는 AML-Kor, MPN에서의 공통적으로 발견된 Mutation으로 보여지며, TXNDC2의 유전자의 경우 AML-kor, TCGA에 서 공통적으로 유의성이 발견된 Mutation으로 나타남

그림. Variant-Samples Matrix : MPN

(23)

2-3. CNV(Copy number variation) Analysis

- MPN(n=5)의 Normal과 Tumor에서 Chromosome 별 CNV(Copy number variation) 분석에서 유의성이 나타나는 부분은 나타나지 않았 으며, Chr13번을 제외한 나머지 부분에서 InDel, Insertion, Inversion, Duplication, Intra Trans, Inter Trans 의 특이점을 찾아 내기위해, SV tools을 이용하여(BreakDance, Delly, Pindel) 분석이 필요함

(24)

2-4. SV(structural variation) Analysis

- 기본적인 분석 후 Delly, BreakDancer, Pindel 프로그램을 이용하여 DNA의 결실, 삽입, 전위, 복제, 염색체내 전좌, 염색체간의 전좌 등의 구조적 변이를 비교. Delly는 짧은 염기쌍들이 삽입되거나 큰 부위가 결실되어 read가 분리된 경우를 레퍼런스에 정렬시킬 때 유전체의 구 조적 변화가 크게 일어나는 부분들을 뽑아내어 특정 알고리즘을 통해 mapping 패턴을 분석하여 결과를 가짐. 또한 염기쌍들은 시퀀싱을 할 때의 구조를 일부 추측할 수 있기 때문에 read가 분리되어 정렬되는 변이들을 찾아내는데 용이함.

- 분리된 read들을 다시 일반적으로 일어나는 DNA 구조적 변이 레퍼런 스와 비교하여 반복 검토 뒤 알고리즘 분석 방법을 이용 결과 값을 나타냄. BreakDancer는 마찬가지로 염기쌍으로 이루어진 NGS 데이터 read들을 분석하여 구조적 변이를 알아보는 프로그램. 이 프로그램은 10bp ~ 1Mbp 정도의 변이를 찾아낼 수 있음. Pindel은 다른 프로그 램과는 다르게 split read들의 패턴을 분석하여 구조적인 차이를 확인 함. 이 세 가지 방법을 모두 이용해서 Whole genome sequencing 결

(25)

과를 분석하고 세 가지 분석 결과를 비교하고 공통된 결과 값들을 도 출하여 유전자들의 구조적 변화를 확인.

그림.1) Common Genes, 2)Del-Common(BreakDancer,Delly,Pindel), 3) DUP-common(Delly,pindel)

- 3개의 SV Tools(BreakDancer, Delly, Pindel) 의 6type (InDel, Insertion, Inversion, Duplication, Intra Trans, Inter Trans)에 따라 MPN(n=5) 샘플 의 Variant와 Gene을 추출하고, 공통으로 나타나는 Gene을 추출하여 Filtering을 적용하여, DeL(n=533), INS(n=1032), INV(n=2), DUP(n=8), ITX(n=5032), CTX(n=2)가 Common하게 추출 되었으며, DEL에서는 ADARB2, CDH4, DCC, NXN, GMDS, EYS등의 유전자, INS에서는 CALN1, CEP112, DPMD, MUTS53,PTPRN2, DUP에서는 CDK11B, PTPRN2, WDPCP, SMOC2, INV에서는 DSTYK, HERC2, RYR2, ACACA등, INX의 경우 ABR, AACS, AFF3, AK3, 마지막으로 Fusion을 일으키는 CTX 경우 DENND1B-MLLT10, SLC45A1-FGF3, CAMTA1-ANKLE2의 유전 자정보를 추출함

(26)

2-5. Pathway analysis

- 염증을 일으키는 IL-6관련하여 IL-6 JAK-STAT, STAT3, TLR3 등과 상화 작용하여 activate 및 inhibited로 작용하여 영향을 미치는 네트워크를 확인해 볼 수 있음

(27)

부록 1.

(28)
(29)
(30)
(31)
(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)
(43)

부록 2.

수치

Updating...

참조

Updating...

관련 주제 :