• 검색 결과가 없습니다.

E. 조건 특이적인 단백질 상호작용 예측을 위한 유전자 공동발현 연관성

Ⅲ. 결과

A. 조건 특이적인 단백질-단백질 상호작용 데이터 구축 및 검증 결과

주요 공개 PPI 데이터베이스로부터 통합한 결과는 아래와 같다. 모든 종에서 MI:0914 (physical association)에 해당하는 고유한 PPIs 의 개수는 334,424 개 였으며 여기에 해당하는 고유한 논문의 개수는 40,098 개 였다.

Fig. 7. Integrated results of public PPI databases. 총 14 개의 PPI 데이터베이스를 통합한 결과를 전체 단백질 상호작용, 단백질, 논문 개수 별로 구분하였다.

색깔과 구획은 생물종의 비율에 해당한다.

아래 Fig. 8 은 줄기세포와 종양세포에서 조건특이적인 PPIs 를 큐레이션한 결과이다. 각 조건에 해당하는 개수는 고유한 개수이지만 다른 조건 사이에 공유되는 PPIs 가 존재할 수 있으며, 줄기세포 전체 종에서 큐레이션된 PPIs 의 개수는 2,441 개이며 종양세포에서는 모두 6,090 개의 PPIs 가 확인되었다.

종양세포의 경우, 데이터양의 방대함으로 인해 일부 주요 조건에 대한 큐레이션만 실시하였다. 종양세포는 큐레이션된 PPI 의 결과로써 최초 키워드를 통해 논문 초록을 검색한 후, 각 종양형태 별로 알려진 PPIs 의 개수에 따라 우선적으로 큐레이션을 실시하였다. 이때, PPIs 개수가 500 개 이상인 종양세포만 초록 큐레이션을 실시하였다

Fig. 8. Results of literature-curated condition-specific PPIs. 왼쪽 그림에는 큐레이션 중간 과정을 나타내었으며, 오른쪽에는 최종 큐레이션 결과를 나타내었다.

아래 결과 (Table 1)는 줄기세포 PPIs 를 생물종 별로 구분하여 확인한 것이다. 대부분 Human 과 Mouse 둘 중 하나에 해당됨을 알 수 있다. 본 결과는 지금까지 줄기세포의 PPIs 를 동정하는 관심 생물종이 바로 Human 과 Mouse 였음을 의미하며 개별 줄기세포의 종류에 따라서 특정 종에 편향되어 있음을 확인할 수 있다.

Table 1. Statistics of species in stem cells-specific PPIs

Condition Human Mouse H&M etc Total

Fig. 9. Network of human stem cells PPIs. 줄기세포 큐레이션 결과 중 하나의 네트 워크로 연결되는 PPIs로, 점은 단백질이며 선을 상호작용을 의미한다. 선 색깔은 해당 세포조건을 의미하며 점 크기는 이웃하는 단백질의 정도와 비례한다.

Fig. 10 은 Mouse의 줄기세포 네트워크를 나타낸 것으로, Human과 다르게 ESC의 PPIs가 많이 관찰됨을 알 수 있다. 또한, 잘 알려진 배아줄기세포의 만능 성 전사인자인 POU5F1이 허브로써 가장 많은 단백질과 상호작용하고 있음을 알 수 있다. 그와 상호작용하는 주요한 단백질들로 Sox2, Esrrb, Sall4 등이 있으며 마 찬가지로 많은 단백질 파트너를 공유하고 있음을 알 수 있다. 이어, POU5F1 및 NANOG 상호작용하는 모든 단백질들과 그들 사이에 존재하는 상호작용을 그림 (Fig. 11)으로 표현하였다. 이 네트워크는 실제로 생물학적인 의미를 함의하고 있 으며, 이 중 일부는 아직 알려지지 않은 중요한 메커니즘에 관여하고 있다고 가 정할 수 있다.

Fig. 10. Network of mouse stem cells PPIs. 줄기세포 큐레이션 결과 중 하나의 네트 워크로 연결되는 PPIs로, 점은 단백질이며 선을 상호작용을 의미한다. 선 색깔은 해당 세포조건을 의미하며 점 크기는 이웃하는 단백질의 정도와 비례한다.

Fig. 11. Mouse POU5F1 & NANOG network. ESC 만능성의 주요인자 중 하나인 POU5F1과 NANOG에 각각 상호작용하는 단백질과 그들 사이의 상호작용 네트워 크를 보여준다.

여러 조건들 사이의 PPI 공유정도를 확인한 결과는 아래 (Fig. 12)와 같으며, 해당 결과를 기반으로 군집화 분석을 실시한 결과, 줄기세포와 종양세포가 구분됨을 확인하였다. 이는 줄기세포와 종양세포간의 유사성에 대한 기존 연구에도 불구하고 여전히 차이가 있음을 나타낸다.

Fig. 12. Common PPIs across different conditions of stem cells and cancers. 초록색 레이블은 줄기세포이며 노란색은 종양세포에 해당하며, 매트릭스 내 값은 공유하는 PPI 의 개수이다. 매트릭스 배경색은 공유하는 PPIs 개수의 유의성에 해당된다. 이 유의성을 이용하여 계층군집화를 실시한 결과이다.

또한, GO 및 NOA 분석을 통해 본 큐레이션 결과가 실제 해당 기능을 나타내는지 확인하였다. Table 2 과 Table 3 과 같이, 해당 줄기세포에 밀접한 기능들을 가진 GO term 이 다수 나옴을 알 수 있고, 이를 근거로 본 큐레이션 작업이 생물학적으로 유의한 결과라고 할 수 있다.

Table 2. GO enrichment test of stem cells using protein set

Condition GO ID Enriched GO terms Count % P-value

mESC

GO:0001701 in utero embryonic development 20 7.94 7.92E-08 GO:0043009 chordate embryonic development 23 9.13 1.56E-06 GO:0009792

embryonic development ending in

birth or egg hatching 23 9.13 1.81E-06 GO:0048598 embryonic morphogenesis 13 5.16 0.015065

mHSC

GO:0048534

hemopoietic or lymphoid organ

development 12 6.22 7.83E-04

GO:0030097 hemopoiesis 11 5.7 0.001185

GO:0030099 myeloid cell differentiation 7 3.63 0.001247

mMSC

GO:0014031 mesenchymal cell development 4 9.09 3.77E-04 GO:0042692 muscle cell differentiation 5 11.36 4.13E-04 GO:0048762 mesenchymal cell differentiation 4 9.09 4.27E-04

hNSC

GO:0030182 neuron differentiation 22 19.3 6.08E-11 GO:0030900 forebrain development 14 12.28 3.54E-10

※ In Condition column, “m” stands for mouse and “h” stands for human.

Table 3. GO enrichment test of stem cells using protein interactions

Condition GO ID Enriched GO terms Count % P-value

mESC

GO:0019827 stem cell maintenance 10 2.69 2.10E-05 GO:0045595 regulation of cell differentiation 24 6.45 7.70E-04 GO:0048856 anatomical structure development 85 22.85 0.0012 GO:0050793 regulation of developmental process 32 8.6 0.0033 GO:0009790 embryo development 18 4.84 0.0035 GO:0032502 developmental process 136 36.56 0.0162

GO:0048513 organ development 29 7.8 0.0245

GO:0048731 system development 17 4.57 0.0311 GO:0010605 negative regulation of macromolecule

metabolic process

70 18.82 0.0346

※ In Condition column, “m” stands for mouse.

Table 4. Result of full GO enrichment test of mouse stem cells using protein set

Conditions

GO ID

and enriched GO terms Count % P-value

mESC

GO:0001701~in utero embryonic development 20 7.936508 7.92E-08 GO:0048864~stem cell development 7 2.777778 1.42E-06

GO:0043009~chordate embryonic development 23 9.126984 1.56E-06 GO:0009792~embryonic development ending in birth or

egg hatching

23 9.126984 1.81E-06

GO:0019827~stem cell maintenance 6 2.380952 2.34E-05 GO:0007548~sex differentiation 9 3.571429 0.001319 GO:0002520~immune system development 13 5.15873 0.003387 GO:0045165~cell fate commitment 8 3.174603 0.010482 GO:0001824~blastocyst development 5 1.984127 0.011591 GO:0008406~gonad development 6 2.380952 0.014575 GO:0048598~embryonic morphogenesis 13 5.15873 0.015065 GO:0035050~embryonic heart tube development 3 1.190476 0.02743

mHSC

GO:0048863~stem cell differentiation 5 2.590674 5.59E-04 GO:0048534~hemopoietic or lymphoid organ development 12 6.217617 7.83E-04

GO:0030097~hemopoiesis 11 5.699482 0.001185

GO:0030099~myeloid cell differentiation 7 3.626943 0.001247 GO:0045165~cell fate commitment 8 4.145078 0.002412 GO:0019827~stem cell maintenance 4 2.072539 0.002446 GO:0048864~stem cell development 4 2.072539 0.002788 GO:0045646~regulation of erythrocyte differentiation 3 1.554404 0.009352

GO:0001710~mesodermal cell fate commitment 2 1.036269 0.072355 GO:0040016~embryonic cleavage 2 1.036269 0.072355

mMSC

GO:0014031~mesenchymal cell development 4 9.090909 3.77E-04 GO:0042692~muscle cell differentiation 5 11.36364 4.13E-04 GO:0048762~mesenchymal cell differentiation 4 9.090909 4.27E-04 GO:0060485~mesenchyme development 4 9.090909 4.53E-04 GO:0045445~myoblast differentiation 3 6.818182 5.75E-04 GO:0051094~positive regulation of developmental process 4 9.090909 0.026476

GO:0051146~striated muscle cell differentiation 3 6.818182 0.029486 GO:0045843~negative regulation of striated muscle

development 2 4.545455 0.029777

GO:0048635~negative regulation of muscle development 2 4.545455 0.032707 GO:0045165~cell fate commitment 3 6.818182 0.072484 GO:0007492~endoderm development 2 4.545455 0.083989

Table 5. Result of full GO enrichment test of human stem cells using protein set Conditions

GO ID

and enriched GO terms Count % P-value

hESC

GO:0045449~regulation of transcription 60 56.60377 6.23E-19

GO:0006350~transcription 44 41.50943 2.99E-11

GO:0045597~positive regulation of cell differentiation 10 9.433962 4.50E-05 GO:0060284~regulation of cell development 9 8.490566 1.28E-04

GO:0007369~gastrulation 6 5.660377 1.57E-04

GO:0009952~anterior/posterior pattern formation 7 6.603774 5.62E-04 GO:0045165~cell fate commitment 6 5.660377 0.0035203 GO:0001701~in utero embryonic development 6 5.660377 0.0094224 GO:0040014~regulation of multicellular organism growth 4 3.773585 0.0100679 GO:0043009~chordate embryonic development 8 7.54717 0.0107563 GO:0009792~embryonic development ending in birth or

egg hatching

8 7.54717 0.0112641 GO:0009798~axis specification 3 2.830189 0.0201871 GO:0007276~gamete generation 8 7.54717 0.0257551 GO:0001707~mesoderm formation 3 2.830189 0.0284217 GO:0048332~mesoderm morphogenesis 3 2.830189 0.0314182 GO:0048568~embryonic organ development 5 4.716981 0.0374391

hNSC

GO:0060284~regulation of cell development 17 14.91228 1.14E-11 GO:0045596~negative regulation of cell differentiation 17 14.91228 2.52E-11 GO:0030182~neuron differentiation 22 19.29825 6.08E-11 GO:0030900~forebrain development 14 12.2807 3.54E-10 GO:0021954~central nervous system neuron development 8 7.017544 6.26E-09 GO:0021953~central nervous system neuron

differentiation 8 7.017544 3.28E-08

GO:0042063~gliogenesis 9 7.894737 5.85E-08

GO:0051960~regulation of nervous system development 13 11.40351 6.06E-08 GO:0048667~cell morphogenesis involved in neuron

differentiation

13 11.40351 1.54E-07

hHSC

GO:0002520~immune system development 40 7.490637 2.55E-13 GO:0048534~hemopoietic or lymphoid organ

development 37 6.928839 4.05E-12

GO:0045646~regulation of erythrocyte differentiation 9 1.685393 9.03E-08 GO:0045639~positive regulation of myeloid cell

differentiation

11 2.059925 1.58E-07 GO:0045579~positive regulation of B cell differentiation 6 1.123596 1.22E-06 GO:0002763~positive regulation of myeloid leukocyte

differentiation 8 1.498127 1.79E-06

GO:0002521~leukocyte differentiation 18 3.370787 5.11E-06 GO:0035162~embryonic hemopoiesis 6 1.123596 6.89E-06 GO:0002761~regulation of myeloid leukocyte

differentiation

10 1.872659 1.26E-05 GO:0045577~regulation of B cell differentiation 7 1.310861 1.30E-05 GO:0030098~lymphocyte differentiation 14 2.621723 8.77E-05

hMSC

GO:0045669~positive regulation of osteoblast differentiation

10 19.23077 9.60E-17 GO:0001501~skeletal system development 17 32.69231 1.04E-14 GO:0045667~regulation of osteoblast differentiation 10 19.23077 2.53E-14 GO:0051216~cartilage development 11 21.15385 8.84E-14 GO:0030509~BMP signaling pathway 9 17.30769 2.61E-12 GO:0030278~regulation of ossification 10 19.23077 7.47E-12

GO:0001503~ossification 11 21.15385 8.24E-12

GO:0060348~bone development 11 21.15385 1.62E-11 GO:0001649~osteoblast differentiation 8 15.38462 1.28E-10 GO:0045165~cell fate commitment 10 19.23077 1.43E-09 GO:0051153~regulation of striated muscle cell

differentiation

6 11.53846 9.46E-08 GO:0002051~osteoblast fate commitment 4 7.692308 1.78E-07 GO:0051147~regulation of muscle cell differentiation 6 11.53846 2.65E-07

Table 6. Result of full GO enrichment test of stem cells using protein interactions

GO ID Enriched GO terms P-value R T G O

GO:0045596 negative regulation of cell differentiation 1.70E-06 1334 372 22 17 GO:0051093 negative regulation of developmental process 1.00E-05 1334 372 28 19 GO:0034645 cellular macromolecule biosynthetic process 2.10E-05 1334 372 678 223 GO:0009059 macromolecule biosynthetic process 2.10E-05 1334 372 678 223 GO:0019827 stem cell maintenance 2.10E-05 1334 372 11 10 GO:0090304 nucleic acid metabolic process 2.10E-05 1334 372 755 244 GO:0019219 regulation of nucleobase, nucleoside, nucleotide

GO:0010556 regulation of macromolecule biosynthetic process 3.50E-05 1334 372 788 252 GO:0006139

nucleobase, nucleoside, nucleotide and nucleic

acid metabolic process 3.80E-05 1334 372 759 244 GO:0044249 cellular biosynthetic process 3.90E-05 1334 372 686 224 GO:0009058 biosynthetic process 3.90E-05 1334 372 686 224 GO:0031326 regulation of cellular biosynthetic process 4.00E-05 1334 372 789 252 GO:0009889 regulation of biosynthetic process 4.00E-05 1334 372 789 252 GO:0010468 regulation of gene expression 5.00E-05 1334 372 798 254 GO:0034641 cellular nitrogen compound metabolic process 5.10E-05 1334 372 761 244 GO:0006807 nitrogen compound metabolic process 5.80E-05 1334 372 762 244 GO:0045449 regulation of transcription 6.60E-05 1334 372 774 247

GO:0006350 transcription 1.80E-04 1334 372 661 214

GO:0060255 regulation of macromolecule metabolic process 3.50E-04 1334 372 824 257 GO:0031323 regulation of cellular metabolic process 4.00E-04 1334 372 825 257 GO:0007399 nervous system development 4.40E-04 1334 372 29 17 GO:0080090 regulation of primary metabolic process 4.80E-04 1334 372 819 255 GO:0045595 regulation of cell differentiation 7.70E-04 1334 372 48 24 GO:0044260 cellular macromolecule metabolic process 0.001 1334 372 848 261 GO:0000122

negative regulation of transcription from RNA

polymerase II promoter 0.0011 1334 372 106 44

GO:0043170 macromolecule metabolic process 0.0011 1334 372 849 261 GO:0048856 anatomical structure development 0.0012 1334 372 234 85

GO:0019222 regulation of metabolic process 0.0019 1334 372 846 259 GO:0050789 regulation of biological process 0.0024 1334 372 908 275 GO:0048519 negative regulation of biological process 0.0032 1334 372 290 100 GO:0044237 cellular metabolic process 0.0032 1334 372 862 262 GO:0050793 regulation of developmental process 0.0033 1334 372 75 32

GO:0009790 embryo development 0.0035 1334 372 36 18

GO:0065007 biological regulation 0.0046 1334 372 914 275

GO:0044238 primary metabolic process 0.0048 1334 372 862 261

GO:0009987 cellular process 0.0049 1334 3721100 323

GO:0050794 regulation of cellular process 0.0052 1334 372 889 268

GO:0006396 RNA processing 0.0059 1334 372 4 4

GO:0008152 metabolic process 0.007 1334 372 877 264

GO:0048523 negative regulation of cellular process 0.011 1334 372 280 94

GO:0032502 developmental process 0.0162 1334 372 427 136

GO:0006355 regulation of transcription, DNA-dependent 0.0191 1334 372 377 121

GO:0045165 cell fate commitment 0.0197 1334 372 14 8

GO:0032526 response to retinoic acid 0.0206 1334 372 7 5

GO:0033189 response to vitamin A 0.0206 1334 372 7 5

GO:0033273 response to vitamin 0.0206 1334 372 7 5

GO:0051252 regulation of RNA metabolic process 0.021 1334 372 378 121 GO:0001710 mesodermal cell fate commitment 0.0215 1334 372 3 3

GO:0031047 gene silencing by RNA 0.0215 1334 372 3 3

GO:0060795

cell fate commitment involved in the formation of

primary germ layers 0.0215 1334 372 3 3

GO:0010629 negative regulation of gene expression 0.0237 1334 372 200 68

GO:0048513 organ development 0.0245 1334 372 75 29

GO:0048731 system development 0.0311 1334 372 40 17

GO:0010605

negative regulation of macromolecule metabolic

process 0.0346 1334 372 210 70

R: Number of genes in reference set; T: Number of genes in test set; G: Number of genes annotated by given term in reference set; O: Number of genes annotated by given term in test set

B. 유전자 공동발현 연관성 측정법 비교결과

Random 에서는 Quantile&MI (P = 5.8E-06)와 Boundary&MIk (P = 9.9E-06), General 과 비교 시 Boundary&MIk (P = 2.9E-02)가 이에 해당한다.

Fig. 13. Comparison of normalization and co-expression measures in predicting ESC-specific PPIs. ESC-ESC-specific PPIs 와 general PPIs 사이의 차이를 구하고 가장 유의한 결과에 p-value를 표시하였다. 표시된 noNorm&MIk (Mouse), Quantile&MIk (Human) 외에도 회색을 제외한 부분은 모두 유의한 차이 (P < 0.05)가 있는 결과에 해당한 다.

Fig. 14. Results of methods showing ESC-specific PPIs of significant difference to general PPIs. 정규화 방법에서는 Boundary, median, quantile 이, 공동발현 연관성 방법에서는 상호정보량에 기반한 방법이 유의한 결과를 많이 나타냈다.

Fig. 15. Distribution of the most significant ESC-specific PPIs. ESC PPIs (적색선)와 general PPIs (청색선) 사이의 차이가 가장 유의하게 나온 방법의 결과를 Human과 Mouse에서 각각 나타내었다.

Fig. 16. Distribution of widely significant ESC-specific PPIs. ESC PPIs (적색선)와 general PPIs (청색선) 사이의 차이가 가장 여러 번 유의하게 나온 방법의 결과를 Human과 Mouse에서 각각 나타내었다.

IV. 고찰

본 연구는 마이크로어레이 데이터를 이용한 조건 특이적인 PPIs 예측정도를 확인한 것으로, 이를 위해서 첫째, 조건 특이적인 PPIs 데이터를 구축하고 둘째, 다양한 마이크로어레이 전처리 방법과 유전자 공동발현 측정법을 포괄적으로 비교분석하였다.

실제, ESC 를 대상으로 조건 특이적인 PPIs 사이의 유전자 공동발현 정도가 General PPIs, random pairs 및 NIPs 보다 가장 높게 나왔으며, 이 결과는 Random 과 General PPIs 와 비교했을 시 유의한 차이가 있음을 보여주었다. 특히, ESC 를 Random 과 비교했을 시 General 보다 더 많은 방법조합 (정규화 및 연관성) 사이에서 유의함을 나타내었으며, 가장 유의한 P-value 를 나타낸 것도 random 과의 비교 (Mouse, 29 개 조합, P = 4.2E-15; Human, 20 개 조합, P = 2.7E-06)에서 였다.

위와 같은 결과는 타당함과 동시에 여전히 General PPIs 와 조건 특이적인 PPIs 사이의 유사함을 의미하고 있으며, 이는 General PPIs 에 여러 조건 특이적인 PPIs 가 혼재되어 있음을 말해주고 있다. 실제로 본 연구에서 구축한 조건 특이적인 PPIs 데이터는 General PPIs 에서 유래한 일부에 해당한다.

연관성 측정법 및 정규화 방법을 비교한 결과는 흥미롭게도 MIk 방법이 가장 좋은 성능을 나타낸 공동발현 측정법 (Reshef 등, 2011; Song 등, 2012) 이었으며, Mouse 에 있어서는 추가적인 정규화를 하지 않는 raw 데이터에서 가장 좋은 성능을 보여주었다. 이는 본 연구에서 사용한 데이터가 이미 충분한 표본

간 오차가 교정되어있음을 의미한다. 이어 유의하게 나온 정규화 방법은

데이터에 대하여 Interlog 맵핑을 적용하여 ESC 및 다른 조건에서 추가연구를 진행할 수 있을 것이다. 또한, 마이크로어레이 데이터의 정규화 방법 외에

데이터에 대하여 Interlog 맵핑을 적용하여 ESC 및 다른 조건에서 추가연구를 진행할 수 있을 것이다. 또한, 마이크로어레이 데이터의 정규화 방법 외에

관련 문서