• 검색 결과가 없습니다.

GalaxyTBM을 이용한 Clostridium hylemonae의 ᴅ-Psicose 3-Epimerase (DPE) 단백질 구조 예측

N/A
N/A
Protected

Academic year: 2021

Share "GalaxyTBM을 이용한 Clostridium hylemonae의 ᴅ-Psicose 3-Epimerase (DPE) 단백질 구조 예측"

Copied!
7
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

GalaxyTBM 을 이용한 Clostridium hylemonae의

D

-Psicose 3-Epimerase (DPE) 단백질 구조 예측

이현진

1

, 박지현

1

, 최연욱

2

, 이근우

1,2*

1

경상남도 진주시 가좌동 진주대로 501 경상대학교 생명과학부

2

경상남도 진주시 가좌동 진주대로 501 경상대학교 응용생명과학부

E-mail: [email protected], [email protected], [email protected],

D

-Psicose 3-Epimerase (DPE)는

D

-Fructose의 C3 Epimerase로써

D

-Fructose를

D

-Psicose로 전환해 주는 효소이다.

D

-Psicose는 설탕 대신 사용하는 감미료로 몸에 흡수되지 않아 칼로리가 없다고 알려져 있고 자연에서는 오로지 DPE에 의해서만 생산되는 희귀당이다. 이에 따라 DPE를 통한

D

- Psicose 대량생산의 필요성이 대두되고 있는 등 이 분야에 대한 관심이 뜨거운 실정이다. 본 연 구팀은 이 당과 관련된 작용기작 연구를 수행하기 위하여 아직 단백질 3차구조가 알려지지 않은 Clostridium hylemonae DPE (chDPE) 단백질의 3차 구조예측 연구를 수행 하였다. 우리는 HHsearch를 이용하여 agrobacterium tumefaciens 의 DPE 외 2개의 구조를 호몰로지 모델링 연구 를 위한 주형으로 선정하였다. 다음으로 PROMALS3D를 이용하여 주형들과 chDPE의 multiple sequence alignment를 수행하였고 이를 바탕으로 3차구조 예측 연구를 수행 하였다. 예측된 구 조를 검증하기 위하여 ProSA와 Ramachandran plot분석을 이용하였고 Ramachandran plot에서 단백질의 94.8%에 해당하는 잔기들이 favoured regions에 위치하였다. ProSA에서는 Z-score값이 -9.3으로 X-선 결정학이나 핵자기 공명법으로 밝혀진 구조들에서 관측되는 범위 내에 위치하였다.

나아가 예측된 구조에

D

-Psicose와

D

-Fructose의 결합모드를 규명하기 위하여 도킹을 시도하였다.

이번 연구를 통하여 chDPE의 구조를 예측 할 수 있었고 이를 바탕으로 이 단백질의 기능을 이해 하는데 도움을 줄 것으로 기대된다.

핵심어 : 단일 효소 반응, Michaelis-Menten 이론, 효소의 전환 시간의 분포, 갱신과정, 평균 제곱 변위

서론

D

-Psicose 3-Epimerase (DPE)는

D

-Fructose의 C3 Epimerase로써

D

-Fructose를

D

-Psicose로 바꿔주 는 단백질 효소이며 active site 내에 금속이온으 로 망간 이온을 포함하고 있다 (그림1).

D

-Psicose

는 설탕 대신 사용하는 감미료로 몸에 흡수되지

않아 칼로리가 없다고 알려져 있으며 자연에서는

오로지 DPE에 의해서 생산되는 희귀당이다.

1 D

-Psicose를 대량으로 생산하기 위해서는

Clostridium hylemonae 종의 DPE 구조를 밝혀

(2)

173

내는 것이 우선 과제이며 이미 안전성 여부는 Mitsubishi Chemical Safety Institute

*

에 의해 총 5가지 테스트를 통하여 특별한 위험성이 감지되 지 않았음이 증명되었다. Agrobacterium tumefaciens 의 DPE (atDPE)는 구조가 밝혀져 있 는 반면, 이보다 열 안정성이 더 높은 Clostridium hylemonae 의 DPE (chDPE)의 구조는 아직 밝혀져 있지 않았다. 이에 chDPE의 구조예 측이 필요하게 되었고 이를 위해 GalaxyTBM (template-based modeling) 을 이용하여 chDPE 의 구조를 예측 및 분석 하였다. 단백질의 기능 을 원자수준에서 이해하고 그 기능을 제어하는 물질을 개발하기 위해서는 단백질의 구조를 원자 수준에서 알아야 한다. 하지만 통상적인 X-선 결 정학이나 핵자기 공명법 등을 통한 단백질 구조 결정 과정은 많은 시간과 인력, 비용이 많이 드 는 실정이다. 이에 컴퓨터를 이용한 구조예측의 필요성이 대두되었고 크게 template-based modeling (Homology modeling, comparative modeling)과 ab initio 등의 방법이 이용이 되고 있다. 그 중에서 template-based modeling 은 이 미 구조가 알려져 있는 단백질을 주형으로 하여 구조가 밝혀지지 않은 단백질의 3D 구조를 예측 하는 방법으로 sequence alignment단계에서 두 단백질이 30% 이상의 서열 유사성만 가지고 있 으면 90% 정도의 정확도로 target단백질의 구조 예측이 가능한 것으로 알려져 있다.

*일본에 있는 미쓰비시 화학주식회사

이론 및 계산방법

최근 들어 구조가 밝혀진 단백질의 수가 늘어나 면서 아미노산 서열이 비슷한 경우 이미 밝혀진 구조를 주형으로 이용하여 높은 수준의 정확도로 구조를 예측하는 것이 가능해졌다. 주형을 찾을 수 없는 단백질의 경우 그 구조를 정확히 예측하 는 것은 아직 어려운 단계이므로 주형기반 단백 질 구조예측이 현실적으로 가장 유용한 단백질 구조예측 연구 방법이다.

본 연구는 GalaxyTBM (template-based modeling) 을 이용하여 chDPE의 구조를 예측하고 검증 분 석 하는 것으로 총 4단계에 걸쳐 진행 되었다. 1 단계로 HHsearch

2

를 이용하여 주형단백질을 검 색하는데, 이 때 rescoring 과정을 통해 여러 가 지 후보 단백질들을 제시해준다. 이러한 rescoring 과정은 서열과 단백질의 2차 구조를 기반으로 계산되며 이는 구조 예측의 효율성을 증대시켜주는 큰 특징이라 볼 수 있다. 2단계는 주형 단백질과 표적 단백질의 서열 정렬과정으로 이는 가장 많이 사용되는 tool중 하나인 PSI- BLAST를 기반으로 한 PROMALS3D 프로그램을 통해 시행된다. 다음으로 3단계에서는 주형 단백 질의 구조와 서열정렬로부터 모델 구조를 예측하 는 과정으로, MODELLER-CSA를 이용하여 수행된 다.

그림 13. D-Fructose 와 D-Psicose 관계

(3)

Model construction은 Galaxy program package 에 있는 CSA (conformational space annealing) 를 사용한다. Optimization에는 두 종류가 있으며, global optimization이 시스템 차원에서 전략을 탐색하여 전체의 구성을 주도하여 최적의 답을 찾는 것이라면 local optimization은 국소 지역의 에너지 최적화 과정을 통해 단백질 전역으로 확 장시켜가며 그 최적의 답을 찾는 것을 뜻한다.

Galaxy TBM 의 최종단계인 4단계에서는 생성된 모델 구조의 정밀화 (Refinement) 과정을 거친다.

이는 Galaxy REFINE을 통해 수행되며 단백질에 advanced loop와 terminus를 추가하는 단계이다.

또한, 이 과정에서 적절하지 않은 구조배치를 탐 지하고 이를 수정 및 보완하게 된다.

일반적으로, template-based modeling을 통한 단 백질 구조예측 과정에서 sequence identity의 정 도는 정확한 모델을 만드는데 중요한 요소이다.

하지만 아무리 sequence identity 가 높다 하더라 도 정확한 side-chain의 구조 예측은 매우 어려 운 문제이다. 그러나, Galaxy REFINE는 단백질 구 조 예측 학술대회 (Critical Assessment of techniques for protein Structure Prediction, CASP) 에서 입증된 프로그램으로서 side-chain의 구조

까지 완성시켜준다는 장점이 있다.

최종적으로 예측된 chDPE의 구조는

D

-Psicose와

D

-Fructose의 결합모드를 규명하기 위한 도킹을 시도하였다. 하지만 GalaxyDock을 이용한 도킹 계산 과정에서 chDPE의 active site내에 있는 망 간이온이 고려되지 않아서 적절한 결합모드를 구 할 수 없었다.

결론 및 토의

chDPE 단백질 구조 예측

기존에 밝혀진 구조들 중에서 chDPE와 가장 상 동성이 높은 주형 단백질을 찾기 위하여 HHsearch 를 수행한 결과, 3개의 주형 단백질, agrobacterium tumefaciens DPE (PDB ID: 2HK0), pseudomonas cichorii

D

-tagatose 3-epimerase (PDB ID: 2QUL), anabaena variabilis sugar phosphate isomerase/epimerase (PDB ID: 2QW5), 이 선정되었다 (그림2). 이들 3가지 주형 단백질 과 chDPE의 서열을 비교를 통해 일치하는 아미 노산 서열 영역과 2차 구조를 확인할 수 있었다 (그림3). 예측된 구조와 주형단백질 비교를 통해 단백질 내 backbone들이 대체로 일치하는 것을 알 수 있었다.

그림 14. HHpred 결과

(4)

175

그림 15. PROMAL 3D를 이용한 주형과 chDPE sequence alignment

(5)

예측된 구조의 검증 및 기질의 결합모드 조사 예측된 구조를 검증하기 위하여 ProSA와 Ramachandran plot

3

분석을 이용하였고 Ramachandran plot에서 단백질의 94.8%에 해당 하는 잔기들이 favoured regions에 위치하고, disallowed regions의 수치는 0%로 나타났다 (그 림 4). ProSA

4

에서는 Z-score값이 -9.3으로 X-선 결정학이나 핵자기 공명법으로 밝혀진 구조들에 서 관측되는 범위 내에 위치하였다 (그림5). 이러

한 검증 과정을 통하여 GalaxyTBM을 이용한 구 조예측이 잘 이루어졌음을 확인하였다. 나아가 예측된 구조에

D

-Psicose와

D

-Fructose의 결합모 드를 규명하기 위하여 GalaxyDock을 통해 도킹 을 시도하였지만 금속이온인 망간을 고려하지 못 하여 적절한 결합모드를 얻을 수 없었기 때문에 기존에 알려져 있는 atDPE와 기질들의 복합체구 조로부터 기질의 결합모드를 유추하였다.

그림 16. Procheck를 이용한 Ramachandran plot의 계산 결과

그림 17. Galaxy TBM에서 만들어진 final chDPE의 Z-score

(6)

177

3차 구조 최적화 작업

호몰로지 모델링으로 만들어진 최종 구조는 template 구조와 거의 같기 때문에 최종적으로 더욱 정확한 구조를 얻기 위해서는 ‘에너지 최적 화’ 과정 및 ‘분자동역학 모의실험’ 등의 과정을 거쳐 구조 안정화 및 최적화 작업이 필요하다.

우리는 그런 작업을 시도하려 서버에 제시된 몇 몇 프로그램들을 검토하여 보았으나 기질과 금속 이온인 망간이 제대로 적용되지 못하여 안타깝게 도 원하는 결과를 얻을 수 없었다. 이번 작업에 서는 제시된 프로그램을 대신하여 Discovery Studio3.5를 이용하여 기질이 결합된 chDPE복합 체 구조의 에너지 최적화 작업을 수행하여 개선 하였으며 최종적으로, 이 구조를 atDPE 결정구조 와 겹쳐보았다 (그림6).

결론

이번 연구에서 atDPE를 주형으로 하여 기존에 밝혀지지 않았던 chDPE단백질의 3차 구조를 예 측할 수 있었다. GalaxyTBM이라는 MODELLER를 이용하여 template searching, sequence alignment, homology modeling, reminement의 4

단계를 거쳐 진행되었으며 ProSA와 Ramachandran plot을 이용하여 구조의 타당성을 확인하였다.

이처럼 구조를 만든 후에 구조 최적화를 위하여 에너지 최적화나 분자동역학 모의실험 등을 수행 해야 하지만 서버에서 제공된 프로그램들을 이용 해서 금속이온과 기질이 결합된 복합체를 얻는데 한계가 있었다. 이에 우리는 Discovery Studio3.5 를 이용하여 기질과 금속이온이 결합된 구조의 에너지 최적화 과정을 수행하였다.

이번에는 비록 제시된 프로그램을 이용해서는 chDPE의 구조를 예측하는 단계에 그쳤지만 만들 어진 구조를 활용하여

D

-Psicose와

D

-Fructose 가 결합된chDPE 내 active site의 구조적 차이점을 규명 할 것 이다. 이를 바탕으로

D

-Fructose와의 결합력을 향상시킬 수 있도록 단백질 재설계 연 구를 수행할 것이며, 이러한 단백질 재설계 연구 기법을 통해

D

-Psicose의 생산량을 증가시킬 수 있는 개량된 chDPE를 예측할 것이다. 이는 앞으 로

D

-Psicose가 기본적인 감미료 역할을 하는 것 외에 첨가제, 음료, 건강식품, 화장품, 의약품 등 많은 분야에서 활용될 수 있을 것으로 기대된다.

D

-psicose의 결합 구조

D

-fructose의 결합 구조

그림 18. atDPE 와 예측된 chDPE와 기질 복합체 구조들의 비교. D-psicose가 결합한 atDPE(연두색),

chDPE(분홍색) 와 D-fructose가 결합한 atDPE(파란색), chDPE(주황색).

(7)

감사의 말

본 논문은 2015년도 정부(미래창조과학부)의 재원으로 한국연구재단 첨단 사이언스·교육 허브 개발 사업의 지원을 받아 수행된 연구임(No.

NRF-2012-M3C1A6035357)

참고문헌

1. Kim, K.S., Kim, H.J., Oh, D.K., Cha, S.S., and Rhee, S.K. ; Crystal Structure of D-Psicose 3- epimerase from Agrobacterium tumefaciens and its Complex with True Substrate D- Fructose: A Pivotal Role of Metal in catalysis, an Active Site for the Non-phosphorylated Substrate, and its Conformational Change. J.

Mol. biol. 2006; 361:920-931

2. Johannes Soding*, Andreas Biegert and Andrei N. Lupas ; the HHpred interactive server for protein homology detection and structure prediction , Nucleic Acids Research, 2005, Vol.

33 , W244–W248

3. Richardson, J.S.; Anatomy and Taxonomy of Protein Structures. Advances in Protein Chemistry, 1981

4. Wiederstein & Sippl ;ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins.

Nucleic Acids Research 35, 2007; W407-W410

수치

그림  15. PROMAL 3D를  이용한  주형과  chDPE sequence alignment
그림  17. Galaxy TBM에서  만들어진  final chDPE의  Z-score
그림  18. atDPE  와  예측된  chDPE와  기질  복합체  구조들의  비교. D-psicose가  결합한  atDPE(연두색),  chDPE(분홍색)  와  D-fructose가  결합한  atDPE(파란색), chDPE(주황색).

참조

관련 문서

환경기술 적용 방법에 따른 이산화 탄소 감소량 예측...

그러나 국가적 차원의 평생학습 관련 정책을 수립하고 추진하기 위해서 는 평생학습의 현황에 대한 정확한 진단과 그것을 토대로 한 미래의 예측 이 전제되어야만

아미노산 가지사슬들 간의 견인력:.. 공유결합, 이온결합, 수소결합, Van der Waals 견인력,

- 적혈구 생성: 에르스로포이에틴erythropoietin이 라는 호르몬에 의해 촉진. 산소 공급이 저하될 때 신장에서 방출. 단백질, DNA 생산에 필요한

<그림 2-3> P450의 heme prosthetic group(햄-보결분자단): 햄-보결 분자단은 P450의 활성부위이며 3가철이온(FeIII)-protoporphyrin-IX가 단백질

모발의 구성 : -SH기를 지닌 시스테인(Cys)이 많은 케라틴(keratin) 단백질으로 구성 - 시스테인은 단백질 사슬 사이에 이황화결합 (-S-S-)을 형성해서 모발구조에 영향.

3) Galaxy Zoo: Mergers 4) Protein Modeling 5) Online Data Challenges 1) Milky Way Project 2) modeling Lens Candidates.. 3) Galaxy Zoo: Mergers 4) Protein Modeling 5)

한국농촌경 제연구원의 생육조사 자료 및 국립농업과학원 소기후 모형에 의해 추정된 농가별 기상 데이터를 각 각 생육 지표와 기상 정보 자료로서 분석에 이용하였으며,