GalaxyTBM 을 이용한 Clostridium hylemonae의
D
-Psicose 3-Epimerase (DPE) 단백질 구조 예측
이현진
1, 박지현
1, 최연욱
2, 이근우
1,2*1
경상남도 진주시 가좌동 진주대로 501 경상대학교 생명과학부
2
경상남도 진주시 가좌동 진주대로 501 경상대학교 응용생명과학부
E-mail: [email protected], [email protected], [email protected],
D
-Psicose 3-Epimerase (DPE)는
D-Fructose의 C3 Epimerase로써
D-Fructose를
D-Psicose로 전환해 주는 효소이다.
D-Psicose는 설탕 대신 사용하는 감미료로 몸에 흡수되지 않아 칼로리가 없다고 알려져 있고 자연에서는 오로지 DPE에 의해서만 생산되는 희귀당이다. 이에 따라 DPE를 통한
D- Psicose 대량생산의 필요성이 대두되고 있는 등 이 분야에 대한 관심이 뜨거운 실정이다. 본 연 구팀은 이 당과 관련된 작용기작 연구를 수행하기 위하여 아직 단백질 3차구조가 알려지지 않은 Clostridium hylemonae DPE (chDPE) 단백질의 3차 구조예측 연구를 수행 하였다. 우리는 HHsearch를 이용하여 agrobacterium tumefaciens 의 DPE 외 2개의 구조를 호몰로지 모델링 연구 를 위한 주형으로 선정하였다. 다음으로 PROMALS3D를 이용하여 주형들과 chDPE의 multiple sequence alignment를 수행하였고 이를 바탕으로 3차구조 예측 연구를 수행 하였다. 예측된 구 조를 검증하기 위하여 ProSA와 Ramachandran plot분석을 이용하였고 Ramachandran plot에서 단백질의 94.8%에 해당하는 잔기들이 favoured regions에 위치하였다. ProSA에서는 Z-score값이 -9.3으로 X-선 결정학이나 핵자기 공명법으로 밝혀진 구조들에서 관측되는 범위 내에 위치하였다.
나아가 예측된 구조에
D-Psicose와
D-Fructose의 결합모드를 규명하기 위하여 도킹을 시도하였다.
이번 연구를 통하여 chDPE의 구조를 예측 할 수 있었고 이를 바탕으로 이 단백질의 기능을 이해 하는데 도움을 줄 것으로 기대된다.
핵심어 : 단일 효소 반응, Michaelis-Menten 이론, 효소의 전환 시간의 분포, 갱신과정, 평균 제곱 변위
서론
D
-Psicose 3-Epimerase (DPE)는
D-Fructose의 C3 Epimerase로써
D-Fructose를
D-Psicose로 바꿔주 는 단백질 효소이며 active site 내에 금속이온으 로 망간 이온을 포함하고 있다 (그림1).
D-Psicose
는 설탕 대신 사용하는 감미료로 몸에 흡수되지
않아 칼로리가 없다고 알려져 있으며 자연에서는
오로지 DPE에 의해서 생산되는 희귀당이다.
1 D-Psicose를 대량으로 생산하기 위해서는
Clostridium hylemonae 종의 DPE 구조를 밝혀
173
내는 것이 우선 과제이며 이미 안전성 여부는 Mitsubishi Chemical Safety Institute
*에 의해 총 5가지 테스트를 통하여 특별한 위험성이 감지되 지 않았음이 증명되었다. Agrobacterium tumefaciens 의 DPE (atDPE)는 구조가 밝혀져 있 는 반면, 이보다 열 안정성이 더 높은 Clostridium hylemonae 의 DPE (chDPE)의 구조는 아직 밝혀져 있지 않았다. 이에 chDPE의 구조예 측이 필요하게 되었고 이를 위해 GalaxyTBM (template-based modeling) 을 이용하여 chDPE 의 구조를 예측 및 분석 하였다. 단백질의 기능 을 원자수준에서 이해하고 그 기능을 제어하는 물질을 개발하기 위해서는 단백질의 구조를 원자 수준에서 알아야 한다. 하지만 통상적인 X-선 결 정학이나 핵자기 공명법 등을 통한 단백질 구조 결정 과정은 많은 시간과 인력, 비용이 많이 드 는 실정이다. 이에 컴퓨터를 이용한 구조예측의 필요성이 대두되었고 크게 template-based modeling (Homology modeling, comparative modeling)과 ab initio 등의 방법이 이용이 되고 있다. 그 중에서 template-based modeling 은 이 미 구조가 알려져 있는 단백질을 주형으로 하여 구조가 밝혀지지 않은 단백질의 3D 구조를 예측 하는 방법으로 sequence alignment단계에서 두 단백질이 30% 이상의 서열 유사성만 가지고 있 으면 90% 정도의 정확도로 target단백질의 구조 예측이 가능한 것으로 알려져 있다.
*일본에 있는 미쓰비시 화학주식회사
이론 및 계산방법
최근 들어 구조가 밝혀진 단백질의 수가 늘어나 면서 아미노산 서열이 비슷한 경우 이미 밝혀진 구조를 주형으로 이용하여 높은 수준의 정확도로 구조를 예측하는 것이 가능해졌다. 주형을 찾을 수 없는 단백질의 경우 그 구조를 정확히 예측하 는 것은 아직 어려운 단계이므로 주형기반 단백 질 구조예측이 현실적으로 가장 유용한 단백질 구조예측 연구 방법이다.
본 연구는 GalaxyTBM (template-based modeling) 을 이용하여 chDPE의 구조를 예측하고 검증 분 석 하는 것으로 총 4단계에 걸쳐 진행 되었다. 1 단계로 HHsearch
2를 이용하여 주형단백질을 검 색하는데, 이 때 rescoring 과정을 통해 여러 가 지 후보 단백질들을 제시해준다. 이러한 rescoring 과정은 서열과 단백질의 2차 구조를 기반으로 계산되며 이는 구조 예측의 효율성을 증대시켜주는 큰 특징이라 볼 수 있다. 2단계는 주형 단백질과 표적 단백질의 서열 정렬과정으로 이는 가장 많이 사용되는 tool중 하나인 PSI- BLAST를 기반으로 한 PROMALS3D 프로그램을 통해 시행된다. 다음으로 3단계에서는 주형 단백 질의 구조와 서열정렬로부터 모델 구조를 예측하 는 과정으로, MODELLER-CSA를 이용하여 수행된 다.
그림 13. D-Fructose 와 D-Psicose 관계
Model construction은 Galaxy program package 에 있는 CSA (conformational space annealing) 를 사용한다. Optimization에는 두 종류가 있으며, global optimization이 시스템 차원에서 전략을 탐색하여 전체의 구성을 주도하여 최적의 답을 찾는 것이라면 local optimization은 국소 지역의 에너지 최적화 과정을 통해 단백질 전역으로 확 장시켜가며 그 최적의 답을 찾는 것을 뜻한다.
Galaxy TBM 의 최종단계인 4단계에서는 생성된 모델 구조의 정밀화 (Refinement) 과정을 거친다.
이는 Galaxy REFINE을 통해 수행되며 단백질에 advanced loop와 terminus를 추가하는 단계이다.
또한, 이 과정에서 적절하지 않은 구조배치를 탐 지하고 이를 수정 및 보완하게 된다.
일반적으로, template-based modeling을 통한 단 백질 구조예측 과정에서 sequence identity의 정 도는 정확한 모델을 만드는데 중요한 요소이다.
하지만 아무리 sequence identity 가 높다 하더라 도 정확한 side-chain의 구조 예측은 매우 어려 운 문제이다. 그러나, Galaxy REFINE는 단백질 구 조 예측 학술대회 (Critical Assessment of techniques for protein Structure Prediction, CASP) 에서 입증된 프로그램으로서 side-chain의 구조
까지 완성시켜준다는 장점이 있다.
최종적으로 예측된 chDPE의 구조는
D-Psicose와
D
-Fructose의 결합모드를 규명하기 위한 도킹을 시도하였다. 하지만 GalaxyDock을 이용한 도킹 계산 과정에서 chDPE의 active site내에 있는 망 간이온이 고려되지 않아서 적절한 결합모드를 구 할 수 없었다.
결론 및 토의
chDPE 단백질 구조 예측
기존에 밝혀진 구조들 중에서 chDPE와 가장 상 동성이 높은 주형 단백질을 찾기 위하여 HHsearch 를 수행한 결과, 3개의 주형 단백질, agrobacterium tumefaciens DPE (PDB ID: 2HK0), pseudomonas cichorii
D-tagatose 3-epimerase (PDB ID: 2QUL), anabaena variabilis sugar phosphate isomerase/epimerase (PDB ID: 2QW5), 이 선정되었다 (그림2). 이들 3가지 주형 단백질 과 chDPE의 서열을 비교를 통해 일치하는 아미 노산 서열 영역과 2차 구조를 확인할 수 있었다 (그림3). 예측된 구조와 주형단백질 비교를 통해 단백질 내 backbone들이 대체로 일치하는 것을 알 수 있었다.
그림 14. HHpred 결과
175
그림 15. PROMAL 3D를 이용한 주형과 chDPE sequence alignment
예측된 구조의 검증 및 기질의 결합모드 조사 예측된 구조를 검증하기 위하여 ProSA와 Ramachandran plot
3분석을 이용하였고 Ramachandran plot에서 단백질의 94.8%에 해당 하는 잔기들이 favoured regions에 위치하고, disallowed regions의 수치는 0%로 나타났다 (그 림 4). ProSA
4에서는 Z-score값이 -9.3으로 X-선 결정학이나 핵자기 공명법으로 밝혀진 구조들에 서 관측되는 범위 내에 위치하였다 (그림5). 이러
한 검증 과정을 통하여 GalaxyTBM을 이용한 구 조예측이 잘 이루어졌음을 확인하였다. 나아가 예측된 구조에
D-Psicose와
D-Fructose의 결합모 드를 규명하기 위하여 GalaxyDock을 통해 도킹 을 시도하였지만 금속이온인 망간을 고려하지 못 하여 적절한 결합모드를 얻을 수 없었기 때문에 기존에 알려져 있는 atDPE와 기질들의 복합체구 조로부터 기질의 결합모드를 유추하였다.
그림 16. Procheck를 이용한 Ramachandran plot의 계산 결과
그림 17. Galaxy TBM에서 만들어진 final chDPE의 Z-score
177
3차 구조 최적화 작업
호몰로지 모델링으로 만들어진 최종 구조는 template 구조와 거의 같기 때문에 최종적으로 더욱 정확한 구조를 얻기 위해서는 ‘에너지 최적 화’ 과정 및 ‘분자동역학 모의실험’ 등의 과정을 거쳐 구조 안정화 및 최적화 작업이 필요하다.
우리는 그런 작업을 시도하려 서버에 제시된 몇 몇 프로그램들을 검토하여 보았으나 기질과 금속 이온인 망간이 제대로 적용되지 못하여 안타깝게 도 원하는 결과를 얻을 수 없었다. 이번 작업에 서는 제시된 프로그램을 대신하여 Discovery Studio3.5를 이용하여 기질이 결합된 chDPE복합 체 구조의 에너지 최적화 작업을 수행하여 개선 하였으며 최종적으로, 이 구조를 atDPE 결정구조 와 겹쳐보았다 (그림6).
결론
이번 연구에서 atDPE를 주형으로 하여 기존에 밝혀지지 않았던 chDPE단백질의 3차 구조를 예 측할 수 있었다. GalaxyTBM이라는 MODELLER를 이용하여 template searching, sequence alignment, homology modeling, reminement의 4
단계를 거쳐 진행되었으며 ProSA와 Ramachandran plot을 이용하여 구조의 타당성을 확인하였다.
이처럼 구조를 만든 후에 구조 최적화를 위하여 에너지 최적화나 분자동역학 모의실험 등을 수행 해야 하지만 서버에서 제공된 프로그램들을 이용 해서 금속이온과 기질이 결합된 복합체를 얻는데 한계가 있었다. 이에 우리는 Discovery Studio3.5 를 이용하여 기질과 금속이온이 결합된 구조의 에너지 최적화 과정을 수행하였다.
이번에는 비록 제시된 프로그램을 이용해서는 chDPE의 구조를 예측하는 단계에 그쳤지만 만들 어진 구조를 활용하여
D-Psicose와
D-Fructose 가 결합된chDPE 내 active site의 구조적 차이점을 규명 할 것 이다. 이를 바탕으로
D-Fructose와의 결합력을 향상시킬 수 있도록 단백질 재설계 연 구를 수행할 것이며, 이러한 단백질 재설계 연구 기법을 통해
D-Psicose의 생산량을 증가시킬 수 있는 개량된 chDPE를 예측할 것이다. 이는 앞으 로
D-Psicose가 기본적인 감미료 역할을 하는 것 외에 첨가제, 음료, 건강식품, 화장품, 의약품 등 많은 분야에서 활용될 수 있을 것으로 기대된다.
D