기획특집 바이오 인포메틱스-
국내 생물정보학(Bioinformatics) 연구현황
정 동 수†․박 준 호*
생물학연구정보센터, *경운대학교 컴퓨터공학과
Research Trend of the Korean Bioinformatics
Dong Soo Jung† and Joon Ho Park*
Biological Research Information Center (BRIC), POSTECH, San 31, Hyojadong, Namgu Pohang, Kyungbuk 790-784, Korea
*Kyungwoon University, Sandong-myun, Kumi, Kyungbuk 730-739, Korea
Abstract: Post-genomics 시대, 융합학문을 대표하는 생물정보학은 이제 생명과학 연구의 필수요소로 자리잡아가고 있 고, 나아가 과학기술 발전의 성장동력으로 자리매김하고 있는 것이 현실이다. 이에 새롭게 이 분야에 관심을 가지신 연 구자분들을 위해 생물정보학의 정의, 가치 그리고 현재까지 진행된 국내 생물정보학의 인프라, 학회, 특허, 학술발표 등 간단한 연구활동 사항을 소개하고자 한다.
Keywords: 생물정보학, Bioinformatics, 연구현황
1. 서 론1)
21세기 연구개발분야의 화두중에 하나가 학 문간 혹은 학제간 융합이라고 할 수 있고 이 를 대표하는 분야가 Information Technology (IT)와 Biotechnology (BT)가 융합한 생물정 보학(bioinformatics)이라고 할 수 있다. 이는 생명과학 분야의 대량의 데이터 혹은 컨텐츠 를 정보과학기술을 활용해 분석, 가공, 예측 등을 통해 새로운 가치를 만들어 내기 위해 수행하는 연구를 지칭하는 것으로 협의적인 의미에서 데이터마이닝(datamining)이라고 표 현 할 수 있다.
바이오 분야에서 데이터 생산기술, 단적으로 유전체 염기서열분석 기술이 20세기 후반 획 기적으로 발전하면서 상대적으로 분석 비용을 낮추고 연구 시간을 단축시킴으로써 대량의 유
† 주저자 (E-mail: [email protected])
전체 염기서열 분석이 가능해졌으며, 더불어 관 련 분석기술 역시 비약적인 발전을 거듭하고 있 다. 유전체 염기서열 분석은 Gold Genome On-line Database (http://www.genomesonline.
org/)에서 제공하는 공개된 데이터만을 보았 을 때도 2006년 6월 현재 10년 전보다 약 100 배에 이상의 유전체가 분석되고 있다. 이러한 성과는 필연적으로 이들 데이터를 활용하는 새로운 기술의 대두는 어찌 보면 당연한 과정 이라고 생각된다.
한편으로 이러한 영향으로 바이오 데이터의 속성 혹은 연구 대상, 접근방식에 따라 최근 몇 년 사이에 새로운 신조어가 계속 만들어지 고 있어 많은 연구자들을 혼란스럽게 만들고 있는 것도 바이오 분야의 새로운 경향을 잘 대변해 주고 있다.
최근 모 신문에 컴퓨터 속도경쟁 동력은 생 명공학라는 기사에 따르면 미국의 경제전문지 비즈니스2.0은 과거에 우주탐사 경쟁이 컴퓨터
Figure 1. Gold Genome On-line Database (http://www.genomesonline.org/)에서 제공하는 전세계 유전체 분석 현황(2006년 6월 현재, 공개된 데이터를 기반으로 작성)
발전의 밑거름이 됐다면 이제는 생명공학이 컴퓨터 기술 향상의 새로운 동력으로 자리잡 고 있다고 한다. 세계 최대 컴퓨팅 능력을 가 진 슈퍼컴퓨터 중에 하나인 ‘MD그레이프-3'의 개발 동기가 대용량의 컴퓨팅 파워가 요구되 는 기상예측이나 정보기관의 정보수집 목적이 아니라 예상 밖에도 단백질 안에 어떤 아미노 산들이 어떠한 구조로 3차원 공간에서 위치하 고 있는지를 분석하고 주변의 다른 바이오 분 자들과 어떻게 상호작용을 하는지를 계산하는 데 이용되기 위해 개발되었다는 것이다. 현재 다국적 제약회사 머크(Merck)는 ‘MD그레이 프-3'의 사용권을 얻어놓고 있으며 ‘블루진/L' 의 개발사 IBM 역시 제약회사들의 단백질 시험 을 위탁받고 있는 퀀텀바이오(Quantum Bio)라 는 회사에 사용 시간의 일부를 할당하고 있다 고 한다.
그렇다면 이러한 변화를 가져오게 한 생물 정보학은 과연 어떻게 탄생했을까? 답은 의외 로 간단하다. 짧게는 10년 전만 하더라도 생명 과학 분야 연구는 생리적인 현상이나 결과를 보고 관련 유전자를 찾는 시대였다. 그러나 이 제는 단적으로 A, T, G, C로 구성된 유전체의
염기서열을 가지고 유전자를 찾아내어야 하고, 그리고 그 기능과 역할을 찾아내는 시대다.
쉽게 설명하자면 벼 무리 속에 유독 키가 작은 벼를 발견했다고 하자. 그러면 당연히 왜 저 벼는 키가 작을까라고 생각할 것이고, 어떠 한 유전자의 이상이 저렇게 키를 작게 한 것 일까 연구를 할 것이다. 지금까지는 바로 돌연 변이를 찾아내거나 인위적으로 돌연변이를 유 발시켜 그러한 표현형을 만든 유전자를 찾으 려고 전체 지놈을 부수거나 발현되는 전사체 (transcript, mRNA)를 가지고 원하는 유전자 를 찾는 유전자 클로닝(gene cloning)을 했었 다. 그런데 지금은 천지가 개벽할 정도로 사정 이 달라졌다. 무엇인지는 모르지만 유전체 지 놈이 유전체 형질을 결정한다고 가정하고 우 리는 이미 다수의 유전체 지놈 분석을 완료해 서 유전체의 모든 염기서열을 이미 알고 있다.
그런데 그 염기서열은 단순하게 A, T, G, C라 는 뉴우클레오타이드(nucleotide)로 구성되어 있어 어디서부터 어디까지가 유전자인지 모른 다. 그렇다면 어떻게 유전자를 찾을 수 있을 까? 신기하게도 초파리와 인간 유전자의 경우 약 85%의 상동성을 보인다는 것이다. 유전체
마다 특정 기능을 하는 유전자가 전혀 다른 것이 아니고 진화를 통해 약간의 염기서열만 이 차이가 나기 때문에 이미 기능이 밝혀진 유전자와 염기서열 비교를 통해 일차적으로 전체 지놈 서열에서 특정 유전자를 찾아낼 수 있는 것이다. 즉 이제부터 아무 의미 없을 수 도 있는 긴 염기서열을 가지고 다양한 수단을 동원해 정확하게 목적으로 하는 새로운 유전 자를 찾아내는 것이라고 할 수 있다. 이는 생 명과학 분야의 연구자가 해결하기에는 쉽지 않은 일이다. 그래서 필연적으로 탄생하는 것 이 정보공학, 물리학, 통계학, 수학 등과의 협 력을 통해 현재 융합학문의 대표격인 생물정 보학이 탄생한 것이다.
이제 이러한 패러다임(paradigm)의 변화에 서 볼 수 있듯이 생물정보학은 결코 선택 문 제가 아니라 필수라는 것이다. 그런 점에서 학 문의 중요성이나 연구의 필요성을 논한다는 것 자체가 의미가 없다고 할 수 있다. 우리나 라의 경우 생물정보학 연구 역사는 짧지만 최 근 연구성과(논문)를 분석해보았을 때 결코 뒤떨어지는 수준이 아니라 특정분야는 세계최 고 수준의 기술을 보유하고 있다. 본론을 통해 생물정보학의 정의, 가치 등에 관해 간략하게 설명하고 국내 연구인프라 그리고 연구성과에 대해 소개하고자 한다.
2. 본 론
2.1. 생물정보학의 정의
논의에 앞서 먼저 생물정보학에 대한 정의 를 하고 들어가는 것이 합당할 것으로 생각되 어 간략하게 국내외에 발표된 자료를 소개하 면 다음과 같다.
2000년 4월에 출범한 미국의 National Institute of Health (NIH)의 Biomedical Information Science and Technology Initiative (BISTI)의 Working Definition of Bioinformatics and Computational Biology (July 17, 2000)에 따
르면(http://www.bisti.nih.gov/CompuBioDef.
pdf) Bioinformatics를 “Research, development, or application of computational tools and ap- proaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data”로 정의하고 있으며 Computational Biology를 “The devel- opment and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems”이라고 정의하고 있다. 기타 Bioin- formatics.org (http://bioinformatics.org/faq/
#whatIsBioinformatics)나 English Oxford Di- ctionary (자료: A definition submitted to the English Oxford Dictionary)의 정의도 참고할 만하다.
국내의 경우 Bioinformatics and Biosystems 저널에 따르면 광의적인 의미로 생물정보학을
“컴퓨터를 사용하여 생물정보를 다루는 여러 형태의 접근방식”이라고 정의하고 있으며, 협 의적으로는 “DNA, 아미노산 순열 및 그와 연 관된 정보를 이용, 생명현상을 이해하는 것을 목적으로 하는 수학적, 통계학적, 컴퓨터방법 을 사용하는 학문분야”라고 정의하고 있다. 그 리고 생물정보학을 환원주의라고 많이 언급하 는 배경은 생물정보학연구의 근간이 되는 수 학, 물리학, 화학, 공학 등의 학문의 기본적인 배경과 인간이 가지는 선형적인 사고 틀 때문 이라고 밝히고 있다.
2.2. 생물정보학 적용분야
그렇다면 생물정보학이 활용될 수 있는 분 야는 어떠한 것이 있을까? 대답은 간단하다.
생명체가 있는 모든 분야에 적용 가능하다는 것이고 실제 그렇게 적용되고 있다. 2000년 Nature Biotechnology 소개된 자료를 굳이 인 용하지 않더라도 국내 연구기관의 활동 사항 을 찾아보면 쉽게 이해 할 수 있다. 단적으로
Figure 2. 2000년 Nature Biotechnology에 소개된 생물정보학의 활용분야(Source; Nature Biotechnology, 2000).
대량의 바이오 데이터가 있는 모든 분야에 적 용가능하기 때문에 굳이 적용분야를 이야기한 다는 것 자체가 의미가 없다고 하겠다. 그렇지 만 작은 연구개발 예산으로 모든 분야를 투자 하고 개발 할 수는 없는 것이 우리의 현실이 기에 선택과 집중을 위해서는 전문가들의 많 은 노력이 있어야 할 것이다.
2.3. 생물정보학의 가치 시장예측
생물정보학이 실제 산업적으로 가장 먼저 활용되고 있는 분야가 신약개발 과정이라고 할 수 있다. 동향분석 전문 기관인 Front Line 의 Bioinformatics 보고서에 따르면 생물정보 학 기술을 적용함으로써 하나의 신약개발과정 에서 연구기간의 1/2~1/10로 줄일 수 있고, 투자금액 역시 1/10~1/100까지 줄일 수 있다 고 예측하고 있다(일반적으로 하나의 신약개 발에 20억 달러의 연구비와 12년이라는 기간 이 필요함). 현재 생물정보학을 기반으로 개발 된 적지 않은 신약 후보물질들이 임상실험 중 에 있어 실제 우리가 치료제로 복용할 날이 가까워지고 있다.
생물정보학 시장규모에 대해서는 보고서는 2006년 17억 달러로 규모로 예상(Source: Front Line, Bioinformatics 2002년)하고 있으며, 지속 적인 성장을 예측하고 있다. 그리고 MarketResearch.
com의 2006년 Bioinformatics Market 보고서 를 보면 전세계 시장은 매년 15.8%의 성장을 통해 2010년에 30억 달러에 이를 것이고, 유럽 생물정보학 전체시장의 경우 2004년 3억 천만 달러에서 2011년 7억 2천만 달러에 이를 것이 라고 예측하고 있다. 생물정보학 시장은 몇 년 간은 특별한 모우맨텀이 없는 한 일정한 성장 곡선을 보일 가능성이 높으며, 기술적인 측면 에서는 데이터마이닝(datamining) 기술의 수요 가 점차 확대될 것이며, 산업전반의 기초기술 보다는 진단과 분석 등 활용기술에 초점이 맞 추어 질 것으로 생각된다. 그러나 임상실험 과 정에 있는 신약들이 본격적으로 효과검증 되 고 산업적 가치가 확인이 될 것으로 예측되는 향후 5년 후에는 본격적인 투자와 개발이 있 을 것으로 예측된다. 현재로써는 구체화된 모 델이 부족하다는 것이 가장 큰 약점이지만 역 으로 그 가치를 한꺼번에 표출됨으로써 기대
Figure 3. 신약개발에 생물정보학을 활용함으로써 기대되는 가치(추정치, Source: Front Line, Bioinformatics 2002년).
되는 가치 또한 대단할 것으로 기대된다.
마지막으로 우리가 세계 시장에서 자리를 잡고 가치를 만들어가기 위해서는 현재 우리 를 위협하는 다국적 기업들의 진출과 특허를 포함한 기반기술에 대한 재산권 문제에도 많 은 관심이 필요하다. 전통적으로 바이오 분야 기초자원(유전자 정보)에 대해 특허를 인정하 지 않았던 유럽의 경우도 미국과의 산업 대결 에서 입지를 강화하기 위해 기초자원까지 특 허를 인정하는 추세다. 여기에 미국은 생물특 허와 관련해 적용범위를 확대하는 추세를 보 여 향후 이 문제가 가장 중요한 이슈로 부각 될 것이다. 그리고 현재 국내의 생물정보학 시 장은 결과물의 부재와 더불어 지속적인 수익 모델을 제시하지 못하고 있어 이에 대한 적극 적인 대응이 필요한 시점이라고 하겠다.
2.4. 교 육
국내 생물정보학관련 대학 교육기관들은 Table 1에서 보는 바와 같이 총 10곳으로서, 전체적 으로 2002년도에 개설학과 수가 가장 높은 수
치를 보였고, 교수진은 주로 바이오 분야 전공 자들이 출신이 훨씬 많은 비율을 보이고 있다.
각 대학에서는 신규학과 개설보다는 기존의 관련 학과를 묶어 통합과정 형태로 대학원과 정을 만드는 것이 전체적인 추세라고 할 수 있다. 교육기관의 증가는 유럽이나 미국의 경 우를 보아도 그렇고, 앞으로 장기간 계속될 것 으로 추측되며 정식 학위와 교육과정을 이수 한 학생들이 국내 생물정보학 연구분야의 부 족한 인력을 부분적으로 채워줄 것으로 보인 다(참고로 국외 경우에도 비슷한 경향을 보 임). 그러나 향후 몇 년간은 커다란 모우멘텀 이 없는 한 산업적인 측면에서 생물정보학 관 련 인력요구는 연구수준에서 벗어나지 못할 것으로 예측된다. 그렇지만 현재 유럽의 EBI 가 교육 인프라 투자를 확대하고 있는 것이나 미국의 주요 대학들이 앞 다투어 관련 학과를 개설하는 것이 무엇을 의미하는 것인지 생각 해 볼일이다.
대학교육 기관을 제외하고는 국가생물자원정보 관리센터, 국립보건원 중앙유전체 연구소, 바
Table 1. 국내 생물정보학 관련 학위과정(2004년 한국의 생물학백서 자료참고)
학교 학과명칭 개강년도 연락처 학위
과정 교수진 기타
고려대
정보통신대학 바이오정보학 협동과정
2003년 3월 학과사무실 02-3290-3190
석사 박사
IT출신-4명
BT출신-5명 2002년 9월부터 실시
부산대 생물정보학협동과정2000년 5월
(국내최초) 051-510-3486~7 석사 박사
BT 출신-21명 IT, 통계 출신-6명
학생수 19명
서울대
자연과학대학 협동과정 생물정보학전공
2002년 3월 이병재 02-880-6775
석사 박사
생명과학부-55명 그외 관련학과
교수 37명 숙명여대생물정보학
연계전공 2002년 3월 박종훈 교수
02-710-9414 학사 BT 출신 1명 복수전공으로 이수 가능 (36학점)
숭실대 자연과학대학
생명정보학과
2001년 3월 (학부최초)
학과사무실
02-820-0450 학사 IT 출신-1명
BT 출신-2명 모집정원 30명
이화여대
자연계열 분자생명과학부 생물정보학 전공
2001년 3월 학과사무실 02-3277-4389~90
석사 박사
생물정보학 전공 1명 BT : 18명
IT : 5명
학생수 총 6명
중부대 이공대학
생명과학부 2002년 3월 지선옥 교수
041-750-6713 학사 지선옥 교수 맹학영 교수
KAIST 공학부
바이오시스템학과 2002년 9월 042-869-2491~3 학사 석사 박사
IT출신 5명 외국협력교수
10명 외부협력기관 2
2002년 9월 석사 11명, 박사 5명 선발
ICU
공학부 Bioinformatics track
2003년 3월 한동수 교수 042-866-6130
석사 박사
IT 출신-3명
BT 출신-1명 2003년부터 실시
포항공대시스템
생명공학부 2005년 9월 오영희 행정과장
054-279-8405
석사 박사
비생명-5명 생명-10명
이오정보기술 연구센터(CBIT), 생물정보연구소, 숭실대학교 분자설계연구센터, 연세 프로테오믹 스 연구센터, 한국전자통신연구원(ETRI), 한 국정보통신대학원대학교 등에서 비정기적으로 전문분야에 대한 교육이 진행되고 있다.
2.5. 학술 전문저널
현재 대부분의 생명과학관련 저널들은 생물 정보학관련 논문을 게재하고 있어, 저널을 구 분한다는 것이 의미가 없을 수도 있지만 2000
년을 기준으로 현재의 생물정보학을 이끌고 있는 대표적인 전문저널을 소개하면 다음과 같다. 생물학데이터를 분석(datamining)을 중 심으로 초기 수학적 통계학적인 접근을 통해 다량의 논문을 발표한 저널이 Journal of Computational Biology로 주로 생물학데이터 분석을 위한 알고리즘 연구와 같은 방법론 연 구를 선도하였다. 다음으로 주로 분석 리소스 개발과 소개는 Bioinformatics 저널로 현재도 Application Note를 통해 여전히 다양한 리소스
Table 2. 대표적인 저널 및 2005년 Impact Factor (IF)
저 널 명 ISSN 2005년 IF
Bioinformatics BMC Bioinformatics BMC Genomics Genome Research GenomeBiology Genomics
JOURNAL OF BIOMEDICAL INFORMATICS Journal of Computational Biology
Journal of Proteome Research Nucleic Acids Res
OMICS: A Journal of Integrative Biology PLoS Computational Biology
Proteomics
The Pharmacogenomics Journal
1367-4803 1471-2105 1471-2164 1088-9051 1474-7596 0888-7543 1532-0464 1066-5277 1535-3893 0305-1048 1536-2310 1553-734X 1615-9853 1470-269X
6.019 4.958 4.092 10.139 9.712 3.181 2.388 2.446 6.901 7.552 - - 6.088 3.989
Table 3. 특허정보를 제공하는 윕스(http://www2.wips.co.kr/)에서 주요 키워드로 검색한 결과(2006년 8월 25일 STEP 검색 결과, 숫자는 특허 건수를 나타내는 것으로 각국마다 공개되는 범위와 내용에 따라 전체 건수가 차이가 있을 수 있음)
Keyword 한국 미국 일본 중국 EP PCT (WO) G-Pat INPADOC DNA and chip
DNA chip protein and chip protein chip microarray micro and array micro array genome proteome
133 8975 33 7578 85 102 6868 47 11
1188 120226 836 163197 1620 5475 181721 12936 287
13 9212 0 1294 0 30 6931 182 2
135 9508 118 12021 75 94 5525 339 8
125 28518 46 41010 251 759 38000 2116 74
224 30420
152 59748 855 837 34696 4375 210
14 5526 16 6970 4 77 8135 153 4
42 2728 0 3949 18 0 46971 5136 312
를 소개하고 있다. 뒤를 이어 Open access를 지향하며 최근에 출범한 Public Library of Science (PLoS) Computational Biology, Geno- mics, BMC (BioMed Central)에서 주도하는 BMC Bioinformatics, BMC Genomics, Algo- rithm for Molecular Biology 그리고 프로테옴 (proteome) 관련 전문저널로 성장한 Proteomics 저널 등이 대표적으로 꼽힌다.
2.6. 특 허
특허동향은 생명과학의 산업화를 가늠해 볼
수 있는 중요한 잣대가 되기 때문에 특허 정 보제공사이트인 ㈜윕스(http://www2.wips.co.
kr/)의 데이터 베이스를 활용하여 생물정보학 관련 주요 키워드로 검색하였다. 주요 키워드 는 생물정보학 연구분야 중 현재 가장 각광 받고 있는 분야이면서 산업화에 가장 가까운 분야인 칩(chip) 분야의 주요 키워드인 DNA chip, microarray, 그리고 추가로 genome과 proteome을 선정하여 검색한 결과는 Table 3 과 같다. Table에서 나타난 결과는 국가간 혹 은 특허 대상에 따라 비슷한 패턴을 보여주고
Table 4. 국내 생물정보학 대표학회(2006년 8월 기준)
구 분 학회 설립연도 현 회장 학회지 URL
한국생물정보학회 1998년 이광형(KAIST) Bioinformatics and
Biosystems http://www.ksbi.org 한국유전체학회 2000년 유향숙(KRIBB) Genomics & Informatics http://www.kogo.or.kr 한국바이오칩학회 2005년 백세환(고려대) 한국바이오칩학회소식지 http://www.proteinchips.org/
Table 5. BIT 연구기관협의회
기 관 명 URL
국립보건원(KCDC) http://www.cdc.go.kr 기술표준원(ATS) http://www.ats.go.kr 농업생명공학연구원(NIAB) http://www.niab.go.kr 축산연구소(NLRI) http://www.nlri.go.kr 한국과학기술정보연구원(KISTI) http://www.kisti.re.kr 한국기초과학지원연구원(KBSI) http://www.kbsi.re.kr 한국생명공학연구원(KRIBB) http://www.kribb.re.kr 한국생물정보학회(KSBI) http://www.ksbi.or.kr 한국식품연구원(KFRI) http://www.kfri.re.kr 한국전자통신연구원(ETRI) http://www.etri.re.kr 한국한의학연구원(KIOM) http://www.kiom.re.kr
있지만 국가에 따라 용어의 정리와 기준에 약 간의 차이(특히, 일본)가 있음을 알 수 있다.
국내 특허 중 DNA and chip이라고 검색한 결과를 분석해보면 크게 2가지로 나누어 볼 수 있다. 한 가지는 장치나 장비와 관련된 기 술이고 나머지 한 가지는 유전자원 및 방법론 에 관한 것이다. 즉 생물자원이나 데이터 자체 에 대한 특허와 IT 기술을 기초로 개발된 분 석툴, 장비, 방법론에 관한 것으로 명확하게 구분된다는 사실이다. 어찌 보면 융합학문이라 고 하지만 이 경우에는 현재로써는 단순하게 역할분담을 통한 새로운 가치 창출이라고 보 는 것이 적절해 보인다.
2.7. 학회 소개
국내에서는 대표적으로 (사)한국생물정보학 회(http://www.ksbi.org)가 1998년 11월에 포
항공대에서 결성되어 본격적으로 학회의 기틀 을 마련하고 활동을 전개하여 현재 산하에 14 개의 연구회를 운영하고 있다. 다음으로 1992 년 인체유전자연구회를 시작으로 2000년에 정 식 학회로 출범한 한국유전체학회(http://www.
kogo.or.kr)와 2001년 3월 23일 단백질칩연구 회에서 2005년 12월에 이르러 현재의 바이오 칩학회(http://www.proteinchips.org/)로 개칭 하고 활동하고 있다.
그리고 작년 국내 주요 연구기관을 중심으 로 출범한 BIT 연구기관협의회는 (사)한국생 물정보학회가 가교역할을 수행하여 2005년 9 월 22일 부산 BEXCO에서 각 기관장의 참석 으로 결성되어 초대 의장으로 한국과학기술정 보연구원의 조영화 전 원장이 추대되었으며, 첫 해 핵심 공동사업으로 바이오정보표준화를 추진하고 있다. 바이오정보표준화 실무그룹으 로 유전체, 단백질체, 전사체, 임상역학, 대사 경로정보, 그리고 유전자원 등 총 6개가 활동 을 전개하고 있다.
국외 주요학회로는 미국샌디에고 슈퍼컴퓨 팅센터에 있는 International Society for Com- putational Biology (ISCB, http://www.iscb.
org)가 가장 활발한 활동을 전개하고 있어 명 실상부한 국제 최고학회로 자리잡아가고 있다.
ISCB가 주최하는 학술행사의 하이라이트는 정 기학술행사인 Intelligent Systems for Molecular Biology (ISMB: www.iscb.org/ismb2006)로 올 해는 8월 6~9일까지 브라질 포탈레자(fortaleza) 에서 개최되었으며, 국내연구자들은 십 여명이 참석하여, 3명이 구두발표를 했다고 한다(http://
gene.postech.ac.kr/bbs/zboard.php?id=job&page
Table 6. 월별 발표실적
1월 2월 3월 4월 5월 6월 전체
2006년 발표논문 수 28 28 28 15 22 26 147편
2005년 발표논문 수 48 30 19 23 14 121편
*주) BBON (BRIC Bioinformatics On-line Newsletter)에 발표된 자료에서 일부 누락된 자료가 추가됨
Table 7. 년도별 생물정보학 대표 저널인 “Bioinformatics”에 발표된 논문 편수(제1저자가 한국인이고 국내 의 연구비로 수행된 연구결과로 발표된 논문)
2006년/9월 2005년 2004년 2003년 2002년 2001년 2000년 1999년 합계
15 19 9 7 2 1 1 54
=3&sn1=&divpage=2&sn=off&ss=on&sc
=on&select_arrange=headnum&desc=asc
&no=9366).
2.8. 2006년도 상반기 국내 생물정보학 논문발표 분석
국내의 논문발표 실적은 매월 생물학연구정 보센터에서 PubMed 데이터베이스를 12가지 키워드로 분석하여 BRIC Bioinformatics On- line Newsletter (http://bric.postech.ac.kr/info/) 를 통해 발표하고 있는데 2006년 상반기 분석 자료를 간략하게 소개하면 다음과 같다.
2006년 상반기 논문 발표 실적을 분석한 결과 147편으로 2005년 상반기(121편) 대비 21.48%
성장한 것으로 나타났다. 월별 발표되는 논문 의 수는 2005년 상반기와 비슷한 패턴을 보여 주고 있다.
발표된 저널은 총 83개로 나타나 전체 발표 논문 수 147편으로 저널당 1.77편이 발표 된 것으로 나타났다. 가장 많이 발표된 저널은 Proteomics (23편, 15.64%), Bioinformatics (10 편, 6.80%) Plant Cell Re (6편, 4.08%), Gene (4편, 2.72%), Genomics (4편, 2.72%), Arch Virol (4편, 2.72%)로 상위 6개 저널이 34.69%
를 차지한 것으로 나타났다.
연구분야별로 분석해보면 Microarray (37편, 25.17%), Proteome Analysis (32편, 21.76%) Phylogeny and Evolution (23편, 15.64%), Pre-
dictive Method (16편, 10.88%), Datamining (14편, 9.52%) 순으로 나타났다. 그리고 논문 이 발표된 소속단체의 지역별 분포는 수도권 으로 분류한 서울, 인천, 경기지역이 87편으로 59.18%를 차지한 것으로 나타났고, 대전이 24 편으로 16.32%를 차지했으며 기타 나머지 지 역이 24.6%를 차지했다. 생물정보학 역시 지 역편중 현상을 그대로 반영하고 있다.
발표된 논문의 소속기관별로 분석해보면 대 학이 118편으로 전체 80.27%를 차지하였고, 국가기관이 22편으로 14.96%를 차지했다. 생 물정보학은 결국 대학과 국가기관에 의해 주 도적으로 개발되고 있다는 것을 보여주고 있 는데, 국가기관에서 22편으로 14.96%를 차지 한 것은 국가핵심연구분야로 집중 육성하겠다 는 의지를 나타내고 있다.
우리나라 생물정보학 연구자들의 논문발표 실적으로 분야를 대표하는 Bioinformatics 저 널을 조사해보면 얼마나 비약적으로 발전하는 가를 확인할 수 있다. 최근 몇 년 사이 눈에 뛸 만큼 비약적인 성장을 하고 있다는 것을 볼 수 있으며, 2006년 9월 현재 올해만 15편이 투고되어 2005년 12월까지 투고된 전체 39편 과 비교하면 거의 28% 가까운 수치다. 연구성 과의 총아라고 하는 연구논문을 통해 국내 생 물정보학 연구역량이 급속하게 성장하고 있다 는 것을 알 수 있다.
3. 결 론
미래 생물정보학 기술방향을 예측한다는 것 이 융합학문이라는 속성상 매우 어렵지만 현 재의 관점에서 결과론적으로 추론을 해보면 우선적으로 생물정보학은 속성상 대량의 바이 오 데이터를 기반으로 하기 때문에, 연구를 위 한 1차 대량데이터 생산을 위한 프로젝트가 더욱 확대되고 연구의 목적은 대체에너지, 특 정 질병연구와 같이 연구 주제가 구체화 될 것이다. 이를 수행하기 위한 막대한 비용과 연 구결과의 공동 활용이라는 측면에서 국제공동 연구가 축을 이루면서 전체 연구를 리더하게 될 것이다.
다음으로 다양한 분석기술의 통합이 가속화 되고 자동화가 이루어질 것이다. 특정 목표 예 를 들면, 신약개발의 과정에서 전임상 직전의 후보물질을 찾아내는 과정까지도 엄청나게 많 은 기술과 자원이 요구되는데, 관련 단체에서 개발된 기술 혹은 개발진행중인 주요 기술들 을 신약 후보물질이라는 큰 목적을 가지고 특 허나 기술을 통합하고 향후 가치를 나누는 식 으로 현재 일부 진행되고 있으며, 이러한 추세 는 더욱 확대 될 것이다.
그리고 새로운 데이터 기반의 활용기술과 데이터 생산 기술의 향상, 바이오 분자 구조분 석 및 상호작용 예측 기술의 지속적인 성장, 활용적인 측면에서는 신약개발관련 신기술이 지속적으로 주류로 자리잡을 것이며 마지막으 로 다양한 학술영역간의 융합으로 데이터 마 이닝 기술의 일반화뿐만 아니라 전문화 이루 어 질 것으로 기대된다. 우리의 생활에서는 질 병의 진단 및 예측 부분에서 현재 일부 소개 되고 있으나 몇 년 내에 완성도가 높고 구체 적인 시제품들이나 서비스를 확인할 수 있을 것으로 생각된다.
앞에서 언급했듯이 생물정보학은 하루아침 에 만들어진 신기루나 스타가 아니라 연구과 정에서 필연적인 요구를 통해 만들어지고 구 체화된 것으로 우리에게는 새로운 기회라고
할 수 있다. 장기적인 투자와 노력이 요구되는 생명과학분야와는 또 다른 성격을 가지고 있 어 짧은 기간이라도 구체화된 주제와 목적을 가지고 집중적인 노력과 투자가 있다면 목표 로 하는 성과를 얻을 수 있는 분야다.
국내의 많은 전문가들이 생각하는 생물정보 학 분야에서 선진국과 기술수준의 측면에서 상대적인 차이는 있지만 절대적인 측면에서는 별 차이가 없으며, 연구범위가 넓어 우리의 강 점을 살린다면 틈새 시장이 아니라 일부 주요 핵심 분야를 선점할 수도 있다는 것이다. 이를 위해서는 현재 연구현장에 나타나고 있는 어 려움이나 문제에 대한 분석과 개선안에 대한 관심을 가질 필요가 있다고 생각한다.
현재 우리나라 생물정보학 연구관련 단체들 에게서 공동으로 연구현장에서 겪고 있는 이 슈 혹은 상황을 부분적으로 제시하면 다음과 같다. 첫째, 앞에서도 언급했듯이 연구테마를 주도적으로 이끌어갈 핵심 전문인력(학문융합 의 촉진제 역할)이 부족하고, 둘째는 연구개발 의 설계와 사전 분석 그리고 활용 등 전체적 인 연구 디자인이 불분명한 상태에서 연구가 진행되고 있다. 세 번째는 연구에 활용할 수 있는 고유한 데이터 부족과 데이터 생산에 대 한 투자의 부족, 그리고 데이터 공유에 대한 마인드가 부족하다. 네 번째는 연구결과물(바 이오 데이터)이나 연구성과(논문, 특허)의 소 유나 분배과정에서 어려움 등을 들고자 한다.
위에 제시된 문제는 단적으로 우리나라만 겪 고 있는 문제가 아니라 전세계 생물정보학을 연구하는 현장에서 나타남직한 어려움들이다.
결국 이 문제의 해결은 선진국의 사례연구나 연구정책의 변화를 통해 부분적으로 해결 할 수도 있겠지만 대한민국의 사회문화적인 요소 라는 현실적인 문제가 결부되어 있어 시행착 오를 거치면서 문제를 해결 할 수밖에 없는 부분도 있다고 판단된다. 이런 점에서 생물정 보학 분야는 다른 어떠한 연구분야보다 연구 책임자의 역할과 판단이 매우 중요하다고 생 각되며, 앞에 지적한 문제점에 대한 충분한 고
려가 있을 때 기대하는 성과를 얻을 수 있을 것으로 생각된다.
마지막으로 이 지면을 빌어 한 가지 정책적 제안을 하고자 한다. 앞에서 언급한대로 생물 정보학은 기존 학문의 융합으로 탄생한 새로 운 학술분야이기 때문에 연구개발전체에 대한 디자인 그리고 기획, 관리, 가치개발이 그 어 떤 연구분야보다 절실하게 요구되며 이것은 연구와 동시에 지속적으로 진행되어야 한다.
그래서 연구개발과 동시에 전체과정을 매니저 할 연구원을 적극 발굴하고 육성해야 한다는 것이다. 올해 추진한다고 발표된 연구기획평가 사 제도와 병행하든지 아니면 별개로 진행시 켜 초기에 제도적으로 매니저 참여를 의무화 시켜 운영시킴으로써 무궁무진한 생물정보학 의 새로운 가치를 창출할 것을 제안하고 싶다.
% 저 자 소 개
정 동 수
1998 경북대 미생물학과 박사 2000 일본 이화학연구소(RIKEN)
연구원
2000~현재 포항공대 생물학연구정보센터 (BRIC) 부소장
참 고 문 헌
1. Bioinformatics and Biosystems, 1, 1 (2006).
2. Bioinformatics Market Report., Market Research.com (2006).
3. Proteomics., 6, 4716 (2006).
4. Genome Inform., 16, 215 (2005).
5. 2004 한국의 생물정보학 백서, 생물학연구정 보센터, ISBN 89-956056-0-X, 347 (2005).
6. Trends Genet., 18, 472 (2002).
7. 2002 한국의 생물정보학 백서, 생물학연구정 보센터, ISBN 89-8325-563-3, 187 (2003).
8. Bioinformatics., Front Line (2002).
9. Nature Biotechnology, 18, 1247 (2000).
박 준 호
1994 (주)현대전자 멀티미디어 연구소 주임연구원
1997 영남대 컴퓨터공학과 박사 1997 오토정보시스템 연구실장 1999~현재 경운대학교 조교수 2002~현재 경운대 전산정보센터소장