본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

생물정보학을 이용한 백신후보 단백질 발굴시스템 개발현황
  • 작성일2012-02-10
  • 최종수정일2021-04-15
  • 담당부서감염병감시과
  • 연락처043-719-7173

     

생물정보학을 이용한 백신후보 단백질 발굴시스템 개발현황
Recent developments in bioinformatics for the identification of vaccine candidates

질병관리본부 국립보건연구원 면역병리센터 말라리아기생충과             
주정원, 유원기             

  


Ⅰ. 들어가는 말
  생물체에 대한 분석법의 발달로 대용량 유전체 및 전사체 정보가 축적 되어오고 있으며, 최근에는  차세대염기서열분석 (Next generation sequencing; NGS) 등의 첨단 유전자분석 기술의 발달로 데이터 축적 속도와 양이 크게 증가하고 있다. 또한 대단위 단백체 분석과 구조 정보가 축적되어지면서 개별 유전자 및 단백질들의 단위 기능분석과 함께 생물정보학(Bioinformatics)을 이용한 총체적인 분석이   활발히 이루어지고 있다. 병원체 연구에 있어서도 병원체의 서열정보 뿐만 아니라 면역작용을 포함한 숙주와의 상호작용에 대한 총체적 분석과 대용량 정보관리 노력이 선진국을 중심으로 수행되어 병원체정보데이터베이스(DB) 및 분석시스템을 구축해 오고 있다. 특히 면역정보학(Immuno-informatics) 분야는 병원체의 유전체 정보로부터 항원성 및 면역원성 단백질을 발굴하고 항원결정기를 예측분석하는데 유용한 정보 및 분석도구를 제공한다. 이 글에서는 면역정보학을 중심으로 생물정보학을 이용한 병원체의 백신 후보 물질 발굴시스템의 개발현황과 병원성 단백체 관리사업을 통해 구축하고 는 DB를 소개하고자 한다.

Ⅱ. 몸 말
  최근 인간 유전체 염기서열 분석 완료로 촉발된 생물체의 유전체 분석은 속도를 더하여 다량의 정보를 축적해 오고 있다. 미국 캘리포니아 대학에서 제공하는 유전체 DB(www.genomesonline.org)에 의하면 2012년 1월 현재 11,222개의 유전체 분석사업이 진행되고 있으며 이중에서 3,698개의 유전체 분석이 완료되었다. 이러한 대단위 유전체 및 단백체에 대한 방대한 데이터를 통해서 새로운 정보를 생산해낼 수 있는 데이터 주도형(data-driven) 연구가 진행되고 있으며, 이에 부응하여 생물정보학적 분석은   필수적인 연구기술이 되고 있다[1]. 또한 NGS의 도입으로 병원체 등의 유전체 서열분석 기간 및 비용이 크게 감소하고 단기간에 방대한 양의 서열정보 축적이 가속화되고 있다.
  이러한 정보는 다양한 생물정보학적 도구를 통하여 통합분석되고 있으며, 병원체의 경우 백신 및 진단 후보 물질인 항원단백질 발굴을 위해 분비단백질, 막단백질을 대상으로 예측분석법이 활발히 적용되고 있다. 병원체에서 항원성 및 면역원성 단백질 발굴은 질병의 진단과 예측 뿐만 아니라 백신 및 치료제 개발 분야까지 널리 이용될 수 있기 때문에 새로운 표적을 찾고자 하는 많은 노력이 진행되어 오고 있다. 생물정보학의 한 분야인 면역정보학은 항원성/면역원성 후보단백질에 대한 항원결정기(antigen determinants 또는 epitope)를 결정하고 면역반응을 예측할 수 있는 분석 방법을 제공하고 있다[2, 3]. 병원체의 경우, 대단위로 그리고 전략적으로 선별된 항원 후보단백질들을 대상으로, T-cell와 B-cell의 각 항원결정기를 면역생물정보학적 기법을 통해 분석할 수 있다. 항원결정기 예측 분석 도구는 단백질 자체의 다양한 생화학적 특징과 면역반응에 따른 항원가공 및 제시과정에 대한 이해에 기반한 알고리즘으로 구현된다[4, 5]. 이해를 돕기 위해 항원결정 과정에 대한 면역반응을 간략하게 소개하고자 한다.
  일반적으로“면역(immunity)"이라는 용어는 특정 감염 질환으로부터 회복된 개체를 설명하는 것으로 그들은 같은 병원체에 의한 재감염에 대하여 방어 능력을 획득하게 된다. 이 과정은 면역체계와 관련된 다양한 생물학적 반응이 관여하여 병원체를 인지하고 제거함으로써 이루어진다. 척추동물 이상의 생물체에서 면역체계는 선천성 면역(innate immunity)과 적응성 면역(adaptive immunity) 체계로 발전하였다[6]. 선천성 면역은 적응성 면역보다 덜 특이적이며, 방어의 첫 단계에서 작용하지만, 더 빠르며, 진화적으로 더 잘 보존 되어 있고 적응성 면역체계가 진화하는 토대가 된다. 적응성 면역은 병원체 노출 5-6일 후에 작용하는 면역체계로, 병원체의 인지와 반응을 기본으로 한다. 이를 위해선 숙주 고유의 세포나 단백질을 병원체의 것과 구분할 수 있어야 하고 병원체간의 생화학적, 분자생물학적 차이를 구분할 수 있어야 한다. 또한 병원체 감염세포와 비감염세포를 구분할 수 있어야 한다. 적응성 면역체계는 B-cell이 관여하는 체액성 면역반응(humoral immune response)과 T-cell이 관여하는 세포면역반응(cellular immune response)으로 크게 구분된다. 병원체 유래의 항원들은 항원결정기로 알려진 특이적인 작은 부위를 포함하고 있는데 B세포 항원결정기와 T-cell 항원결정기로 나눌 수 있다. 이 부분이 B-cell과 T-cell에 존재하는 수용체에 의해 인식된다. B-cell에 대한 항원결정기는 아미노산 서열을 인식하는 방법에 따라 연속적인 것(linear, continuous)과 비연속적인 것(discontinuous)으로 구분된다. T-cell에 대한 항원결정기는 일반적으로 짧은 연속적인 절편(linear peptide)이며, MHC I class와 MHC II class로 구분된다. B세포 항원결정기는 수용성의 항체와 직접 결합하기 때문에 일부 단백질의 경우, 친수성(hydrophilicity) 잔기가 차지하는 비율이 높은 부분에 존재할 가능성이 높은 반면에, T-cell 항원결정기는 단편화되어 MHC의 항원 펩타이드 수용구에 들어가기 때문에 친수성을 반드시 가질 필요는 없다.
  이러한 기전을 설명하는 면역학적 연구가 수행되었고 면역분자의 생물학적인 차이를 분석해 왔다.  이러한 원리를 바탕으로 생물정보학적인 분석을 통하여 병원체를 인지하거나 사멸시키는데 주요한 표적물질을 탐색할 수 있게 되었다. 이를 위해 면역정보학이라는 생물정보학의 한 분야가 발전하였으며,   이는 병원체 인식뿐만 아니라 인식 후 작용하는 면역작용에 대한 총체적인 이해를 포함하고 있다.    이 분야에는 면역유전체학(immunogenomics), 면역단백체학(immunoproteomics), 항원결정기 예측분석 (epitope prediction)과 컴퓨팅을 통한 백신연구(in silico vaccination) 등이 포함된다. 특히, 병원체의 유전자 산물로부터 잠재적인 항원/면역원성 단백질을 발굴하고 B-cell 또는 T-cell epitope을 분석하여 새로운 진단 및 백신개발에 응용하는 분석과정을 ‘reverse vaccinology'라고 한다[7].
  면역정보학은 병원체의 배양과 항원성 단백질의 추출 및 분리가 필요한 전통적인 방법에 비해 시간과 노력이 덜 소요된다는 장점을 제공한다. 즉, 과거에 정확한 항원결정기에 대한 데이터가 존재하지 않았을 때에 비해, 최근에는 펩타이드(peptide) 서열 motif를 기준으로 무작위적으로 항원결정기 예측을 가능하게 하며, 또한 실험적으로 밝혀진 항원성 또는 면역원성 펩타이드가 존재하는 경우, 길이가 짧은 펩타이드를 이용하여 항원결정기 지도작성(epitope mapping)을 시도함으로써 항원결정기의 정확한 영역을 밝히는데 적용이 가능하다. 또한 항원결정기 예측을 통해 항원결정기가 집중된 부위 즉, 면역반응이 높은 부위(immunological hot spot) 또는 면역원성(immunogenicity)이 높은 부위를 동정할 수 있다. 펩타이드  서열 motif를 기반으로 항원결정기를 예측하는 분석알고리즘으로는 Binding Matrices,  Decision Trees, Artificial Neural Networks, Hidden Markov models, Support Vector Machines 등이 있으며, 결합부위의 구조를 기반으로 개발된 분석알고리즘으로는 Protein Threading, Homology Modeling, Docking 등이 있다[8]. 항원결정기 분석 프로그램 중에 기존에 널리 사용했던 것은 NetMHC, NetCTL 등이 있고, 새롭게 연구에 적용되고 있는 것들은 EpiToolKit, Bepipred, Discotope 등이 있다. 또한 항원결정기 분석서버는 CEP, CTLpred, SYFPEITHI, SEPPA 등이 개발되어 보다 효율적이고 빠른 동정이 가능하다. 이와 같은 분석시스템의 개발은 급속히 불어나는 유전체 및 단백체 데이터베이스와 최신 문헌정보의 정보마이닝 기법 등과 맞물려 IEDB, AntigenDB, 그리고 Protegen과 같은 항원 단백질의 항원결정기 데이터베이스 구축의 토대가 되었다. 미국 NIAID의 IEDB(Immune epitope database, http://www.immuneepitope.org/)의 경우, 항원결정기에 대한 데이터베이스를 제공하고 있기 때문에, 병원성 단백질의 항원성 확인 및 백신 개발에 널리 이용되고 있다. B-cell과 T-cell 항원결정기에 대한 데이터베이스와 예측 분석도구 개발 현황을 Table 1과 2에 각각 정리하였다.

  항원결정기 예측 분석 도구(Epitope prediction tool)의 개발은 유럽과 미국을 중심으로 활발히 이루어지고 있으며, 인도와 중국에서도 개발되어 고 있다. 각 분석도구의 예측 정확성은 알고리즘의 특징에 따라 차이가 있으며, 이들의 장점을 취합하여 복합적으로 분석하고 적용하는 것이 효율적일 것으로 판단된다. 현재 병원성 단백체 관리사업으로 개발되고 있는 데이터 베이스인 PathOD(Pathogen Omics Database, http://pathod.kdca.go.kr)는 항원결정기의 예측분석을 위한 EpiSYS를 개발해 오고 있으며 현재 웹상에서 이용가능한 일부의 B-cell 항원결정기 예측 분석도구들을 탑재함으로써 병원체의 항원단백질을 분석하고자 하는 연구자들에게 접근성이 뛰어난 환경을 제공하고자 한다(Table 1). PathOD에 장착된 B-cell 항원결정기 예측 프로그램의 효율성 및 정확도를 검증하기 위해 IEDB에서 실험적으로 검증된 항원결정기 정보를 포함하는 항원 단백질 172개를 선정하였다. 선정된 172개 항원 단백질은 항원결정기 예측 프로그램의 효율성 및 정확성 분석을 위해 5개의 항원결정기 분석 프로그램(antigen, bepipred, bcpred, fbcpred, aap)으로 분석을 수행하였다. 하나의 항원 단백질에는 여러 개의 항원결정기 영역이 존재하는데, 이중 2곳 이상 예측된 것에 대하여 항원결정기 영역을 예측한 것으로 간주하였으며, 그 결과 5개의 항원결정기 예측 프로그램 중에서 2개 이상의 프로그램이 이미 알려진 항원결정기를 정확히 예측한 결과는 78%의 정확도로 확인되었으며, 3개 이상의 프로그램이 예측한 경우도 60%의 정확도를 나타내었다.

Ⅲ. 맺는 말


  면역체계는 많은 반응들이 얽히고설킨 수 천가지 생화학 분자들의 작용 네트워크이다. 이러한 작용 네트워크는 구조적으로 또는 기능적으로 아주 다양하다. 연구자들은 오랜 시간에 걸쳐 대용량 분석 실험 등을 통해 많은 자료를 축적해 왔으며, 컴퓨팅을 통한 대용량 자료의 저장과 분석이 가능해지면서 전체 면역체계를 이해하는데 다양한 분석도구들이 개발되고 사용되고 있다. 최근 이러한 자료들은 면역체계 네트워크에 관한 특징과 역동적인 반응들을 분석하는 시스템 생물학으로 통합되고 있다. 면역정보학  분야의 후발주자인 우리나라의 경우, 다양한 생화학적 특징을 고려한 알고리즘을 설계하는 분야에 주력하기 보다는 항원성 또는 면역원성 단백질을 발굴하기 위해 개발되어진 다양한 분석도구를 적극 활용하여 우리나라에서 유행하는 주요 병원체에 대한 항원성 단백질 발굴에 노력을 기울일 필요가 있다. 면역정보학적 알고리즘 개발이라는 기초 분야 인프라 구축에서는 뒤쳐져 있지만 그 응용 및 활용 분야에 대한 노력을 경주한다면 생물자원 전쟁이라 불리는 작금의 상황에서 뒤늦게나마 그 차이를 만회할 수 있을 것으로 기대한다. 질병관리본부에서 개발하고 있는 병원성 단백체 DB인 PathOD는 이러한 노력의 일환으로, 병원체 감염 관련 면역반응을 이해하는데 유용한 자료를 제공할 수 있을 것이다. 이를 더욱 발전시키기 위해 병원체의 단백체 분석을 포함한 -omics 분석 자료를 수집하고, 생물정보학적 분석을 통한 자료들 간의 정보 호환성을 극대화할 수 있는 정보 표준화 및 체계적인 관리 분석시스템 구축을 위해 노력할 계획이다. 병원체에 대한 항원 및 면역원성 단백체 정보 분석과 관리는 소요 예산 및 파생 가치의 성을 고려하여 국가가 일관성 있게 추진하고, 관련 연구자에게 파생 자료를 제공함으로서 감염병 관리를 위한 면역·분자 생물학적 근거자료 활용성을 극대화하여야 한다.


Ⅳ. 참고문헌

1. Poland GA, Ovsyannikova IG, Jacobson RM (2009) Application of pharmacogenomics to vaccines. Pharmacogenomics 10: 837-852.
2. Namrata Tomar and Rajat K. DE Immunoinformatics: an integrated scenario. Immunology. 2010. 131, 153-168
3. Darren R. Flower, Isabel K. Macnonald, Kamna Ramakrishnan, Matthew N Davies, Irini A. Doytchinova. Computer aided selection of candidate vaccine antigens. Immunome Research 2010, 6(suppl 2):S1
4. Saffari B, Mohabatkar H (2009) Computational analysis of cysteine proteases (Clan CA, Family Cl) of Leishmania major to find potential epitopic regions. Genomics Proteomics Bioinformatics 7: 87-95.
5. Wang X, Zhang L, Chi Y, Hoellwarth J, Zhou S, et al. The nature and combination of subunits used in epitope-based Schistosoma japonicum vaccine formulations affect their efficacy. Parasit Vectors 3: 109.
6. Kimbrell DA, Beutler B. The evolution and genetic of innate immunity. Nat Rev Genet 2001, 2, 256-67 
7. Davies MN, Flower DR. Harnessing bioinformatics to discover new vaccine. Drug Discov Today 2007, 12, 389-95
8. Tong JC, Tan TW, Ranganathan S (2007) Methods and protocols for prediction of immunogenic epitopes. Brief Bioinform 8: 96-108.

 
 

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP