본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

국내 인플루엔자 유전자 데이터 베이스(KISED) 소개
  • 작성일2015-10-22
  • 최종수정일2015-10-22
  • 담당부서인플루엔자바이러스과
  • 연락처043-719-8190
국내 인플루엔자 유전자 데이터 베이스(KISED) 소개
Introduction of the Korea Influenza Sequence and Epitope Database (KISED)


질병관리본부 감염병센터 인플루엔자바이러스과
김준섭, 김지경, 이주연, 김기순*

* 교신저자(tigerkis@nih.go.kr/ 043-719-8190)
Abstract


Background: Since 2008, the Korea Centers for Disease Control and Prevention (KCDC) has developed the Influenza Sequence and Epitope Database (ISED) in order to provide analytical platform and management of genetic information about influenza viruses. Thereafter, genetic information related to influenza viruses has been accumulated through improvements in analytical tool services. Particularly, the website’s name was changed into the Korea Influenza Sequence and Epitope Database (KISED) and public access to it was allowed.
Current status: The two main functions of KISED comprise of sequence search and analysis of influenza virus genomes collected globally. The specific sequence search tool allows sorting and retrieval of influenza virus sequence data through a query from local and international sources. The sequence analysis platform provides basic viral genomic characteristics such as epitope mapping, comparison of antiviral resistance, sequence similarity with selected seasonal vaccine strains, and phylogenetic analysis. Currently,
the KISED retains a total of 295,356 Type A and 31,687 Type B influenza virus sequence information.
Prospective future: The KISED can be utilized as a useful tool for identifying genetic and/or antigenic variability of queried genetic information in relation to selected vaccine strains. Moreover, antiviral resistance characteristics at the genetic level of interesting viruses can easily be obtained. The KISED will play a role in enhancing national strategy for rapid pandemic preparedness through continuous refinement of its infrastructure, and for triggering influenza virus research fields not only in Korea, but globally as well.


Ⅰ. 들어가는 말


  인플루엔자바이러스는 Orthomyxoviridae과에 속하며 8개의 분절된 RNA 가닥으로 이루어진 바이러스로써, 매트릭스(Matrix, M)와 핵산단백질의 항원성 차이를 바탕으로 인플루엔자 A, B 및 C의 3가지 형으로 분류된다[1].
인플루엔자 바이러스는 지속적인 유전자 변이를 통해 항원 진화를 하며, 특히 특정 부위(항원결정, 병원성, 종간 전이, 약제내성 관련 부위 등)에서의 변이로 인해 단백질 기능 변화가 초래될 경우 인플루엔자 대유행(pandemic)의 원인이 될 수 있다. 인플루엔자 바이러스의 항원 변이여부 등 특성 분석은 주로 Hemagglutiniation Inhibition (HI)과 같은 혈청학적 방법이 사용되어 왔으나, 최근에는 보다 신속하게 다양한 분석방법을 적용할 수 있는 바이러스 유전 정보 분석이 진행됨에 따라 대량의 유전자 정보를 효율적으로 관리하고 공유할 수 있는 유전자 서열 데이터베이스(Database, DB)에 대한 중요성이 더욱 부각되고 있다.

현재 가장 대표적인 국외 인플루엔자 바이러스 유전자 데이터베이스로는 미국 National Center for Biotechnology Information (NCBI)[3]내 Influenza Virus Sequence Database가 있으며, 이외에도 Influenza Research Database (IRD) [4], 그리고 Global Initiative on Sharing All Influenza Data (GISAID) [5]가 많이 이용되고 있다. 인플루엔자 바이러스는 매년 새로운 형태의 소변이로 인한 변이주가 생성될 수 있으며, 실제 국내외적으로 상당한 양의 유전정보가 생산되어 백신주 선정 등에 활용되고 있다. 국내에서도 질병관리본부에서 주관하는 인플루엔자 및 호흡기 바이러스 실험실 감시(Korea Influenza & Respiratory Viruses Surveillance System, KINRESS)를 통해 확보되는 국내 유행주의 유전정보에 대한 효율적인 분석 및 관리를 위하여 자체 인플루엔자 바이러스 유전자 데이터베이스인 KISED(Korea Influenza Sequence & Epitope Database)를 개발하였다. KISED에는 주로 국내외 계절 인플루엔자 바이러스 및 조류인플루엔자에 대한 유전자 정보가 확보되어 있는데, 대표적인 국외 인플루엔자 바이러스 유전자 데이터베이스의 주요 기능 및 특징을 비교하면 Table 1과 같다.

KISED는 신·변종 인플루엔자 발생 및 대유행에 대비하여 국내외 인플루엔자 바이러스의 유전자 정보를 국가차원에서 체계적으로 통합·관리하고 사용자에게 제공하기 위하여 개발된 데이터베이스이다. 특히, KISED에는 미국 생물정보기관인 NCBI로부터 확보된 국외 인플루엔자바이러스 유전자 정보 이외에도, 국내 KINRESS 참여 의료기관과 전국 17개 보건환경연구원이 연계되어 확보한 국내 유행주에 대한 유전자 정보를 추가적으로 포함하고 있다. KISED를 통하여 이들 유전자 정보의 공유뿐 아니라 KISED 내에서 제공되는 유전자 분석도구를 이용하여 기본적인 분석결과 확보가 가능해 짐으로 국내 인플루엔자 바이러스 유행특성 분석 및 백신, 치료제 개발 등 관련 연구기능 활성화에 기여할 것으로 기대된다.

Ⅱ. 몸 말

KISED 개요
  질병관리본부는 국가 차원에서 국내 유행 인플루엔자 바이러스의 유전자 정보를 체계적으로 관리하고 신변종 인플루엔자 바이러스 탐색을 통한 인플루엔자 바이러스 진단제 및 백신개발에 활용 가능한 연구 인프라를 구축하고자 2008년부터 Influenza Sequence & Epitope Database(ISED)를 개발하였다. 이후 대유행 인플루엔자 A(H1N1)pdm09 국내 분리주의 유전자 정보, 항바이러스제인 NA억제제(타미플루, 릴렌자 등)에 대한 치료제 내성 변이주 분석정보와 M2 이온통로 억제제(아만타딘, 리만타딘)에 대한 약제 내성 변이 분석기능을 추가하였다. 특히, 2011년에는 유전자 정보 검색엔진을 강화하고 분석도구 기능을 개선하였으며, 웹사이트 명칭을 Korea Influenza Sequence & Epitope Database (KISED)로 변경하였다. 이후, BLAST 서비스 및 epitope 데이터베이스를 추가하는 등 사용자들이 보다 편리하게 유전자 정보를 검색하고 기본적인 분석이 가능하도록 기능을 강화하여 2015년 3월 새롭게 웹 시스템을 오픈하였다(Figure 1).

KISED의 주요기능은 크게 인플루엔자 바이러스 유전자 검색과 유전자 서열 분석으로 구성되어 있다. 유전자 검색도구는 국내외 인플루엔자 바이러스 유전자 정보를 인플루엔자 바이러스 형, 아형, 분리주 이름으로 검색할 수 있고, 확인된 유전자 서열을 사용자가 다운로드 받을 수 있도록 서비스를 제공한다. 유전자 분석기능은 유전자 서열을 기반으로 항원결정기 분석, 치료제 내성분석, 백신주와의 서열 유사성 비교, 유전자 변이분석 및 계통분석 등의 유전적 특성을 분석하는 서비스로서 유전자 변이 예측 및 특성분석에 활용이 가능하다.


유전자 정보 구성
  KISED내 유전자 정보는 질병관리본부에서 주관하는 인플루엔자 감시사업인 KINRESS로부터 확보된 계절 인플루엔자 임상 분리주에 대한 유전자 정보 및 국내 인플루엔자 바이러스 연구자에 의해 생산/기탁된 것으로 구성되어 있다. 또한, 미국 NCBI 등으로부터 확보한 국외 인플루엔자 바이러스 유전자 정보도 포함하고 있다.


유전자 서열 전처리 및 KISED 등록
  유전자 정보(원 데이터)는 염기서열 확인 등 전처리 과정을 거친 후 유전자 분석(약제내성, epitope 정보 분석, 백신주와의 상동성 분석, 염기 및 단백질 서열변이분석, 계통진화)을 위하여 최종적으로 KISED에 등록된다. 현재, KISED에 등록된 인플루엔자 바이러스 유전자 정보는 A형 295,356건, B형 31,687건이며 이중 국내 인플루엔자 바이러스 유전자 서열은 A형 3,534건, B형 925건이다(Table 2).


KISED 주요기능
  (1) Search 도구
사용자는 인플루엔자 바이러스의 형, 아형, 유전자 종류, 국가, 숙주, 분리주명 등 다양한 검색 옵션을 선택하여 신속 용이하게 유전자 생물정보(염기 및 아미노산 서열)를 검색할 수 있다(Figure 2).

1) Nucleic acid
  인플루엔자 바이러스의 형, 아형, 국가, 숙주, 유전자 종류 별로 다양한 조건에서 사용자의 유전자 염기서열과 KISED내의 유전자 염기서열을 조합하여 인플루엔자 바이러스의 염기서열 생물정보를 검색할 수 있다.
2) Vaccine strains
  계절 인플루엔자 바이러스의 경우 WHO 권장 북반구 및 남반구 권장 백신주의 유전자 정보가 등록되어 있어 사용자가 각 절기별 백신주 유전자 서열을 검색하고 다운로드가 가능한 서비스를 제공한다. 또한 각 절기별 백신주 간의 유전자 서열변이(Sequence Variation) 검색과 국가별 분리주와 백신주 간의 서열상동성(Sequence Homology) 검색이 가능하다.
3) Drug resistance
  인플루엔자 바이러스 유전자 수준에서 치료제 내성은 NA, M2 유전자를 대상으로 분석할 수 있다. Drug resistance 검색도구를 통해서 NA 억제제인 오셀타미비르, 자나미비르에 대한 내성 유무, M2 억제제인 아만타딘과 리만타딘에 대한 약제 내성유무를 확인할 수 있다.
4) Epitope matching
  항원 표면의 특정부위인 항원결정기(Epitope)는 면역시스템에서 중요한 기능을 담당한다. KISED에서는 특정 분리주의 유전자 상의 T-cell, B-cell epitope의 domain과 해당 단백질의 3D 구조 정보를 제공한다.
5) Flu BLAST
  NCBI에서 제공하는 BLAST 도구를 KISED에 적용하여 사용자가 입력한 서열과 KISED내의 모든 서열간의 유사성을 검색할 수 있다.

(2) Analysis 도구
  Analysis 도구는 1개 이상의 사용자 입력 서열의 유전적 변이(Sequence Variation), 유전자 상동성(Sequence Homology), N-glycosylation, 계통분류(phylogenetic tree) 분석 서비스 등을 제공한다 (Figure 3). Analysis 도구는 제일 먼저 MSA(Multiple Sequence Alignment) 수행으로 시작하며, MSA 수행 후 정렬된 서열 중, 특정 분리주 삭제, 염기 삭제 및 추가 등의 편집이 가능하다. MSA가 완료되면 분석결과를 일괄적으로 제공한다. Sequence Variation 분석결과는 염기서열 혹은 단백질 서열의 변이를 표와 염기별 색상을 이용하여 시각화 하였으며, 약제내성 정보 및 항원결정기상의 변이를 분석할 수 있다. 유전자 상동성은 입력 서열간의 서열 상동성 정보 및 입력서열과 백신주 간의 상동성을 확인할 수 있다. N-glycosylation 분석결과는 N-glycosylation 부위로 예측되는 패턴을 보여 준다. 마지막으로 Phylogenetic Tree 분석결과는 입력서열간의 계통분석을 수행하여 염기나 단백질 잔기 간의 분자적 진화 정도를 시각화된 이미지 형식으로 제공한다.

Ⅲ. 맺는말


  KISED는 국내 인플루엔자 바이러스 유행주 및 국외 인플루엔자 바이러스 유전자 데이터베이스에서 공개된 유전자 정보를 확보하여 이를 체계적으로 관리하고, 유전자 정보 검색과 유전자 변이성, 표면 항원성, 약제 내성, 백신주와의 상동성, 계통분석 등의 유전적 분석용 도구를 제공하는 웹기반 DB 시스템이다. KISED를 활용하여 사용자는 유전자 정보 검색 및 다운로드를 통하여 국내외 인플루엔자 바이러스 유전 정보를 공유할 수 있으며 기본적인 유전자 서열 분석도 가능하다. 향후, KISED는 국내·외 분리 인플루엔자 바이러스의 진화적, 유전적 상관관계 연구, 백신주 선정 및 치료제 효과 연구, 인체 위해도 예측 등의 연구를 위한 기초 분석기능 지원 및 신변종 인플루엔자의 대유행을 대비한 국가차원의 컨소시엄 뱅크가 될 수 있도록 국내외 정보를 지속적으로 축적하고 인플루엔자 연구에 활용될 수 있는 분석도구 추가 등을 통하여 서비스를 더욱 확대해 나갈 계획이다.

Ⅳ. 참고문헌

1. Cox NJ and Subbarao K. 2000. Global epidemiology of influenza: past and present. Ann. Rev. Med., 51, 407-421.
2. Yang IS1, et. al., 2009. Influenza sequence and epitope database. Nucleic Acids Res., Jan;37(Database issue):D423-430. doi: 10.1093/nar/gkn881. Epub 2008 Nov 9.
3. NCBI Influenza Resource Database. http://www.ncbi.nlm.nih.gov/genomes/FLU/FLU.html
4. NIAID. http://www.niaid.nih.gov
5. IRD. http://www.fludb.org
6. GISAID. http://platform.gisaid.org
본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP