본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

생물정보를 이용한 유전자 질환 연관성 분석 방법론 소개
  • 작성일2015-05-14
  • 최종수정일2015-05-14
  • 담당부서바이오과학정보과
  • 연락처043-719-7166
 생물정보를 이용한 유전자 질환 연관성 분석 방법론 소개
The Introduction of Gene-Disease Associations by Bioinformatics Approach

질병관리본부 국립보건연구원 유전체센터 바이오과학정보과
정석원, 조성범

Abstract

Diseases are defined as abnormal conditions in humans caused by a number of factors such as malfunction of gene, exposure of environmental toxins, and disruption of the endocrine system. It has been widely conducted to discover disease-associated genes and biomarkers for understanding disease mechanisms via high-throuput technology such as GWAS (Genome-Wide Association Study), gene expression profiling, and NGS (Next Generation Sequencing). However, the integrated analysis techniques are required to identify novel biological interpretations in terms of global genetic perspectives. Gene-gene interaction, small molecule evidences, and disease-associated biomarkers are necessary to understand the mechanisms of diseases and to discover therapeutic targets. In this article, pathway-based approaches based on text-mining were introduced related to disease relevance and clinical implication.


Ⅰ. 들어가는 말

  질병은 불규칙한 식습관이나 생활습관 등 일상생활의 요소뿐 아니라 각종 생활용품 등으로 인한 불가피한 화학물질의 노출, 유전자의 기능이상이나 호르몬체계 교란 등 복합적인 요소들에 의해 발병되는 현상이라고 볼 수 있다. 다시 말해서, 생체 내의 수많은 인자들이 각각의 기능을 제대로 발휘하지 못할 때 질병이 발생할 수 있다. 전 세계적으로 다양한 질병의 기전을 규명하기 위해 관련 유전자들을 발굴하고, 그에 대한 유전자 치료법이나 바이오마커 검증을 통해 진단키트 개발 등의 연구가 수십년 간 수행되어 왔다. 21세기 초 인간 게놈 서열의 해독이 완료된 후부터는 GWAS, Microarray, Proteomics 등 대규모, 대용량의 오믹스 기반 연구기법(omics-based technology)들이 급속히 발전해 왔다. 이러한 연구기법을 토대로, 질환에 대한 수많은 연구결과와 문헌정보들이 빅데이터의 형태로 보고되고 있기 때문에, 이들의 정보들을 통합하여 새로운 의미를 도출하는 것이 반드시 필요하다고 볼 수 있다. 이러한 작업을 위해서는 생물학적 패스웨이 네트워크(biological pathway network)의 거시적인 관점에서 정보 분석이 필요하다고 할 수 있다.

본 총론에서는 유전자간 상호작용, 질환별 바이오마커 발굴, Small molecule의 효능 평가에 대한 패스웨이 네트워크 분석 소개와 문헌정보를 바탕으로 한 생물정보학적인 해석방법을 소개하고, 질병기전 규명 및 임상적으로 응용 가능성에 대한 전망을 제시하고자 한다. 분석을 위해서 Ariadne Genomics사의 Pathway Studio 도구와 DiseaseFxTM, ChemEffectⓇ 데이터베이스를 사용하였으며, 이를 이용한 실제 분석사례들을 소개하고자 한다.

Ⅱ. 몸 말


생물학적인 경로 기반 유전자 질환 상호작용 분석
  생체 내에는 수많은 유전자들이 상호작용을 통해 다양한 생물학적 기작을 나타낸다. 유전자의 기능을 저해하거나 활성화를 통해 조절하기도 하며, 물리적 상호작용을 통해 또 다른 복합체를 형성하여 새로운 생화학적 기전으로 작용하기도 한다. 이처럼, 유전자 상호작용에 의한 생명현상의 기전은 매우 복잡하다. 비정상적인 유전자간 상호작용은 질병이라는 형태로 나타날 수 있게 되며, 이를 질병치료 목적의 대상으로 삼는 것은 임상의학에서도 고려되어야 할 중요한 요소라고 볼 수 있다[1]. 질병기전을 이해하기 위해 수많은 유전자들의 상호작용에 대한 많은 연구결과가 발표되고 있지만, 이들의 문헌정보들을 대상으로 질병관련 후보 유전자 리스트들을 제시하고, 통합하여 새로운 생물학적 의미를 도출하는 분석법은 아직도 부족한 상황이다.

따라서 유전자-질환 상호작용에 대한 문헌정보의 분석을 통해서 생물학적으로 의미 있는 가설을 도출하는 사례를 제시하고자 한다. 어떠한 실험 결과를 통해 NES (nestin) 유전자의 과발현과 Parkinson Disease와의 연관성을 도출하고자 하나, 현재까지의 문헌정보에서는 보고된 바가 없었다. 하지만, NES 유전자와 Parkinson disease를 조절하는 것으로 알려진 유전자들과의 상호작용 여부를 확인한 결과, 한 예로서 NES 유전자는 GJA1 (gap junction protein, alpha 1) 유전자의 발현을 저해하는 것으로 보고되어 있다. GJA1은 신경교세포 내의 gap junction component의 주된 요소로서, 신경세포를 외부 물질로부터 보호하는 역할을 하며, Parkinson disease와 같은 만성 신경계질환을 억제하는 것으로 잘 알려져 있다. 이러한 유전자간의 상호관계 정보로부터 NES 유전자의 과발현은 GJA1의 신경계 질환으로부터 보호기능을 저해하게 되는 것으로 유추할 수 있으며, Parkinson disease 발병을 유발하는 하나의 새로운 후보 유전인자가 될 수 있다. 이처럼 패스웨이 네트워크 분석을 통해, NES 유전자는 GJA1을 포함하여 기존에 보고되었던 Parkinson Disease 관련 유전자 34개와 상호작용함으로써 Parkinson disease 와의 연관성을 확인할 수 있었으며(Figure 1), 새로운 질병기작을 유추할 수 있는 하나의 출발점이 될 수 있다.

Figure 2는 기존에 알려진 알츠하이머병 연관 유전자와 알츠하이머병 연구에서 도출된 차별발현유전자(differentially expressed genes)들 간의 상호작용을 도식화 한 것이다. Figure 2에서 보는 바와 같이, 기존에 알려진 유전자와 실험결과에서 획득한 유전자간의 상호작용에 대한 정보를 이용하여 질병 기전에 대한 이해를 넓히는 근거자료를 확보할 수 있으며, 유전자 기능에 대한 새로운 연구방향의 설정이 가능하다. 이러한 작업은 다양한 질병유발 인자나 치료표적유전자를 발굴할 수 있는 기반을 마련할 수 있을 것이다.

세부 질환 유형별 진단 바이오마커 발굴
  유전체학의 발달과 더불어 전 세계적으로 수많은 질환들에 대해서 발병기작 규명과 바이오마커 발굴에 초점을 맞추고 있다[2]. 바이오마커란, 질병 진행 상황과 치료방법에 대한 약물의 반응성을 객관적으로 측정하고 평가할 수 있는 지표를 말한다[3]. 특정 질환의 차별발현유전자와 그 질환에서 호발하는 삽입(Insertion), 결실(Deletion), SNP (Single-Nucleotide Polymorphism), CNV (Copy-Number Variations) 등의 서열변이를 이용하여 바이오마커를 발굴할 수 있다. DiseaseFxTM 데이터베이스는 다양한 질환별로 세포내 기작이나 바이오마커를 포함한 관련 유전자 정보를 제공하는데, 이를 이용하면 환자군의 시료를 이용하지 않고 고혈압, 고지혈증, 대사증후군, 당뇨 등 다양한 질환뿐 아니라, 질환별 아형(subtype)에 대한 정보를 포함한 후보 바이오마커의 검색도 가능하다. 예를 들어서, 미 국립의학도서관의 체계적으로 분류된 MeSH (Medical Subject Heading) 의학용어에서는 수축기 혈압이 140mmHg 이상이거나 확장기 혈압이 90mmHg 이상인 상태가 지속되는 경우를 “고혈압(Hypertension)” 으로 정의하고 있다. 하지만, 동일한 증상을 보일지라도 환자군마다 생활습관, 가족력, 식습관 등의 다양한 변수로 인해 고혈압이 유발되기 때문에, 동일 기전으로 고혈압이 유발된다는 결론을 도출하기는 힘들다. 고혈압의 아형으로서 "Hypertension, pulmonary", "Hypertension, portal" 등이 있는데, 이에 대해 현재까지 보고된 후보 바이오마커들의 추출은 Figure 3과 같다(Figure 3).

이처럼, DiseaseFxTM 데이터베이스를 통해 고혈압(Hypertension), 당뇨(Diabetes)를 키워드로 하여 질병들의 아형을 검색한 결과, 각각 27개, 26개로 세분화되어 있음을 확인할 수 있었다(Table. 1). 제시된 각 질환에 대해 보고된 바이오마커들의 리스트와 동시에 유전자 발현의 증감에 대한 정보, 돌연변이의 유무 정보 등을 활용해서, 기전연구를 수행하면 새로운 바이오마커 발굴이 가능할 것으로 보인다. 또한, 유전자 상호작용의 다양성에 따라 기존의 환자군을 현재로서는 구분되어 있지 않는 하위군으로 세분화해야 할 가능성이 있고, 이러한 정보는 향후 맞춤형 의료뿐만 아니라 치료 타겟 발굴이나 정교화된 진단키트 개발에 근거자료로 제시될 수 있을 것이다.

약물정보 데이터베이스를 이용한 생물학적 경로 분석
  유전자와 질병간의 상호작용에서 유전자 단위의 바이오마커는 많이 언급되고 있으나, 실제 진단의학에서는 혈당(blood glucose), 혈청(serum), 크레아틴(creatine), 아미노산(amino acid) 등의 small molecule 들도 바이오마커로 사용된다. Small molecule은 생체 내 대사체, 화학물질, 약물, 호르몬 등을 통합하여 지칭하는 것으로 질병 네트워크 분석에서는 상대적으로 등한시 되는 경향이 있으나, 유전자의 기능뿐만 아니라 질병기전 메커니즘 조절 연구에 있어서 반드시 고려되어야 할 요소이다[4]. 질환과의 상호 연관성을 고려한다는 측면에서 small molecule의 조절 및 대사 기전은 질병연구에 매우 중요한 정보를 제공한다. 특히, 중금속이나 환경호르몬 등 인체 위해성 물질에 대해서는 주변생활 환경에 따라 비록 미량의 노출이라고 할지라도 질환발병을 유도할 수 있기 때문에 더욱 중요하다고 할 수 있다.

ChemEffectⓇ 데이터베이스를 이용하면, 34,000여 종의 small molecule으로 분류되는 화학물질(chemical)에 대한 정보를 확인할 수 있고 이 물질이 유전자나 질병에 미치는 영향을 핵심 문헌정보를 추출하여 쉽게 파악할 수 있게 되었다. ChemEffectⓇ 데이터베이스는 수많은 문헌정보들을 기반으로 구축된 독성관련 패스웨이를 포함하여 어떠한 질환과 연관성이 있는지에 대한 정보를 다루고 있다. 예를 들어서 galantamine이라는 약물정보에 관해 알아보고자 서지정보를 추출한 결과, 본 약물은 50개의 유전자를 조절하거나 발현량에 영향을 미치는 것으로 확인할 수 있었다. 또한 125개의 질환에 대해서 각 질환의 기전을 조절하는 가능성을 제시할 수 있는 연구결과나, 실제 임상의학에서 이용된 사례들을 확인할 수 있다(Figure 4). 이처럼 ChemEffectⓇ 데이터베이스를 이용하여 수많은 약물에 의해서 조절되는 유전자 목록을 확립하고, 질병관련 약물작용 및 효능 프로파일링을 한 번에 확인할 수 있으며 이에 대한 부작용을 예측해 볼 수 있다. 이를 기반으로 독성과 약물의 세부조절 메커니즘 사이의 관계를 규명하고 대체 약물을 발굴하는 데도 유용할 것으로 사료된다.

Ⅲ. 맺는말


  유전자, small molecule 및 질병과의 관련성 정보는 많은 연구를 통해 보고되고 있다. 질병 기전을 이해하고 그 영역을 확대해 나가기 위한 실험적인 연구도 지속되어야 하겠지만, 논문데이터를 기반으로 한 자료를 취합하여 새로운 의미를 도출하는 것 역시 또 다른 발병기전 규명이나 진단 후보 바이오마커 발굴이 가능할 수 있다는 점에서 중요한 접근법이라고 볼 수 있다. 현재 바이오과학정보과에서는 여러 질환에 대한 실험결과의 서지자료 분석에 관한 연구를 진행하고 있다. 많은 연구자들에 의해 수행된 논문들이 취합된 text-mining 방식의 컨텐츠를 기반으로 패스웨이 네트워크 분석을 하고, 유전자들 간의 상호작용 정보를 통해 발현변화나 조절 등 기능적인 측면의 연관성을 제시하고 있다. 또한, 질병간의 기능적인 연관성 및 해당질병에 대한 subtype 리스트까지 고려하는 심층 분석을 수행하고 있다. 이와 같은 기법을 접목하면 질병을 유발시키는 다양한 인자 및 새로운 바이오마커를 발굴함과 동시에 제시된 결과물들을 기반으로 해당질환에 대한 새로운 약물 타켓 발굴 및 정교화된 진단칩 개발에 대한 근거자료로 활용될 수 있을 것으로 기대된다.

Ⅳ. 참고문헌


1. Ryan DP et al. 2005. Protein-protein interactions in human disease. Curr Opin Struct Biol. (15): 441-6.
2. Strimbu K et al. 2010. What are Biomarkers?. Curr Opin HIV AIDS. (5); 463-466.
3. Frost & Sullivan. 2006. Personalized Medication-Technology Trend Analysis.
4. Wishart DS. 2012. Chapter 3: Small molecules and Disease. PLoS Comput Biol. (8): e1002805.
본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP