본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

한국인유전체분석사업을 통한 한국인 유전체변이 정보 기반의 질병발생위험도 예측 모형 고도화 연구 - 당뇨병 예측모형을 중심으로-
  • 작성일2012-01-06
  • 최종수정일2012-08-24
  • 담당부서감염병감시과
  • 연락처043-719-7173

     

한국인유전체분석사업을 통한 한국인 유전체변이 정보 기반의
질병발생위험도 예측 모형 고도화 연구
- 당뇨병 예측모형을 중심으로-
An in-depth study for prediction model of type 2 diabetes mellitus using genetic variations based on Korean Genome Analysis Project

질병관리본부 국립보건연구원 유전체센터 형질연구과             
이주영              

 


Ⅰ. 들어가는 말
    질병발생 예측 모 연구는 현재 건강하지만 일정 기간 내에 질병진단을 받을 것으로 예측하는 즉 발병이 예측되는, 위험군을 발병 위험확률을 추정하는 연구로서 맞춤의학, 개인의학, 예방의학으로 요약되는 미래 질병관리의 가장 중요한 분야이다. 이때 조사되는 지표 중 관찰이 쉽고 정기적으로 반복검사가 용이한 측정법으로 얻어지는 지표 중 발병 예측에 큰 도움을 주는 지표를 위험요인으로 선정하여 질병의 발병을 용이하게 예측할 수 있는 체계를 구축하는 것이 필요하다.
  당뇨병은 인슐린 부족이나 인슐린에 대한 세포 저항으로 인한 고혈당 상태가 지속됨에 따라 대사상의 변화가 초래되어 발생하는 질병으로 크게 제1형 당뇨병과 제2형 당뇨병으로 분류한다. 제1형은 췌장 β세포의 파괴성 병변에 의해 인슐린이 결핍되어 발생하며, 제2형은 인슐린 분비 저하와 인슐린 저항성으로 인해 생긴다. 당뇨병의 초기 증상으로는 다뇨(polyuria), 갈증(polydipsia), 식욕항진(polyphagia), 체중감소이며, 임상적인 증상으로는 요를 통한 당의 배설(glucosuria), 고혈당(hyperglycemia), 무력증(asthenia) 등이 있다. 당뇨병은 위험한 합병증을 유발하며, 주요 합병증으로는 당뇨병성 망막증, 당뇨병성 신부전, 당뇨족, 동맥경화증 등이 있고 고혈압, 뇌졸중, 심장병, 신장병을 악화시킨다.
  한국에 많은 제2형의 경우 인슐린 저항성을 특징으로 하며, 초기에는 췌장이 인슐린 분비를 늘림으로써 별다른 증상이 없지만, 췌장의 능력에 한계가 오게 되면 증상이 나타나기 때문에 조기진단에 실패할 수 있다. 인슐린 저항성으로 인한 혈당증가에도 합병증이 발병할 수 있으므로 당뇨병의 진단 전에도 인슐린 저항성의 유무를 조사할 필요가 있다.
  당뇨병 진단을 위해 국내에서 사용하는 방법은 공복혈당 검사와 경구당부하 검사이다. 공복혈당검사는 최소 8시간 동안 금식을 한 후 혈당을 측정하는 것이고, 경부당부하 검사는 공복 혈당 검사 후 당분이 함유된 음료를 마시고 두 시간 후 혈당을 측정하는 것으로 인슐린 저항성을 측정할 수 있으나 검사의 번거로움과 높은 검사비용으로 인해 환자들이 검사를 기피하는 경향을 보이며 이로 인하여 당뇨병과 합병증의 진행 유무를 조기발견하기 어려운 실정이다.
  당뇨병의 유병률이 높은 선진국은 검사가 번거로운 지표 대신 검사가 용이한 지표를 이용하여 자국의 역학·환경 및 유전정보를 기반으로 당뇨병 발병모델을 개발하고 있다.
  이 연구의 목적은 당뇨병의 발병 예측에 큰 도움을 주는 지표, 즉 위험요인을 검사가 용이한 방법 중에서 선정하고 선정된 위험요인을 활용하여 당뇨병 발생 예측률을 제고할 수 있는 적정한 모형을 구현하는 것이다.
  본 사업의 목표는 질병관리본부 국립보건연구원에서 확보한 임상·역학 및 유전체 정보를 기반으로 당뇨병 예측모형을 연구하는 것으로, 특히 유전체 정보를 기반으로 미래의 질환 여부 및 정도 예측을 가능하게 함으로서 국민들의 삶의 질 향상과 질병 예측을 통한 의료비용 등을 감소시킬 수 있는 가능성을 연구하는 것이다. 아울러, 질환 감수성자를 예측하고 관리함과 동시에 국민 스스로가 질환위험도를 인식하고 관리할 수 있도록 하고자 하는 연구이다.

Ⅱ. 몸 말
  1. 유전체정보(SNP) 기반의 당뇨병 예측모형 개발
  질병관리본부 국립보건연구원에서는 국민건강을 증진하고자 다양한 코호트를 확보하여 추적조사를 하고 있으며 이 중 지역사회코호트(안성, 안산) 1기 - 4기 자료를 대상으로 임상·역학자료를 확보하어 유전체형질정보(단염기다형성; SNP, Single Nucleotide Polymorphism)를 500,000개를 조사하였다.
  안성 및 안산 지역사회코호트 조사 대상자 10,038명 중 QC(quality control) 기준을 통과한 8,842명의 지노타이핑(genotyping) 1)이 된 500,000여개 SNPs 정보를 기반으로 하여 질병예측모형을 분석하였다. 그 중 HWE(Hardy-Weinberg Equilibrium, p<10-6), MAF(Minor Allele Frequency, <0.01)를 제외하는 등 QC 기준을 통과한 352,228개의 SNPs에 대하여 당뇨병 예측의 관계성을 확인하고, 관계성을 확인한 SNPs을 이용하여 유전체 정보 기반의 질병발생 예측모형을 개발하였다. 이들의 모형 중 ROC curve(Receiver Operating Characteristic Curve) 분석으로 민감도와 특이도가 가장 좋은 적정점(cutoff-point)을 선택하였다(Figure 1).
                          
  다음 단계로 안성-안산지역사회코호트 조사대상자에서 QC기준을 통과한 8,842명 중 당뇨병군 1,965명과 정상군 6,865명의 총 8,830명으로 HWE, MAF 등의 QC기준을 통과한 352,228개의 SNPs에 대하여 당뇨병 간의 관계성을 로지스틱 회귀분석을 통해 확인하였다. 분석 결과 중 p값이 10??미만으로 당뇨병과 관련성이 유의하게 나타난 SNP를 정리 하였다(Table 1).

  분석 결과 당뇨병과 관련성이 가장 유의하게 나타난 유전자는 6번 염색체의 SNP1로 p값은 5.89×10??로 확인되었으며, 또한 같은 염색체의 SNP2, SNP3, SNP4에서도 p값이 10-7이하로 매우 유의한 관계가 있는 것으로 나타났다. SNP1, SNP2, SNP3의 Gene이 CDKAL1로 같은 것으로 확인되었다. 또한 major allele homozygotes, homozygotes, minor allele homozygotes로 나누어 Chi-square test 분석을 통하여 당뇨병 유무에 대한 빈도와 관련성을 확인한 결과 당뇨병과의 관련성이 매우 유의하게 나타났다(Table 1). 6번 염색체인 SNP1, SNP2, SNP3 SNP에서 로지스틱 회귀분석 결과(Table 1의 왼쪽)는 p값이 각각 6.89E-07, 4.66E-07, 4.23E-07로 당뇨병과 관련성이 가장 유의하게 나타났다(Table 1의 오른쪽 p-value).
  로지스틱회귀분석 결과를 바탕으로 위험요인으로 유의하게 나타난 SNP를 대상으로 다중회귀분석을 실시한 결과 아래 Table 2와 같이 나타났다.
  유전체 정보 기반의 당뇨병발생 예측모형에는 6번 염색체에서 SNP1, SNP13의 SNP가 포함되었다. 또한 7번, 11번, 3번 염색체에서도 각각 SNP12, SNP9, SNP14의 SNP가 포함되어 총 5개의 SNP정보를 기반으로 당뇨병 예측 모형을 개발하였다. 이 SNP들은 모두 p값이 10?? 이하로 당뇨병과의 관련성이 큰 것으로 나타났다(Table 2).

  유전체 정보 기반의 당뇨병 예측 모형이 당뇨병을 예측하는데 어느 정도나 유용한지 확인하기 위하여 ROC(Receiver Operating Characteristic Curve) 분석을 실시하였다. ROC curve의 Area 값은 0.576(95% CI. 0.561-0.591)으로 분석 되었다. cutoff point는 민감도와 특이도가 가장 높은 수치인 0.2148로 하였다.  이 수치는 민감도 53.9%, 특이도 57.6%로 분석 되었다. 이때의 위험도는 cutoff point 이상이 cutoff point 미만의 경우보다 1.591(95% CI. 1.432-1.768)배 위험한 것으로 나타났다(Figure 2, Table 3).
                                    


  2. 발생률 기반의 유전자 응용 당뇨병 예측 모형
  대상 지역사회코호트 발생률을 기반으로 정상군 4,422명과 당뇨병 발생군 827명을 선정하여 임상역학 및 유전체정보(352,228개의 SNPs)를 활용한 연관성 분석을 수행하였다. 로지스틱 회귀분석 결과를 p값으로 정렬하여 당뇨병 발생과 관련성이 가장 유의하게 나타난 SNP를 정리한 결과 당뇨병과 관련성이 가장 유의하게 나타난 유전자는 9번 염색체의 NFIB이 유전자로 p값은 7.49x10??으로 나타났다. 더욱이 유전체정보(SNP) 기반에서 유의한 SNP가 많이 포함된 6번 염색체에서 3개의 SNP가 확인되었고, 발생률 기반에서 당뇨병과 관련성이 큰 염색체는 13번으로 20개의 SNP 중 5개의 SNP가 확인 되는 등, 다양한 결과가 나타나 이에 대한 심도 깊은 연구를 진행할 계획으로 있다.

  3. 유전자 응용 당뇨병 예측 프로그램
  유전변이 정보를 통해 한국인에서의 유전변이에 따른 질병 발병 위험도 도출을 위한 통계적인 방법을 수립하고 신체 특성과 건강 관련 정보를 웹 기반으로 구축하여 질병 예측을 위한 인프라를 구축하고자 하였다.
  위에서 언급한 연구를 기반으로 다양한 모형이 개발된다고 하여도, 환자 및 일반 국민들에게 예측 정보를 전달하고 이에 대한 건강위험관리를 지속적으로 하기 위해서는 사용자가 쉽게 접할 수 있는 시스템이 필요하다. 이에 유전자 응용 당뇨병 예측 모형을 구현하기 위해 웹 기반의 인프라를 구축하는 시스템을 개발 중이다.
  유전자형 기반 당뇨병 예측 시스템에서 유전체 정보 기반의 당뇨병발생 예측모형과 발생률 기반의 유전자 응용 당뇨병 예측 모형, 유병률 기반의 유전자 응용 당뇨병 예측 모형을 제공하도록 개발 중이다. 이 시스템에는 사용자가 원하는 모형을 선택할 수 있으며, 결과를 비교할 수 있도록 개발 중이다. 유전자 응용 당뇨병 예측 프로그램은 일반인들도 쉽게 자신의 정보를 이용하여 당뇨에 대한 위험률을 예측할 수 있도록 웹 기반으로 개발하였다(Figure 3).
                         
  유전체 정보 기반의 당뇨병발생 예측 프로그램은 사용자가 자신의 유전형을 알고 있는 경우에 선정된 5개의 유전변이 정보에 자신의 유전형을 선택하면 정상군 또는 당뇨 위험군으로 결과가 확인되도록 구축되었다(민감도 53.9%, 특이도 57.6%).
  이 시스템은 세 가지로 나누어져 있는데, 첫째는 논문(문헌)을 통해서 얻은 질병에 대한 유전변이 정보를 데이터베이스로 구축하였다. GWAS(질병과 관련된 유전변이를 찾는 연구방법)를 통해 연구된 논문과 해당 논문의 정보를 정리한 저널 데이터베이스이고, 둘째는 저널 데이터베이스에 언급된 질병에 대한 상세한 정보를 제공하며, 질병의 명칭, 정의, 원인, 증상에 대한 일반적인 정보와 해당 질병과 관련된 유전변이에 대한 정보를 저널 데이터베이스, SNP database와 연결해서 찾을 수 있도록 구축된 질병데이터베이스(Disease database)이며, 셋째는 Journal database에 언급된 유전변이(SNP)에 관한 상세한 정보를 저장하는 SNP database로 정리하였다. 각각의 데이터베이스는 질병과 유전변이의 rs number로 연결되어 데이터가 연계되어 있다.
  따라서, 임상역학 및 유전체정보를 기반으로 당뇨질환에 위험을 예측하고 그 유전체변이정보에 따른 일반적인 질환위험도도 같이 제공하여 외국의 발표된 정보, 질병관리본부 국립보건연구원에서 수행 중인 한국인유전체분석사업기반의 위험도와 비교할 수 있다. 더욱이 질환에 관한 정보제공 페이지에서는 질환의 정의, 원인, 증상에 대하여 일반인이 쉽게 이해할 수 있도록 정리하였며, 현재 연구된 참고 문헌과의 링크를 통해 더 자세하게 이용할 수 있도록 기획하였다.
                   
  또한 향후에 사용자가 유전변이를 통하여 질병의 위험도를 예측할 수 있도록 지원가능성을 타진하기 위해 유전변이 정보를 파일로 업로드할 수 있도록 구축하여 검토 중에 있다. 유전자형 기반 당뇨 예측 시스템을 쉽게 이용할 수 있도록 질병에 대한 정보, 질병관련 유전변이에 대한 정보, 자신의 유전자형에 따른 질병 위험도 예측에 대한 사용방법을 나타내도록 디자인 하였고, 업로드한 개인의 정보를 이용하여 질병 예측 결과를 보여주는 페이지로 각각의 유전변이에 대한 위험도를 보여주고, 전체의 유전변이를 이용하여 전체적인 질병 위험도를 제공하도록 기획·검토하였다.
  현재는 당뇨질환에 대한 가능성을 확인한 것이며 관련 제반사항을 검토하여 모형 및 시스템을 지속적으로 개발 하여 보완해 나가고자 한다.
                          

Ⅲ. 맺는 말


  이러한 질병의 위험을 예측하고자 하는 연구는 질병예방을 위한 노력으로서 질병 발생 전에 질병위험도를 감지하고 예측 관리를 함으로써 건강부담비용을 절감하고 단순히 생명연장이 아니라 국민에게 좀 더 질 높은 삶을 제공하고자 하는 것이 목적이다.
  아울러 국가는 전반적인 질환의 변화를 예측하고 그 근거를 바탕으로 질병에 대한 관리전략을 수립하며, 국민은 개개인의 질환의 위험성을 주기적으로 모니터링하고 관리함으로써, 국가와 국민이 동시에 질환에 대한 관리를 하도록 하여 효율을 높이고자 하는 것이다.
  이러한 질병관리를 더욱 효율적으로 하기 위해서는 질병예측 모형화 연구에서 질병진단을 받을 것으로 예측되는 위험군에 대한 예측과 위험확률을 추정하는 것이 중요하나, 질병 예측을 위해 위험요인의 지표선정도 매우 중요하다. 예측 시에 질병의 현황과 가장 근사한 정보를 줄 수 있는 위험요인 지표의 선정이 우선되어야 그 지표로 인한 예측이 정도 높은 결과를 얻게 되기 때문이다.  따라서 국가기반의 지표선정을 위한 다양한 위험요인의 측정, 모니터링이 중요하며 이러한 정보들이 통합되어 분석되도록 하기 위해 노력이 지속적으로 필요하다.
  따라서 질병관리본부 국립보건연구원 유전체센터에서는 한국인유전체분석사업기반으로 지속적인 기반조성 및 개발된 모형연구 등을 통해 질병 위험도 예측 가능성을 타진로써 향후 질환의 예측 및 예방의 기반을 마련하고자 한다.

                                                                                                                                                                                         

1) 지노타이핑(genotyping): 유전체 서열상의 변이를 밝혀내는 방법


Ⅳ. 참고문헌

1. Amos AF, McCarty DJ, Zimmet P. The rising global burden of diabetes and its complications: estimates and projections to the year 2010. Diabet Med.  1997;14 Suppl 5:S1-85.
2. Plan of action for the Western Pacific Declaration on Diabetes 2000-2005, WHO-WPR 2001.
3. Gloyn AL. The search for type 2 diabetes genes. Ageing Res Rev 2003;2(2):111-27.
4. Harris MI, Flegal KM, Cowie CC, Eberhardt MS, Goldstein DE, Little RR, Wiedmeyer HM, Byrd-Holt DD.  Prevalence of diabetes, impaired fasting glucose, and impaired glucose tolerance in U.S. adults: the Third National Health and Nutrition Examination Survey, 1988-1994.  Diabetes Care 21: 518-524, 1998.
5. Hogan P, Dall T, Nikolov P. Economic Costs of Diabetes in the U.S. in 2002. Diabetes Care ;26(3):917-932, 2003
6. Wichai Aekplakorn, Pongamorn Bunnag, MarkWoodward, Piyamitr Sritara, Sayan Cheepudomwit, Sukit Yamwong, Tida Yipintsoi, Rajata Rajatanavin.  A Risk Score for Predicting Incident Diabetes in the Thai Population.  Diabetes Care 2006:29:1872-1877.
7. Jaana Lindstrom, Jaakko Tuomilehto. The diabetes risk score: a practical tool to predict type 2 diabetes risk.Diabetes Care. 2003 Mar;26(3):725-31.
8. Long J, Rozo-Rivera A, Akers T, VanGeest JB, Bairan A, Fogarty KJ, Sowell R.  Validating the utility of the Spanish version of the American Diabetes Association Risk Test. Clin Nurs Res. 2006 May;15(2):107-18.
9. Glumer C, Vistisen D, Borch-Johnsen K, Colagiuri S; DETECT-2 Collaboration. Risk scores for type 2 diabetes can be applied in some populations but not all. Diabetes Care. 2006 Feb;29(2):410-4.
10. Kanaya AM, Wassel Fyr CL, de Rekeneire N, Shorr RI, Schwartz AV, Goodpaster BH, Newman AB, Harris T, Barrett-Connor E. Predicting the development of diabetes in older adults: the derivation and validation of a prediction rule.Diabetes Care. 2005 Feb;28(2):404-8.
11. Risch NJ: Searching for genetic determinants in the new millennium. Nature    2000 405:847-56
12. Marble, A., Krall, L.P., Bradley, RF, Chrislieb AR, & Soeldner JS. Joslin's Diabetes Mellitus Philadelphia; Lea & Febiger 12th Ed, pp.12-42.
13. Honeycutt, A. A., Boyle, J. P. Broglio, K. R., Thompson, T. J., Hoerger, T. J., Geiss, L. S., & Narayan, K. M., (2003). A Dynamic Markove Model for Forecasting Diabetes Prevalence in the United States through 2050. Health Care Manag. Sci., 6:155-164.
14. Engelgau, M. M., Narayan, K. M., & Herman, W. H. (2000). Screening for Type 2 Diabetes. Diabetes Care, 23(10):1563-1580.
15. Narayan, K. M. V., Boyle, J. P., Thompson, T. J., Sorensen, S. W., & Williamson, D. F. (2003). Lifetime Risk for Diabetes Mellitus in the United States. JAMA., 290(14): 1884 - 1890.  


 

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP