본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

유전자 복제수변이와 유전질환
  • 작성일2010-10-15
  • 최종수정일2012-08-25
  • 담당부서감염병감시과
  • 연락처043-719-7173

   

  유전자 복제수변이와 유전질환
Copy number variation and human genetic disease

질병관리본부 국립보건연구원 유전체센터 형질연구과      
  


Ⅰ. 들어가는 말
  인간의 유전체는 23쌍의 염색체로 구성되어 있고 부모로부터 유전된다. 또한 염색체 내에 존재하는 DNA라는 유전정보는 유전체 내에서 통상적으로 2n으로 존재한다고 알려져 있다. 하지만 최근 연구  결과를 통해 특정 DNA 조각들이 다양한 수로 존재한다는 사실이 밝혀졌다. 다시 말해 유전체 내에서 항상 2n으로만 존재한다고 생각되던 유전자들이 실제로는 1n, 2n 또는 3n 이상 존재한다는 것이다.  유전자 복제수변이(Copy Number Variation; CNV)라고 불리는 이러한 현상은 1 킬로베이스1)(kilobase; kb) 이상의 특정 염기서열이 결실(0n 또는 1n)되거나 증폭(3n 또는 그 이상)되는 것으로 삽입(insertion), 결실(deletion), 전위(invertion), 증폭(duplication), 전좌(translocation) 등과 더불어 유전자의 구조적 변이에 포함된다(Figure 1)[1-3]. 유전자 복제수변이는 1959년 다운증후군의 발견을 통해 처음 그 존재가 알려진 이후 관련 증후군 또는 질병 등을 중심으로 연구가 진행되어 오다가, 2004년 두 편의  논문을 통해 정상인의 유전체에서도 다양한 크기로 여러 염색체에 폭넓게 존재하고, 또한 이 중 일부는 부모로부터 유전된다는 사실이 밝혀지면서 유전자 복제수변이와 건강과 질병과의 연결고리를 찾기 위한 다양한 분석 방법이 시도되었으며 관련 기술도 빠르게 발전해 왔다. 현재에는 유전자복제수변이 발굴 방법의 발전에 힘입어 더 작은 크기도 유전자 복제수변이에 포함되고 있으나 일반적으로는 2006년 Feuk 등[4]이 정의한 ‘1kb 또는 그 이상의 크기를 갖는 DNA 단편의 증폭 또는 결실’을 유전자 복제수변이라고 부르고 있다. 유전자 복제수의 차이는 곧 유전자 서열의 변화를 의미하며 이러한 변화는 질병에 대한 감수성(susceptibility)에 영향을 미치거나 유전자의 파괴(disruption) 또는 융합(fusion)을 유발하기도 하고, 주변에 위치하는 유전자의 조절에 영향을 미칠 수 있다고 알려져 있다. 이 글에서는 현재  유전자 복제수변이와 유전질환과의 연관성 분석 연구의 최근 동향에 대해 기술하고자 한다.
                                                  
                                         
  1) 킬로베이스: 염기배열상의 어떤 영역의 크기를 표시하는 단위. 1,000개의 nucleotide로 구성된 핵산의 길이.

Ⅱ. 몸 말
  1. 유전자 복제수변이의 중요성
  최근 유전자 복제수변이 연구에 주목하고 있는 이유는 다음과 같다. 첫 번째, 유전자 복제수변이는  양적인 면으로만 볼 때 전체 유전체의 약 12%(4-24Mb)를 차지하는 것으로 알려져 있어 단일염기다  형성(Single Nucleotide Poly-morphism; SNP)이 차지하는 유전체당 총 크기(2.4Mb)보다 훨씬 더   크다[2]. 또한 정상인에서 약 2,900개의 유전자가 알려진 복제수변이와 중첩되는 것으로 보고되어 유전자들의 복제수 차이가 표현형에 어떠한 영향을 미치는지에 주목하고 있다[1]. 두 번째, 질병을 가진   환자와 정상인 간의 복제수변이 연구를 통해 특정 유전자의 복제수변이가 질병에 직·간접적으로 관여한다는 사실이 밝혀졌다. 이는 유전자 복제수변이가 단일염기다형성으로 설명할 수 없는 이른바 ‘잃어버린 유전성(missing heritability)’을 설명해 줄 또 다른 변이로 주목받는 이유가 되고 있다. 세 번째로 복제수변이의 상당수는 각 개인 마다 다르며 인종 간에도 서로 다른 형태의 복제수변이를 보인다. 각 인종 간의 복제수변이의 차이는 진화 과정에서 복제수변이의 역할을 규명하려는 진화 연구 분야의 주제가  되고 있다. 마지막으로 인구 집단 내에서 공통적으로 발견되는 유전자 복제수변이 중 일부가 단일염기다형성을 포함하거나 또는 근처에 존재하여 단일염기다형성 존재를 통해 복제수변이의 존재를 확인할 수 있는 ‘taggable SNP’이 보고되었다[7]. 현재 전장유전체연관성분석(Genome-Wide Association Study;GWAS)을 통해서 밝혀진 질병 원인 마커 중 일부는 유전자 복제수변이와 직·간접적으로 관련된 것으로 추측하고 있다. 따라서 유전자 복제수변이와 단일염기다형성의 연관성 분석을 통해 질병과의 상관관계를 찾고자 하는 연구도 시도되고 있다[7].        

  2. 유전자 복제수변이 발굴
  유전자 복제수변이의 개념은 다운증후군, 터너증후군 등 염색체의 구조적 이상을 찾는 핵형분석(karyotyping) 방법이 분석 기술의 발달로 인해 수 kb 길이의 유전체의 구조적 변화를 찾을 수 있도록 확장된 것으로 볼 수 있다[2]. 유전자 복제수변이 발굴은 레퍼런스(reference) 유전체를 선정하고 발굴하고자 하는 유전체와 레퍼런스 유전체 사이에서 나타나는 차이를 비교하여 레퍼런스 유전체에 대한 상대적인 차이로 복제수 차이를 판단한다. 최근에는 array comparative genomic hybridization(aCGH), SNP array, representational oligonucleotide microarry analysis(ROMA), multiplex ligation-dependent probe amplification(MLPA), multiplex amplifiable probe hybridization(MAPH) 등 다양한 방법들이 개발되었다(Figure 2). 이 중 대규모 인구집단 시료를 이용한 유전자 복제수변이 발굴 연구을 위해 aCGH와 SNP array를 많이 사용하고 있다. 수십만 개 이상의 프로브(probe)를 갖는 aCGH와 SNP array들은 유전체 전장에 걸쳐 수 kb-수십 kb 간격으로 복제수변이가 존재하는지를   조사할 수 있다. 그러나 이 방법들도 유전자 복제수변이의 양 끝단(breakpoint)을 정확하게 정의하기   어렵다는 단점이 존재한다. 최근에는 Next Generation Sequencing(NGS)의 기술이 개발됨에 따라서 NGS를 통해 얻어진 리드(read)를 통해 복제수의 차이를 찾아내는 알고리즘이 개발되고 있고 array와 NGS를 병행하여 분석하는 방법도 등장하고 있다[8]. 발굴된 복제수변이 데이터들은 데이터베이스에  저장되어 복제수변이가 인종마다 차이가 있는지 그리고 질병을 가진 사람과 건강한 사람사이에는 어떠한 차이가 있는지 등의 정보를 제공한다. 대표적인 복제수변이 데이터베이스로는 Database of Genomic Variants(DGV)[5]와 DatabasE of Chromosomal Imbalance and Phenotype in Human using Ensembl Resources(DECIPHER)[6] 등이 있으며 DGV의 경우 2005년을 기점으로 매년 데이터베이스에 등록되는 복제수변이 데이터의 양이 급속도로 증가하고 있다(Figure 3).

                                                  

  3. 유전자 복제수변이와 질병과의 관계
  현재 알려진 대부분의 유전자 복제수변이는 질병 발생과 직접 관련되지 않은 양성변이(benign variant)의 형태로 존재하며 부모로부터 유전되는 복제수변이와 감수분열과정에서 새로 생성되는(de novo) 복제수변이의 극히 일부만이 질병 유발에 직·간접적으로 관여한다고 알려져 있다. 진화과정에서 급속한 발달을 보인 면역 시스템, 두뇌 발달 그리고 감각 기능에 관련된 유전자들 중 상당수가 복제수변이를 보인다. 이는 진화과정 중 유전자 복제수변이가 상당한 역할을 하고 있다는 사실을 반증한다.  현재 연구되는 복제수변이-질병 연관성 연구의 대부분도 면역시스템과 발달 기능에 집중되어 있다.   예를 들면, FCGR3B, CCL3L1과 C4 등의 유전자 복제수변이는 류마티스 관절염, 전신성 홍반성 루프스 등과 같은 자가 면역질환과 관련이 있다고 알려져 있고, DEFENSIN, NRXN1 등에서 나타나는 유전자 복제수변이는 정신질환 및 발달장애와 관련이 있다고 알려진 대표적인 예이다(Table 1)[2].

  2010년 Nature에 발표된 논문에서는 3,000명의 대조군(common control)과 8개 질환(크론병, 제1형 당뇨병, 류마티스 관절염, 제2형 당뇨병, 고혈압, 조울증, 유방암, 관상동맥질환)별 각 2,000명씩 총 16,000명의 시료를 사용해서 복합질환과 유전자 복제수변이(common CNV)와의 연관관계를 규명하려 하였다[7]. 총 10,894개의 유전자 복제수변이 중 연관성 분석에 사용할 수 있는 3,432개의 유전자 복제수변이를 선정하였다. 분석결과 자가면역 질환(크론병, 제1형 당뇨병, 류마티스 관절염) 등을 제외한 나머지 5개 복합질환에서는 유전자 복제수변이와의 유의한 연관성이 발견되지 않았다. 따라서 현재 개발된 유전자형 분석(genotyping) 방법을 통해 찾을 수 있는 유전자 복제수변이는 복합질환과 유의한 연관성을 보이지 않는다고 결론지었다. 최근 질병과 유전자 복제수변이와의 연관성 분석 연구도 역시 복합질환과 관련된 유전자 복제수변이(common CNV)에 대한 연구보다는 인구집단 내 1% 이하의 빈도로 발견되는 거대, 희귀 유전자 결실(large, rare chromosomal deletion)과 정신질환 및 발달 장애와 관련된 질병에 관한 연관성 분석 연구가 더 많이 보고되고 있다[9]. 서두에서 언급했듯이 분석방법이 빠르게 발전하고 있고 NGS와의 접목을 통한 새로운 방법들이 시도되고 있지만 아직도 정확한 유전자 복제수변이 지역을 정확하게 정의하기 어렵다. 따라서 앞으로 한동안은 정신질환을 포함한 발달 기능과 관련된 유전자와 거대, 희귀 유전자 결실과의 연관성 연구 분야에서 보다 더 활발한 연구가 진행될 것으로 보인다.


Ⅲ. 맺는 말


  복제수변이를 다루는 대부분의 연구에서는 1인당 100개 이하의 복제수변이를 발굴하였지만, 최근 초고해상도 aCGH(Ultra-high resolution aCGH)를 사용하여 유전자 복제수변이를 연구한 두 논문에서는 1인당 평균 670개와 1,098개의 복제수변이가 존재한다고 보고하였다[7-8].
  이것은 아직까지도 유전체에 존재하는 복제수변이를 정확하게 찾지 못하고 있다는 것을 의미한다. 또한 레퍼런스 유전체에 따라 복제수변이가 바뀌는 문제와 복제수변이 지역의 끝단(breakpoint)의 정확한  정의도 해결해야할 문제이다. 그러나 이러한 문제들은 여러 분석방법들의 개발과 NGS와의 접목 등을 통해 빠른 속도로 해결해 나가고 있다. 따라서 복제수변이 분석과 관련된 문제들이 상당수 해결된다면 초기에 기대했던 단일염기다형성 등이 설명해주지 못하고 있는 잃어버린 유전성의 일부분을 복합질환에서도 설명해 줄 중요한 유전적 변이로 주목받을 것으로 기대한다.


Ⅳ. 참고문헌

 1. http://www.gene-quantification.de/cnv-faq.pdf
 2. 임선희, 정연준. 2009. 새로운 유전체 변이의 등장: 유전체 복제수 변이. Medical PSTGRADUATES 37, 149-153.
 3. Lee, C., Scherer, S.W. 2010. The clinical context of copy number variation in the human genome. expert reviews in molecular medicine 12, e8
 4. Feuk, L., Carson, A.R. and Scherer, S.W. 2006. Structural variation in the human genome. Nature Reviews Genetics 7, 85-97.
 5. Database of Genomic Variants: http://projects.tcag.ca/variation/
 6. DECIPHER (Database of Chromosome Imbalances in Phenotypes Using Ensembl Resources):http://www.sanger.ac.uk/PostGenomics/decipher/
 7. Conrad,D.F. et al. 2009. Origins and functional impact of copy number variation in the human genome. Nature 464, 704-712.
 8. Park,H. et al.  2010. Discovery of common Asian copy number variants using integrated high-resolution arrayCGH and massively parallel DNA
     sequencing. NatureGenetics 42, 400-405.
 9. Glessner,J.T. et al. 2009. Autism genome-wide copy number variation reveals ubiquitin and neuronal genes. Nature 459, 569-573.

 

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP