본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

통계학적 모델을 통한 HIV 발생률 추정 방법 소개
  • 작성일2012-11-09
  • 최종수정일2012-11-09
  • 담당부서감염병감시과
  • 연락처043-719-7179




통계학적 모델을 통한 HIV 발생률 추정 방법 소개
Introduction of estimation methods for HIV incidence by using statistical models

질병관리본부 면역병리센터 에이즈종양바이러스과
김별님 기미경


I. 들어가는 말

우리나라에서 2011년 12월말까지 HIV(Human Immunodeficiency Virus, HIV) 누적감염인은 8,542명이고 2011년 한해에 888명의 감염인이 새로 발견되어 전년 대비 약 15% 증가하였다. 이와 같이 누적 감염인은 다른 나라에 비하여 아직은 낮은 수준이나 매년 발견되는 감염인수가 증가하고 있다.
이와 같이 매년 발견되는 감염인수 증가 원인이 HIV 검사자 수가 증가하여서 늘어난 것인지 실제 집단내의 HIV 감염인 비율이 많아진 것인지를 규명하기 위해 질병관리본부에서는 1년 단위로 HIV 유병률을 모니터링 하고 있다. HIV 유병률은 집단 내에 존재하는 HIV 감염인 수의 비율을 의미하는 것으로써 특정집단의 HIV 감염규모를 예측하는 지표로 활용되고 있다. 우리나라는 HIV 검사자료를 근거로 HIV 유병률을 산출하고 있는데 우리나라 전체 HIV 유병률은 약 0.01%로 발견된 HIV 감염인 수는 증가하는 반면 HIV 유병률의 변화는 거의 없었다. 이는 HIV 검사자 수가 증가하여 HIV 감염인 발견수가 증가하고 있음을 의미한다.
발견된 HIV 감염인의 대부분이 성접촉으로 감염되어 감염시기를 예측할 수 없으나 최근 선진국에서는 혈청학적 진단법의 새로운 기법을 응용하여 발견된 감염인에 대하여 최근 감염(recent HIV infection)과 만성감염을 구별하고 있다. 최근에 감염된 사람을 구별하는 것은 국가의 HIV 감염발생 양상을 파악할 수 있을 뿐 아니라 위험군에서의 HIV 감염양상의 변화와 HIV 감염예방 전략적인 측면에서 매우 중요하다. HIV 발생률은 집단 내에서 새로 감염된 사람(최근에 감염된 사람)의 수로서 단위 기간 동안 최근에 감염된 사람 수의 비율을 말한다. 예를 들어 1년 동안 10만 명당 최근에 감염된 사람 수의 비율을 말한다. HIV 발생률 추정은 2000년 이후 계속 증가하는 우리나라의 HIV 감염패턴을 자각할 수 있어 매우 유용하다. 현재 전 세계적으로 HIV 유병률 모니터링 연구로부터 HIV 발생률을 추정하는 연구로 전환되고 있는데, 이는 HIV 감염현황과 변화를 모니터링 할 수 있는 가장 적절한 지표이며, 국가가 HIV/AIDS 예방정책을 수립하고 그 수행결과를 평가하는데 즉각적이고 직접적인 지표로 활용될 수 있기 때문이다. 그러므로 새로운 정책수립을 위한 과학적인 근거자료로 활용할 수 있는 장점이 있다.
이 글은 외국에서 사용되고 있는 HIV 발생률을 추정하고 있는 방법 중에서 우리나라 HIV 발생률을 예측하는데 응용할 수 있는 몇 가지 방법을 소개하고자 한다.




II. 몸말

가. STARHS(Serological Testing Algorithms for Recent HIV Seroconversion) 결과를 이용한 추정방법
미국 질병관리본부(Centers for Disease Control and Prevention, CDC)는 1998년부터 HIV 항체양전자, 즉 최근에 감염된 HIV 감염인 현황을 파악하기 위하여 국가적인 차원에서 STARHS(serologic testing algorithm for recent HIV seroconversion) 프로젝트를 계획하여 실험실 기반의 통계 및 감시사업(statistical/surveillance work)을 병행하여 수행하고 있다. HIV 최근 감염을 진단할 수 있는 시험법으로써 detuned assay(2004년)와 BED assay(2005년)라는 상업용 키트를 개발하여 집단별 발생률을 산출하는데 사용하고 있다.
세계보건기구(World Health Organization, WHO)에서도 발생률 산출을 위해 HIV 최근 감염 시험법을 권고하여 각 지역 또는 각 국가의 발생률을 산출하도록 권고하고 있다. 최근 감염을 진단할 때, HIV 최근 감염 후 기준량의 항체형성기간을 결정하여야 한다. 항체형성기간이 개인 또는 인종에 따라 다르므로 최근 감염 기간인 기준 값()을 결정하는 것이 매우 중요하다. 1998년에 Janssen은 STARHS 결과로부터 발병률을 추정할 수 있는 간단한 계산식을 다음과 같이 제안하였다[1].


예로, 영국의 74,909명의 남성 동성애자들이 치료하는 병원에서 HIV 검사를 실시한 결과, 9,094명이 HIV 감염으로 확진되었고, 확진된 감염인 중에서 이전 HIV 검사에서 양성 판정을 받았던 사람과 에이즈(Acquired Immune Deficiency Syndrome, AIDS, 후천성면역결핍증) 증상이 있는 사람을 제외한 수는 2,983명이었다. 또한 2,983명에 대한 STARHS 결과, 최근 감염자 수가 631명이었다. 이 결과로 계산한 발생률은 2.039%로(음성자수: 65,815=74,909-9,094, 최근 감염자 수: 631, 최근 감염기간: 170일) 계산식은 다음과 같다.


나. 후향연산(Back-calculation) 방법

후향연산 방법은 잠복기가 긴 AIDS 발생 자료로부터 과거 감염을 추정하는 방법으로써 많은 선진국에서 발생률을 추정하는데 사용하여 왔다. 이 방법은 잠복기 분포의 정보와 AIDS 누적 환자수를 이용하여 발생률을 추정하는데 효과적이라고 알려져 있다[3].
시간 t에 대하여 기대 누적 AIDS 환자수를 라 하고, 잠복기 분포 라 했을 때, 시점의 발생률 를 추정하는 식은 다음과 같다.


대표적으로 사용되는 잠복기 분포는 감마 분포와 와이블 분포 등이 있다. 최근 항레트로바이러스 치료나 AIDS 환자에 대한 정보가 이전보다 더 많아져서 잠복기 분포의 모수를 변경한 확장 후향연산 방법이 개발되어 왔다. 미국 CDC[5]에서는 확장 후향연산 방법을 이용하여 1977-2006년까지 HIV 발생률을 추정하였다.
그림 1은 고위험 집단별로 1977-2006까지 발생률을 추정한 그래프이고 그림 2는 2006년의 발생률을 추정한 것으로 남성 동성애자(양성애자 포함) 집단이 다른 집단보다 발생률이 높음을 알 수 있다.
그림 3은 인종 간의 연도별 발생률을 추정한 것이고 그림 4는 그 중 2006년의 발생률을 추정한 것으로 흑인이 월등히 높음을 알 수 있다. 그림 5와 그림 6은 성별 발생률을 추정한 결과이다.


다. EPP(Estimation and Projection Package)

EPP는 국가나 지역의 감염병 발생 경향과 영향력 등을 측정하기 위해 UNAIDS(The Joint United Nations Programme on HIV/AIDS)가 개발한 소프트웨어이다. EPP는 HIV 발생률을 추정하는데 가장 많이 사용되고 있는 방법으로써 UNAIDS/WHO에서 전 세계 국가별 HIV 발생률을 추정하는데 이용되고 있다. 수집된 HIV 감염인 자료로부터 AIDS 발생 건수와 특정 모집단인 HIV 고위험군(IDU, sex worker, MSM 등)의 비율에 대한 정보를 이용하여 추정한다. EPP 내에서 추정과정은 다음 9개의 단계를 거쳐 계산된다: Workset, Define Epi, Define Pops, Enter data, Project, Calibrate, Results, Audit, Prefs.
다음은 추정하는데 필요한 핵심 단계에 대한 설명과 예로 인도 뭄바이 지역의 성매매 여성과 일반여성의 발생률을 추정하는 과정을 설명하고자 한다.
1) Workset은 EPP를 시작하는 화면으로, 파일 이름과 AIDS 발생률을 추정할 국가를 선택하고 국가 전체에 대한 발생률을 측정할 것인지 특정 집단(지역 포함)에 대한 발생률을 측정할 것인지 선택한다. 측정할 시작 년도와 마지막 년도를 입력한 뒤, 저장할 디렉토리를 지정한 저장 후 계속(Save and Continue) 버튼을 클릭하면 Define Epi, Define Pops, Enter data, Project, Calibrate, Results, Audit, Prefs 8개의 탭이 생성되면서 Define Epi 화면으로 진행된다.
인도 뭄바이 지역의 예로, 파일명(Workset Name)을 뭄바이 성매매 여성(Mumbai sex worker example 2007)로 설정하고 국가는 인도(India)를 선택한다. 국가 전체의 발생률이 아닌 성매매 여성과 일반 여성의 발생률을 추정하므로 Concentrated를 선택하면 오른쪽 National Epidemic Structure에 성매매 여성(Sex workers)과 일반 여성(General pop women)이 세부 집단으로 생성된다. 시작 연도를 1970년, 관측 마지막 연도를 2012년으로 설정하고 다음으로 진행한다(Figure 7).
2) Define Epi(Epidemiology)는 Workset 화면에서 구성한 HIV에 대한 세부 사항을 결정하는 화면으로, 세부 집단의 지역적 요소와 특징을 결정한다. 국가 전체에 대한 HIV 발생 사항만을 고려했다면 EPP에 내장된 기본적인 세부 집단 요소인 지역적 요소(도시/외곽)만 결정한 후 저장하고 다음으로 진행한다. 인도 뭄바이 예제에서는 결정된 세부 집단의 지역적 요소를 결정하는데 성매매 여성(sex workers)은 도시와 외곽 모두를 선택하고 성매매 여성은 세부 집단으로서 자동으로 FSW(Female Sex Worker)가 선택된다. 일반 여성에 대해서도 지역적 요소로 도시와 외곽 모두를 선택하고 집단의 특징은 Not special pop을 선택한 후 다음으로 진행한다(Figure 8).


3) Define Pops(Populations)에서는 세부 집단의 인구 모수를 입력한다. 15세 이상의 인구수, 여성의 비율, 15세 이상에서 출생률, 15세까지 생존율, 15세 이상의 사망률, 15세 이상의 인구 성장률 등을 입력한다. 뭄바이 지역의 15세 이상 여성 인구수는 6,000,000명인데 이 중 성매매 여성은 100,000이고 일반 여성은 나머지 5,900,000명이므로 이 자료를 입력한다(Figure 9).
4) Enter data는 HIV 조사 자료를 입력하는 화면으로 세부 집단에서 연도별로 수집된 모든 데이터를 백분율(%) 값으로 입력한다. 뭄바이 지역에서 성매매 여성의 수집된 자료는 1986년부터 2000년까지 있고 일반 여성의 자료는 1992년부터 2001년까지 있다. 1986년도 성매매 여성의 경우 3개 의료기관으로부터 수집된 자료를 입력하였고, 1990년의 경우 7개의 의료기관으로부터 수집된 자료를 입력하였다(Figure 10).

5) Project에서는 앞서 입력한 데이터를 나타내는 가장 적합한 곡선이 그려진다. Figure 11은 성매매 여성 데이터에 대한 적합 곡선이고 Figure 12는 일반 여성에 대한 곡선이다.

6) Results에서는 Project에서 찾은 세부 집단별 곡선으로 HIV 발생률 예측 결과를 보여준다. 가장 높은 발생률 곡선은 성매매 여성에 대한 그래프이고 가장 낮은 발생률은 일반 여성에 대한 그래프이다. 일반 여성보다 약간 더 높은 발생률 그래프가 뭄바이 지역의 결과이다(Figure 13). Output result 버튼을 클릭하면 연도별 HIV 발생률과 환자수의 수치적 결과를 테이블로 출력하여 나타낸다. 2012년 성매매 여성의 발생률은 64.08%, 일반 여성은 3.40%이고 전체 발생률은 4.37%이다(Figure 14).


7) Prefs는 결과에 사용된 정보를 수정할 수 있는 페이지로, 사용 언어도 영어, 불어, 스페인어, 중국어, 러시아어 중에서 선택할 수 있고 세부 집단의 지정된 샘플 값을 다시 정할 수 있다. Graph 버튼을 클릭하면 HIV의 생존율 그래프가 새로운 화면에 보여진다(Figure 15).


그래프에서 사용된 와이블 분포의 형태(shape) 모수()와 생존율(survival) 모수()의 값을 조정할 수 있다. 뭄바이 지역의 중간 생존기간(median survival rate)은 약 9년이고 모수값을 조정한 곡선에서는 12년이 된다(Figure 16).




III. 맺는말

HIV 발생률 예측에 선제되어야 할 것은 우리나라에 적용해야 할 최근 감염 기간을 정해야 하는 것이다. 우리나라 HIV 발생률을 산출하기 위하여 발견된 HIV 감염인이 최근 감염인지 만성 감염인지를 구분할 수 있는 최근 감염 시험법을 적용하는 연구를 현재 수행하고 있다. 일반적으로 최근 감염 기간을 120-240일의 범위를 적용하는데, 인종과 국가마다 달라 우리나라에 적합한 최근 감염 기간을 산출하기 위해 HIV 감염 시기를 알고 있는 검체를 최근 감염 시험법으로 실험하여, 그 결과 값들을 혼합효과 모형 (mixed effect model)과 비모수 생존분석(nonparametric survival analysis)으로 분석할 예정이다. 그 해에 발견된 감염인에 대하여 최근 감염 여부를 구분한 다음 STARHS 결과를 이용한 추정방법 공식에 따라 발생률을 계산하고 계산된 HIV 발생률은 WHO에서 개발한 EPP 방법으로 산출한 발생률과 비교하여 검증할 계획이다. 이와 같이 HIV 발생률 연구는 혈청진단, 통계, 바이러스, 면역 등 다양한 전문가가 협력하여 국가적인 차원에서 수행되어야 하고 그 가치는 이미 앞에서 언급한 바 있다. 또한, HIV 발생률 연구는 HIV 최근 감염 시험법에 대한 의과학 기술을 확보와 최적의 HIV 발생률을 산출하기 위한 실험설계와 적합한 통계방법 적용 등 진단, 보건, 역학, 통계분야의 융합에 의한 시너지 효과를 보여줄 것이다.




Ⅳ. 참고문헌

1. A. Charlett, G. Murphy, E. McKinney, A. Nardone, F. Barin, E. Op de Coul, H. C. Martin, M. T. Paixao, M. Diez, J. V. Parry, Estimating HIV Incidence: Employing Country-Specific STARHS Methods’ Findings to Estimate Local HIV Incidences, EuroHIV Work Package 7 Report3, p.16-24.
2. 왕진숙, 기미경, HIV 발생률 추정을 위한 진단법 개발 연구동향, Public Health Weekly Report, KCDC, 제 5권 제 7호 (2012).
3. Ron Brookmeyer, Mitchell H. Gail, AIDS Epidemiology: A Quantitative Approach, Oxford University Press, (1994).
4. 이주영, 황진수, 고운영, 기미경, 김지연, 후향연산(Back-calculation model)을 이용한 국내 HIV 감염자와 AIDS 환자의 추계, 예방의학지 제 35권 제1호 (2002).
5. CDC, Estimates of New HIV Infecttions in the United States, FACT SHEET, August 2008, Available online at http://www.cdc.gov/nchhstp/Newsroom/docs/Fact-Sheet-on-HIV-Estimates.pdf.
6. Using the Estimation and Projection Package (EPP) to make HIV/AIDS Estimates in Countries with Generalized or Concentrated Epidemics, A Guided Tour of the Estimation and Projection Package, WHO, (2005).
7. P. D. Ghys, T. Brown, N. C. Grassly G. Garnett, K. A. Stanecki, J. Stover, N. Walker, The UNAIDS Estimation and Projection Package: a software package to estimate and project national HIV epidemics, Published by group.bmj.com






본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP