본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

한국인유전체역학조사사업(KoGES) 코호트 역학데이터 품질관리지침 개발
  • 작성일2009-12-25
  • 최종수정일2012-08-25
  • 담당부서감염병감시과
  • 연락처043-719-7173

 

 한국인유전체역학조사사업(KoGES) 코호트 역학데이터 품질관리지침 개발

Development of the guideline for epidemiology data quality management in Korean genome and epidemiology study

     


질병관리본부 국립보건연구원 유전체센터 유전체역학과      

  질병관리본부 국립보건연구원 유전체센터에서는 한국인 주요 만성질환 관련 환경적, 유전적 위험요인 규명을 위하여 ‘한국인유전체역학조사사업(Korean Genome and Epidemiology Study; 이하 KoGES)’을 통해 대규모 인구집단으로부터 전향적 코호트를 구축해 오고 있다. 2001년 이후 안성 및 안산 지역사회 기반 코호트, 도시 및 농촌 지역의 건강검진센터 기반 대규모 코호트, 쌍둥이 가족 코호트, 국내 이주자 코호트 및 국제협력 코호트 등을 구축·운영해 오고 있으며, 2009년까지 18만 명의 기반조사와 약 3만 명의 추적조사를 완료하고, 향후 지속적으로 기반확장 및 추적조사를 수행할 예정이다.
  KoGES에서는 설문 및 검진조사를 통하여 인구학적 정보, 생활습관, 식습관, 질병력, 의료정보, 신체계측, 혈액검사, 소변검사 등의 광범위한 역학정보를 수집하고 있으며, 유전체역학 연구를 위하여 genomic DNA, 혈청, 혈장, 뇨 등의 생물자원을 수집하고 있다. 특히, KoGES 각 코호트로부터 수집하는 역학데이터는 필수 조사항목 및 코호트 고유 조사항목에 대한 500-2,500여개의 변수들로 구성되어 있다. 이러한 역학데이터를 활용하여 신뢰도 높은 연구결과를 도출하기 위해서는 코호트 연구계획 단계에서부터 역학조사 진행과 완료, 데이터 가공, 보관 및 활용 등 코호트 구축·운영의 전 과정에 걸쳐 표준화된 체계적인 역학데이터 품질관리 절차가 선행되어야만 한다.
  이에 유전체역학과에서는 KoGES에서 수집하는 코호트 역학데이터에 대한 전반적 품질관리 준수사항을 규정함으로써 역학데이터에 대한 표준화된 질 관리를 수행하고 양질의 역학데이터를 생산하기 위하여 KoGES 코호트 역학데이터 품질관리 지침을 발간하였다[1].
  일반적으로 ‘데이터 품질관리’란 기관이나 조직 내·외부의 정보시스템 및 DB 사용자의 기대를 만족시키기 위해 지속적으로 수행하는 데이터 관리 및 개선 활동을 의미하는 것으로서[2], 데이터 품질의   기준은 크게 유효성(validity)과 활용성(utilizability)으로 구분하고, 각 기준별 품질의 특성에 따라 유효성은 정확성(accuracy)과 일관성(consistency)으로 활용성은 유용성(usefulness), 접근성(accessibility), 적시성(timeliness) 및 보안성(security)으로 분류하여 총 6가지의 데이터 품질 기준을 정의할 수 있다[3](Figure 1).
                                       
  데이터 품질관리는 미시적 관점, 거시적 관점, 부가가치적 관점으로 구분하여 설명할 수 있다. 미시적 관점에서는 데이터 품질 관리의 각 요소를 확인하고 요소별 데이터 품질 향상 방안을 도출할 수 있으며, 거시적 관점에서는 전사 조직 측면에서 데이터 관리의 성숙도 단계를 정의하고 각 조직의 성숙도를   측정하여 상위 단계로 발전하도록 유도할 수 있다. 부가 가치적 관점에서는 데이터 품질관리의 비용·  효과·위험 모형을 개발하여 각 조직의 상황에 맞는 데이터 품질관리 방안을 제시할 수 있다[2].
  본 지침에서는 미시적 관점의 데이터 품질관리에 초점을 맞추어 코호트 역학조사 수행단계에 따라   고품질 역학 데이터를 확보하기 위해 관리되어야 할 품질관리의 대상을 도출하고 품질관리 실현을 위한 필수적인 준수사항을 제시하였다. 이를 간략히 소개하면 다음과 같다.   ■

 역학조사 계획 : 역학조사 목적에 따라 정해진 세부 조사항목들을 조사하기 위한 조사방법(설문조사, 검진조사 등)을 결정한 후, 설문조사를 위하여 구조적 설문문항을 개발하고 검진조사에서의 각   검진항목을 측정할 수 있는 기기, 시약, 측정기준 등 조사 프로토콜을 규정한다. 수집된 정보를  코드화하기 위한 코딩설계를 수행하고 데이터 코딩을 위한 소스문서인 코드북을 작성한다. 수집된 역학데이터를 컴퓨터로 접근 가능한 전산 데이터화하기 위하여 조사지와 코드북을 기반으로 데이터 입력 시스템(CAWI, CAPI, OMR 등)을 개발하여 신속한 데이터 입력 및 입력오류 제어가 가능하도록 하며, 아울러 역학조사 전 과정에서의 개인정보 등 정보보안을 위한 보안강화 시스템을  구축한다. 또한, 역학조사 및 데이터 관리 표준화를 위하여 조사원, 데이터 입력요원, 데이터 관리 담당자에 대한 표준화 교육을 실시한다.

 역학조사 진행 : 조사 기본 프로토콜을 준수하고 조사과정에서의 오류가 발생하지 않도록 감독하며 일차적인 조사결과 검토 후 오류를 수정하고 필요시 재조사를 수행한다. 개발된 데이터 입력시스템을 통하여 조사결과를 입력하고 2차 확인입력 과정 등을 통해 입력의 정확도를 확보하며 데이터 접근권한 최소화 등 보안관리 활동을 수행한다. 또한 입력되는 데이터에 대한 모니터링을 통하여 진도관리, 입력오류 및 이상치 확인, 오류수정 등 역학데이터 수집과 동시에 데이터 정도관리를  수행한다.

 역학조사 완료 : 계획된 역학조사 및 데이터 입력이 완결된 최초의 전산 데이터가 생성된다. 본  단계에서는 조사결과지와 전산 데이터 대조, 결측률, 이상치, 논리오류 및 데이터 중복 검토 등  수집 완료된 역학데이터에 대한 총괄적인 품질검수를 수행한다. 이어서 검출된 오류 중 수정 가능한 오류들을 수정하여 정제 데이터를 생성하고 관련 코드북을 준비하며, 정제 데이터를 기준으로   역학연구 활용을 위한 데이터 적합도를 평가한다.
 

 역학데이터 가공 : 역학데이터 가공은 기존 변수를 활용한 추가변수의 생성, 2개 이상의 코호트  데이터 통합, 2차 자료(사망정보, 질병정보 등) 연계 등 다양한 방법을 통하여 이루어질 수 있으며 결과적으로 역학데이터를 활용한 연구의 파워를 향상시킬 수 있다. 코호트 데이터 통합을 위해서는 데이터 표준화와 맵핑 등 상당히 정교하고 전문적인 데이터통합 기술을 필요로 하며, 2차 자료  연계는 국가차원의 정보공유 정책을 준수하여야 한다.


 역학데이터 보관 : 최초의 역학 데이터, 정제 데이터, 가공 데이터 등 역학조사 결과 생성된 모든 전산데이터를 데이터베이스나 파일의 형식으로 하드디스크 등의 일정공간에 총괄 보관하며, 조사가 완료된 조사결과지는 장기보관 및 이용 편의를 위하여 CD-ROM, 마이크로 필름 등의 형식으로  보관한다. 데이터베이스 시스템을 안정적으로 유지하기 위하여 데이터베이스 모델에 적합한 DB구성, 백업, 보안, 복구, 성능 등을 주기적으로 관리하며, 자료갱신대장을 작성하여 데이터 로딩,   정제 및 가공을 통한 데이터 갱신내역을 관리한다. 


 
 역학데이터 활용 : 체계적인 품질관리 절차를 통하여 수집, 관리된 역학데이터는 연구자들에게 제공되어 연구 성과를 창출할 수 있도록 데이터 공유를 위한 절차와 규정이 마련되어야 한다. 이를 위하여 우선적으로 데이터 활용 지침서를 제공하여 연구자들이 데이터에 대한 충분한 이해를 바탕으로 연구의 타당도를 높일 수 있도록 한다. ‘정보활용위원회’ 등을 구성함으로써 데이터 요청-제공-활용을 심의하며, 제공된 역학데이터를 활용한 연구결과에 대한 피드백 절차를 갖추어 역학 데이터 활용도 및 연구 성과를 파악할 수 있도록 한다.
 
                                        
  본 지침은 코호트 역학조사 수행단계에 따른 역학데이터 품질관리를 위한 필수 준수사항을 규정함으로써 KoGES 뿐 아니라 국내 다른 코호트 연구의 역학데이터 품질관리 수행을 위한 기본 지침으로   활용할 수 있을 것이다. 다만, 지침에 근거하여 표준화된 역학데이터 품질관리를 충실히 실행하기 위해서는 각 조직의 코호트 운영체계를 고려한 역학데이터 품질관리 세부 업무별 실행 매뉴얼이 함께 구비되어야 한다.
  유전체역학과에서는 향후 지속적으로 지침을 보완하고 데이터 품질관리의 성숙수준을 향상시키기 위한 노력을 경주할 것이다. 이러한 체계적인 역학데이터 품질개선 활동은 보다 양질의 데이터 생산 및 연구 활성화에 기여할 수 있을 것으로 기대한다.

  참고문헌

 1. 질병관리본부 유전체센터 유전체역학과. 2009. 12. KoGES 코호트 역학데이터 품질관리 지침.
 2. 한국데이터베이스진흥센터. 2006. 9. 데이터 품질관리 지침 (ver. 2.1)
 3. 한국데이터베이스진흥센터, 2006. 9. 데이터품질관리 성숙모형 (ver. 1.0)

 
 

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP