본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

건강보험청구자료의 코호트 조사 활용 가능성 연구
  • 작성일2013-11-15
  • 최종수정일2013-11-15
  • 담당부서감염병감시과
  • 연락처043-719-7166
건강보험청구자료의 코호트 조사 활용 가능성 연구
Applicability of health insurance claim data to cohort study

질병관리본부 유전체센터 유전체역학과
박재경, 허진희

Ⅰ. 들어가는 말

  한국인유전체역학조사사업(Korean Genome and Epidemiology Study)은 한국인 일반인구 집단을 대상으로 코호트를 구축하고, 장기간 추적조사를 통하여 고혈압, 당뇨병 등 주요 질환 발생에 영향을 미치는 유전 및 환경 요인을 규명하기 위해 질병관리본부 유전체역학과에서 2001년부터 수행하고 있는 사업이다. 안산, 안성 지역사회 기반 코호트를 시작으로 도시, 농촌, 쌍둥이, 국제협력, 국내이주자 코호트 등 7개 코호트에 약 24만 명 이상의 기반이 구축되었으며 현재 코호트 별로 2-4년 주기의 능동 반복 추적 조사가 수행되고 있다. 기반 조사에 참여했던 참여자를 대상으로 일정주기별로 반복조사를 수행하면 다양한 설문 및 검진, 임상검사를 통해 최종 질병 발생 전 중간 상태의 건강상태, 생활습관, 임상검사수치 등 다양한 정보를 수집할 수 있다. 반면 조사 시 많은 노력과 비용이 소요되며 일반적으로 기반조사 참여자의 20-30%이상은 반복추적조사에 참여하지 않아 관련 정보를 파악할 수 없게 되는 추적실패가 나타날 수 있다. 이러한 반복추적조사의 한계점을 보완할 수 있는 방법 중 하나가 국가ㆍ공공기관이 보유하고 있는 자료를 이용하는 것이다. 국가ㆍ공공기관 보유 데이터 중 국립암센터 암 등록자료, 통계청 사망원인 자료와 달리 건강보험심사평가원 등의 건강보험 청구 자료는 자료수집 목적이 정확한 상병통계산출이나 질병발생여부를 판단하기 위한 것이 아니기 때문에 청구된 상병기호의 정확성 등에 문제가 있을 수 있고 활용 시 자료정리 및 분석에 어려운 점이 있이 있다.
따라서 향후 본격적으로 코호트자료와 연계하여 활용하기에 앞서 실제 자료 분석을 통해 코호트 추적조사 및 질병발생 연구에 건강보험 청구 자료를 활용하기 위한 통계, 역학적 방법의 개발과 검증이 필요하며, 이 연구를 통해 코호트 연구에 건강보험 청구 자료를 활용할 수 있는 가능성 및 구체적 방안 등을 모색해 보고자 하였다.

Ⅱ. 몸 말

  연구는 크게 2단계로 수행하였다. 1단계에서는 도시 코호트 참여자를 중심으로 기반조사 설문내용과 건강보험 청구 내용간의 일치도를 조사하여 코호트 추적 조사에 활용할 수 있는 질병들을 선정하고 각각의 질병발생 확인기준을 정하였으며, 2단계에서는 1단계 결과를 바탕으로 안성, 안산 지역사회코호트 추적 자료를 이용하여 추적조사에서 새롭게 질병이 발생하는 참여자의 건강보험 청구형태 등을 분석하였다.
분석방법은 한국인유전체역학조사사업 수집자료 중 1단계에서는 2007-10년 도시 코호트 기반조사 자료를 2단계에서는 안성안산지역사회 코호트 3차 추적(2007-8), 4차 추적(2009-10) 조사 자료를 2006-10년에 청구되었던 건강보험자료와 연계, 활용하였다. 분석 단계별 자료 연계와 분석 과정을 도식화하면 Figure 1, 2와 같다.

  1단계 기반 조사 자료를 이용한 분석에서는 코호트 주요 연구대상 만성 질환 중 당뇨병, 고혈압, 고지혈증, 뇌졸중, 골다공증, 통풍, 녹내장 등 질병 발생 후 반복적 의료이용이 이루어지며 해당 상병코드와 약품코드가 비교적 명확한 질병을 분석대상으로 하였다. 2단계 추적 조사 자료를 이용한 일치도 분석에서는 1단계 분석을 통해 비교적 일치도가 높게 나타난 당뇨병, 고혈압을 분석대상 질병으로 하였다. 건강보험 청구코드 분석 시 상병코드는 한국표준질병사인분류(6차, Korean Classification of Diseases: KCD)를[1] 이용하였으며 주로 소분류(level 3) 수준에서 분석하였다(Table 1). 

  약품코드 분석에는 세계보건기구(WHO) 산하 의약품 통계 방법을 위한 협력센터 WHOCC(WHO Collaborating Centre for Drug Statistics Methodology)에서 관리되는 ATC(Anatomical Therapeutic Chemical Classification System) 체계를[2] 활용하였으며 주로 2단계, 3단계 수준에서 분석하였다(Table 2).

  건강보험심사평가원에서 ATC체계를 3단계 기준으로 90% 이상 적용한 것은 2010년부터이기 때문에 약품코드에 의한 분석은 2010년 자료에 한정하여 수행하였다[3]. 건강보험 청구자료 분석에 사용한 질병별 질병발생확인 기준(상병코드 및 약품코드)은 유전체역학과에서 참고문헌 등을 참조로 1차 정리 후 임상 교수의 검토를 거쳐 수정한 것을 최종적으로 사용하였다(Table 3).

  1단계 코호트 기반조사 자료와 건강보험 청구자료 연계분석 시는 가장 포괄적인 조사 질문인 과거력(‘귀하는 과거에 병·의원에서 의사로부터 다음과 같은 질병을 진단 받은 적이 있습니까?’)에 대해 우선 분석하고, 주요 질병에 대해서는 현재 치료여부 등에 대해 추가 분석을 실시하였다. 2단계 추적조사 자료 연계 분석에서는 이전 추적조사 이후 질병발생여부(‘귀하는 지난 2년간 병·의원에서 의사로 부터 아래의 질병으로 진단 받은 적이 있습니까?’)에 대해 분석한 후 현재 치료여부와 약물 복용력을 연계 분석하였다. 일치도 분석 시는 설문조사결과(과거력 등)와 해당 질병 건강보험 청구유무를 기준으로 4가지 그룹으로 나눈 후 일치도를 계산하였다(Table 4). 건강보험 청구유무는 1회, 2회, 3회 이상 청구기준으로 각각 분석하였으며 상병코드는 2개(주상병, 부상병) 기준과 5개 기준으로 분석하였다. 코호트 조사 자료, 건강보험 청구자료 모두 질병발생의 gold standard로는 활용할 수 없기 때문에 상호 일치도 분석을 통해 질병별 자료 활용 가능성을 간접적으로 평가해 보고자하였으며 사용한 지표(kappa index, index1, index2)는 Table 4와 같다.

  기반조사 자료 대상 분석결과 도시 코호트 기반조사 과거력 설문 응답 내용과 건강보험 청구 자료와의 일치도 분석결과(2010년 자료 기준)를 요약하면 Table 5와 같다.

  두 기준 간 일치도를 나타내는 kappa index가 0.70이상인 질병은 상병코드 이용 시와 약품코드 이용 시 모두 고혈압, 당뇨병 2가지 밖에 없었다. Kappa index 0.4와 0.7사이인 질병은 상병코드 이용 시 고지혈증, 뇌졸중, 협심증 또는 심근경색, 골다공증, 통풍, 전립선비대가 있었고 약품코드 이용 시는 녹내장, 전립선비대 등이 있었다. 관절염, 천식, 우울증, 위궤양, 십이지궤양 등은 상병코드, 약품코드 이용 시 모두 kappa index가 0.3 미만이었다.

  건강보험 청구에 의한 질병이환 여부를 청구횟수 1회 기준 시와 3회 이상 시를 비교해 보면 큰 차이가 없거나 일부 질병은 kappa index가 조금 높아졌으며 분석 시 청구 상병코드를 2개만을 사용했을 때 보다는 5개를 사용할 때 kappa index가 전반적으로 높게 나타났다.
지표1(index1)에 의해 코호트 설문조사에서 과거 당뇨병을 진단받았다고 한 사람 중 90%이상에서 설문조사일 이전 3회 이상의 당뇨병 상병코드 청구사실이 확인되었고 고혈압의 경우 약 93%이상에서 확인되었다. 이를 통해 고혈압, 당뇨병의 경우 설문조사에서 해당 질병으로 진단받은 적이 있다고 응답한 경우 90%이상이 병·의원에서 의료이용을 하였던 것을 확인할 수 있었다. 한편 지표2(index2)에 의한 약품코드 분석 시 당뇨 관련 약품코드 청구가 3회 이상 있었던 사람 중 약 93%는 코호트 설문에서 당뇨 진단을 받은 적이 있다고 응답하였고 고혈압의 약품코드 청구가 3회 이상 있었던 사람 중 약 78%는 고혈압 진단을 받은 적이 있다고 응답한 것을 확인할 수 있었다. 당뇨병, 녹내장, 전립선비대 등 질환 특이적 약물이 사용될 경우 상병코드 사용 시보다 약품코드를 사용할 때 지표2가 높게 나타났다.
과거력 설문 대신 현재치료여부 응답(치료경과 = ‘현재치료 중‘)을 이용한 일치도 분석 시 과거력 설문을 이용하였을 때 보다 일치도는 전반적으로 증가하였으나 큰 차이를 나타내진 않았다.

  질병발생 확인기준 설정에 활용하고자 해당 상병코드(KCD)별 다빈도로 처방되는 약품코드(ATC)를 추가 분석한 결과 대부분 상병코드에서 J01(항세균제제, Antibacterials for systemic use), A02(위산분비 조절 제제, Drugs for acid related disorders)가 가장 많이 처방되는 것을 확인 할 수 있었다. 이를 통해 J01과, A02가 주 치료약물인 감염병, 위궤양, 십이지궤양 등에 있어서는 약품코드(ATC)가 질병발생 확인에 결정적인 판별 기준이 되기 어렵다는 것을 간접적으로 알 수 있었다. 본태성고혈압(I10)의 경우 C09(Agent acting on the renin-angiotensin system), C07(Beta blocking agents), C08(Calcium channel blockers)이 당뇨병(E11-E14)의 경우 A10(Drugs used in diabetes), 천식(E78)의 경우는 R03(Drugs for obstructive airway diseases)의 약품코드(ATC)가 주로 처방된 것이 확인되어 분석에 사용한 약품코드 기준이 비교적 적합하였음을 확인할 수 있었다. 그러나 해당 상병코드와 약품코드에 대한 교차 테이블을 작성해 보면 서로 일치하지 않는 부분이 많이 발견 되었는데 고혈압, 고지혈증 약 등은 고혈압 또는 고지혈증 환자가 아니더라도 관련 증상완화 또는 예방목적으로 활용될 수 있고 여러 가지 질병을 함께 치료받은 경우도 다수 있는 등 단순히 1-2종의 약물 투여 여부만을 갖고 질병발생을 특이적으로 판정하기는 어렵다는 것을 또한 확인할 수 있었다. 이 연구에서는 ATC 분류체계가 90% 이상 적용된 2010년도 자료만을 활용해야하는 제한점이 있었으므로 향후 2011-2013 자료를 추가 연계해 분석하면 약품기호 활용에 대한 보다 구체적 결과를 얻을 수 있을 것으로 사료된다.

  안성, 안산 추적조사자료 대상 분석결과 안성안산 코호트 3차 추적(2007-8년), 4차 추적(2009-10년) 조사에 모두 참여한 사람 중 기반(2001-2년) 조사에서 3차 추적 조사까지 당뇨병으로 진단받은 적이 없던 참여자중 4차 추적 조사에서 처음 당뇨병으로 병의원에서 진단받았다고 설문응답한 사람은 101명(1.8%)이었다. 같은 대상자에 대해 청구된 상병코드를 분석한 결과 E11을 기준으로 3차 추적 조사 이후 처음 1회 이상 청구된 사람은 178명(3.2%), 3회 이상 청구된 사람은 130명(2.3%)이었으며 E11-E14를 기준으로 분석 시는 1회 이상 청구된 사람은 202명(3.6%), 3회 이상 청구된 사람은 147명(2.6%)이었다. 참여자별로 3차 추적 조사일 기준 이후 6개월 간격으로 분석해보면 신규 발생 건이 건강보험 청구자료 기준으로 6개월 마다 0.4-0.6%정도 높게 나타나는 것을 확인 할 수 있었다(Table 6).

  고혈압의 경우 기반 조사에서 3차 추적 조사까지 고혈압으로 진단받은 적이 없던 참여자 중 4차 추적 조사에서 처음 고혈압을 병의원에서 진단받았다고 설문응답한 사람은 266명(5.7%)이었다. 같은 대상자에 대해 청구된 상병코드를 분석한 결과 I10을 기준으로 3차 추적 조사 이후 처음 1회 이상 청구된 사람은 473명(10.1%), 3회 이상 청구된 사람은 384명(8.2%)이었으며 I10-I15를 기준으로 분석 시는 1회 이상 청구된 사람은 525명(11.2%), 3회 이상 청구된 사람은 440명(9.4%)이었다. 참여자별로 3차 추적 조사일 기준 이후 6개월 간격으로 분석해보면 신규 발생 건이 건강보험 청구자료 기준으로 6개월 마다 1.4-1.8% 정도 높게 나타나는 것을 확인 할 수 있었다(Table 7).

  코호트 추적조사설문에서 당뇨병이나 고혈압으로 새롭게 진단받았다고 한 대상자 보다는 건강보험 청구 기준으로 처음 해당질병으로 의료이용을 한 대상자 비율이 모두 높게 나타났으며 당뇨병 보다는 고혈압에 있어서 그 차이가 크게 나타났다.
설문조사 응답내용과 건강보험 청구건 간의 일치정도(지표1)를 살펴보면 4차 추적 설문조사에서 처음 당뇨병을 진단받았다고 응답한 참여자중 58%에서 3회 이상의 E11-E14 해당 건강보험 기록 청구를 확인 할 수 있었고 처음 고혈압을 진단받은 경우는 65%에서 3회 이상의 I10-I15 해당 건강보험기록 청구를 확인 할 수 있었다(Table 6, 7). 당뇨병, 고혈압을 처음 진단 받은 후 ‘현재 치료 중’이라고 하부 설문에 응답한 대상자만을 대상으로 추가 분석해보면 일치정도(지표1)는 높아져 E11-E14 해당 건강보험 청구는 72%, I10-I15 해당 건강보험 청구는 69%를 나타냈다. 또한 3개월 이상 당뇨병, 고혈압 관련 약물 지속 복용여부(당뇨병 - ‘인슐린’ or '경구용 당뇨약', 고혈압 - '혈압약')를 조사하는 설문응답 결과와 건강보험 청구 자료를 연계 분석해 보면 당뇨병 관련 약을 복용한다고 응답한 참여자중 약 73%의 경우 3회 이상의 E11-E14 해당 건강보험기록 청구를 확인 할 수 있었고 고혈압 관련 약을 복용한다고 응답한 참여자 약69%에서 I10-I15 해당 건강보험기록 청구를 확인 할 수 있었다. 당뇨병의 경우 과거력 설문을 이용한 분석결과와 현재 치료 여부 설문을 이용한 결과 및 약물 복용력 이용 분석결과간의 일치정도(지표1) 차이가 10%이상 나타났는데 이는 병의원에서 당뇨병을 진단 받은 것과 실제 병의원에서 치료 받은 것과는 차이가 있음을 나타내는 것으로 향후 건강보험 청구 자료를 이용한 질병발생 확인 시 질병 발생의 정의를 어떻게 할 것인가에 따라 해당 산출치가 달라 질 수 있음을 보여준다.

  지표2를 통해 일치도를 살펴보면, 3회 이상의 E11-E14 건강보험기록 청구가 3차 추적 조사 이후 처음 확인된 참여자중 27%에서 코호트 설문조사 시 새롭게 과거력(당뇨병)이 있다고 응답한 것이 확인 되었으며 3회 이상의 I10-I15 건강보험기록 청구가 3차 추적 조사 이후 처음 확인된 참여자중 32%에서 코호트 설문조사 시 새롭게 과거력(고혈압)이 있다고 응답한 것을 확인 할 수 있었다(Table 6, 7). 약물복용여부를 이용해 분석하면 일치도는 높아져 3회 이상의 E11-E14 해당 건강보험기록 청구가 3차 추적 조사 이후 처음 확인된 참여자중 65%가 코호트 설문조사 시 당뇨병관련 약을 복용하였다고 응답하였으며 3회 이상의 I10-I15 해당 건강보험기록 청구가 3차 추적 조사 이후 처음 확인된 참여자중 81%가 코호트 설문조사 시 고혈압 관련 약을 복용하였다고 응답하였다.

  한편 4차 추적 코호트 설문 내용 중 당뇨병을 진단받은 시기(‘당뇨병을 언제 진단받으셨습니까?/ 년, 월)를 이용하여 병의원에서 당뇨 진단 후 해당 건강보험 청구 자료가 언제 부터 이루어지는가를 간접적으로 분석해 본 결과 E11-E14 기준으로 1회 이상 확인 되는 것은 약 3-4개월 후이며 3회 이상 청구가 확인되는 것은 4.5-5개월 후인 것으로 나타났다.
이상에서 건강보험 청구 자료를 코호트 참여자의 당뇨병, 고혈압 등의 질병발생 확인 추적에 활용하면 반복 추적조사 수행 주기보다 짧은 주기로 상세한 질병 발생 추이를 관찰할 수 있고 반복 추적조사 비참가자의 질병발생여부도 간접적으로 알 수 있는 등 유용성이 있으나 질병별 의료이용 비율, 약물치료 등 치료방법, 건강보험 청구 시 기록 상병코드의 정확도, 자료연계 분석시점 등에 따라 그 결과가 달라 질 수 있는 한계점이 있는 것을 확인 할 수 있었다.

Ⅲ. 맺는 말

  코호트 참여자의 질병별 설문응답 내용과 해당 건강보험 청구내용 간의 일치정도, 특징 등을 확인하고 관련 통계적 분석 방법, 기준 등을 개발, 적용해 보았다.
이 연구에는 몇 가지 제한점이 있는데 우선 질병발생의 gold standard가 없어 실제 건강보험 청구 자료의 추적조사 도구로써의 정확도, 민감도, 양성예측도, 음성예측도 등을 평가해 볼 수는 없었던 점이다. 질병발생에 대한 gold standard 마련을 위해서는 향후 질병관리본부, 코호트 연구진, 외부 전문가 협력의 추가 연구 및 지속적 논의가 필요할 것이다. 또한 분석 당시 활용할 수 있는 건강보험 청구 자료에는 기간적 제한성(상병코드: 2006-10년, 약품코드 ATC: 2010년)이 있었는데 건강보험심사평가원 등의 자료 활용 확대 정책, 약품기호 ATC의 적용 확대 등에 따라 향후 개선될 전망이다. 자료연계 분석결과 kappa index 및 일치정도 지표를 고려 할 때 건강보험 청구 자료를 이용하여 코호트 참여자에 있어 전반적 질병발생ㆍ이환 추세를 파악할 수 있는 질병은 고혈압, 당뇨병으로 나타났다. 하지만 분석결과에서 볼 수 있듯 실제 당뇨병, 고혈압으로 진단을 받았다 하더라도 의료이용을 하지 않거나 의료 이용 시 상병코드 등의 청구오류가 있을 수 있기 때문에 건강보험 청구 자료만으로는 해당 질병의 발생을 모두 발견(detect), 확인(confirm)하기 어렵고 또한 분석 시점에 따라 결과의 차이가 발생할 수 있다.
따라서 코호트 추적조사에 있어 건강보험 청구 자료는 단독으로 활용되기 보다는 설문, 검진자료 등과 함께 질병발생 판단을 위한 보완, 참고자료로 활용하는 것이 타당하다고 사료된다. 건강보험 청구 자료는 질병발생 확인 외에도 설문조사에 의해서는 정확한 자료 수집이 어려운 약물력, 수술력, 입원력 등의 자료를 수집, 보완하는데 활용될 수 있으며 특정청구기호 등에 활용을 통하면 희귀질환 연구도 가능하므로 연구목적에 따라 활용가치는 향후 높아질 수 있을 것이다.

Ⅳ. 참고문헌

1. 한국표준질병사인분류(6차),
www.kostat.go.kr/kssc (통계청홈페이지, 한국표준질병사인분류).
2. WHO Collaborating Centre for Drug Statistics Methodology, Guidelines for ATC classification and DDD assignment 2012. Oslo, 2011.
3. www.kpis.or.kr (의약품관리종합정보센터 홈페이지, 보도자료).







본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP