Risk assessment for hypertension and hypertension complications incidences using a Bayesian network


이정혜, Wonji Lee, Il-su Park, Hun-Sung Kim, Hyeseon Lee, Chi-Hyuck Jun (2016)

한국 국민건강보험 표본 코호트 (>10,000 명, 2002-2010) 의 고혈압 + 합병증 발생bayesian-network (BN) 으로 모델링. (i) cox-regression 으로 유의 변수 선택 → (ii) under-sampling → (iii) BN topology 구성 → (iv) 관심 노드 (target = 고혈압/합병증) 의 조건부 확률 추론. 그래프 기반 질적 + 양적 동시 분석 가능. 베이지안 네트워크의 국가 보건 데이터 적용성 입증.

  • RQ: 한국 국민건강보험 데이터의 고혈압 + 합병증 위험을 bayesian-network 으로 시각화·추론 가능한가? BN 이 단순 분류기 (Prediction of Hypertension Complications Risk Using Classification Techniques) 대비 어떤 추가 가치를 주는가?
  • 방법론: cox-regression 변수 선택 + under-sampling + bayesian-network structure learning + 조건부 확률 추론
  • 데이터: 한국 NHIC 표본 코호트 2002-2010, >10,000 명 (인구통계, 건강검진 기록, 의료비, 치료 정보)
  • 주요 발견: (1) BN 이 변수 간 인과 그래프 + 조건부 확률 동시 산출 — 시각적 해석 + 정량 추론. (2) Cox regression 으로 유의 변수 선택 후 BN 적용. (3) 다양한 query (예: “흡연자가 비만일 때 고혈압 발생 확률?”) 에 즉시 답변 가능. (4) 새로운 의학적 발견은 없으나 방법론 적용성 입증.
  • 시사점: 베이지안 네트워크가 국가 보건 데이터위험 평가 + 정책 query 도구로 활용 가능. 향후 2011-2013 데이터 + 더 긴 follow-up 으로 검증 + 2010 이후 고혈압 관리 가이드라인 변경 반영 필요.

국민건강보험 코호트의 고혈압·합병증 위험을 베이지안 네트워크로 모델링한 절차.

요약

이 paper 는 이정혜1 기 박사 시기의료 AI 라인 의 발전 — Prediction of Hypertension Complications Risk Using Classification Techniques (분류기 비교) 후속으로 그래프 모델 도입. bayesian-network 으로 변수 간 인과 구조조건부 확률 동시 처리.

방법론적 핵심: 3 단계 protocol. (i) cox-regression 으로 시간-종속 변수 (lifetime hypertension/complication risk) 의 유의 predictor 선택. (ii) class imbalance 처리를 위한 under-sampling (희귀 사건 = 합병증 발생). (iii) BN topology learning (e.g. Hill-Climbing + BIC score) 으로 변수 간 causal graph 학습 → conditional probability inference.

핵심 발견: BN 이 단순 분류기보다 추론 query 의 유연성 우월. “고혈압 환자 중 비만 + 흡연자의 합병증 확률?” 같은 conditional query 가 즉시 가능. 시각화 (DAG) + 정량 (CPT) 동시 가 임상 의사결정 지원에 적합. 다만 완전히 새로운 의학적 발견 은 없음 — 방법론 적용성 입증.

이정혜연구 궤적 안에서 이 paper 는 1 기의 의료 AI 라인, 후속 junghye-lee-2018-data-driven-hypertension (data-driven 건강증진 프로그램) + Privacy-Preserving Patient Similarity Learning in a Federated Environment: Development and Analysis (UCSD 포닥 후 federated patient similarity) 로 발전. 베이지안 네트워크 + 의료 데이터 의 결합은 이정혜전 시기 의료 AI 라인 의 일관된 도구.

핵심 결과

단계출력
Cox regression유의 predictor 선택
Under-samplingclass imbalance 처리
BN topology learningcausal DAG
BN inference조건부 확률 (다양한 query)
  • N > 10,000 (NHIC 표본 코호트, 2002-2010)
  • 시각화 (DAG) + 정량 (CPT) 동시
  • 새로운 의학적 발견 없음, 방법론 적용성 입증

방법론 노트

bayesian-network 의 joint distribution:

P(X1,,Xn)=i=1nP(XiParents(Xi))P(X_1, \ldots, X_n) = \prod_{i=1}^n P(X_i | \text{Parents}(X_i))

Structure learning: Hill-Climbing + BIC score (Heckerman et al. 1995). Parameter learning: MLE 또는 Bayesian (Dirichlet prior).

cox-regression (Cox 1972) for variable pre-screening:

h(tX)=h0(t)exp(βX)h(t|X) = h_0(t) \exp(\beta' X)

식별 가정: (i) BN 의 Faithfulness, (ii) Cox 비례위험, (iii) under-sampling 의 대표성 보존.

연구 계보

이 paper 는 (i) Pearl (1988) BN 본가, (ii) Cox (1972) 비례위험, (iii) Prediction of Hypertension Complications Risk Using Classification Techniques 직접 선행, (iv) Aliferis et al. (2010) 의 medical BN 응용 라인 — 의 결합. 이정혜연구 궤적 1 기 의료 AI 라인.

See also

인접 그래프

1-hop 이웃 10
  • 인물 6
  • 논문 4
이정혜Chi-Hyuck JunHun-Sung KimHyeseon LeeIl-su ParkWonji Lee Risk assessment for h…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동