Risk assessment for hypertension and hypertension complications incidences using a Bayesian network
이정혜, Wonji Lee, Il-su Park, Hun-Sung Kim, Hyeseon Lee, Chi-Hyuck Jun (2016)
한국 국민건강보험 표본 코호트 (>10,000 명, 2002-2010) 의 고혈압 + 합병증 발생 을 bayesian-network (BN) 으로 모델링. (i) cox-regression 으로 유의 변수 선택 → (ii) under-sampling → (iii) BN topology 구성 → (iv) 관심 노드 (target = 고혈압/합병증) 의 조건부 확률 추론. 그래프 기반 질적 + 양적 동시 분석 가능. 베이지안 네트워크의 국가 보건 데이터 적용성 입증.
- RQ: 한국 국민건강보험 데이터의 고혈압 + 합병증 위험을 bayesian-network 으로 시각화·추론 가능한가? BN 이 단순 분류기 (Prediction of Hypertension Complications Risk Using Classification Techniques) 대비 어떤 추가 가치를 주는가?
- 방법론: cox-regression 변수 선택 + under-sampling + bayesian-network structure learning + 조건부 확률 추론
- 데이터: 한국 NHIC 표본 코호트 2002-2010, >10,000 명 (인구통계, 건강검진 기록, 의료비, 치료 정보)
- 주요 발견: (1) BN 이 변수 간 인과 그래프 + 조건부 확률 동시 산출 — 시각적 해석 + 정량 추론. (2) Cox regression 으로 유의 변수 선택 후 BN 적용. (3) 다양한 query (예: “흡연자가 비만일 때 고혈압 발생 확률?”) 에 즉시 답변 가능. (4) 새로운 의학적 발견은 없으나 방법론 적용성 입증.
- 시사점: 베이지안 네트워크가 국가 보건 데이터 의 위험 평가 + 정책 query 도구로 활용 가능. 향후 2011-2013 데이터 + 더 긴 follow-up 으로 검증 + 2010 이후 고혈압 관리 가이드라인 변경 반영 필요.

요약
이 paper 는 이정혜 의 1 기 박사 시기 의 의료 AI 라인 의 발전 — Prediction of Hypertension Complications Risk Using Classification Techniques (분류기 비교) 후속으로 그래프 모델 도입. bayesian-network 으로 변수 간 인과 구조 와 조건부 확률 동시 처리.
방법론적 핵심: 3 단계 protocol. (i) cox-regression 으로 시간-종속 변수 (lifetime hypertension/complication risk) 의 유의 predictor 선택. (ii) class imbalance 처리를 위한 under-sampling (희귀 사건 = 합병증 발생). (iii) BN topology learning (e.g. Hill-Climbing + BIC score) 으로 변수 간 causal graph 학습 → conditional probability inference.
핵심 발견: BN 이 단순 분류기보다 추론 query 의 유연성 우월. “고혈압 환자 중 비만 + 흡연자의 합병증 확률?” 같은 conditional query 가 즉시 가능. 시각화 (DAG) + 정량 (CPT) 동시 가 임상 의사결정 지원에 적합. 다만 완전히 새로운 의학적 발견 은 없음 — 방법론 적용성 입증.
이정혜 의 연구 궤적 안에서 이 paper 는 1 기의 의료 AI 라인, 후속 junghye-lee-2018-data-driven-hypertension (data-driven 건강증진 프로그램) + Privacy-Preserving Patient Similarity Learning in a Federated Environment: Development and Analysis (UCSD 포닥 후 federated patient similarity) 로 발전. 베이지안 네트워크 + 의료 데이터 의 결합은 이정혜 의 전 시기 의료 AI 라인 의 일관된 도구.
핵심 결과
| 단계 | 출력 |
|---|---|
| Cox regression | 유의 predictor 선택 |
| Under-sampling | class imbalance 처리 |
| BN topology learning | causal DAG |
| BN inference | 조건부 확률 (다양한 query) |
- N > 10,000 (NHIC 표본 코호트, 2002-2010)
- 시각화 (DAG) + 정량 (CPT) 동시
- 새로운 의학적 발견 없음, 방법론 적용성 입증
방법론 노트
bayesian-network 의 joint distribution:
Structure learning: Hill-Climbing + BIC score (Heckerman et al. 1995). Parameter learning: MLE 또는 Bayesian (Dirichlet prior).
cox-regression (Cox 1972) for variable pre-screening:
식별 가정: (i) BN 의 Faithfulness, (ii) Cox 비례위험, (iii) under-sampling 의 대표성 보존.
연구 계보
이 paper 는 (i) Pearl (1988) BN 본가, (ii) Cox (1972) 비례위험, (iii) Prediction of Hypertension Complications Risk Using Classification Techniques 직접 선행, (iv) Aliferis et al. (2010) 의 medical BN 응용 라인 — 의 결합. 이정혜 의 연구 궤적 1 기 의료 AI 라인.
See also
- 이정혜
- Wonji Lee
- Chi-Hyuck Jun
- bayesian-network
- cox-regression
- medical-ai
- hypertension-risk-assessment
- Prediction of Hypertension Complications Risk Using Classification Techniques
인접 그래프
- 인물 6
- 논문 4
이 문서를 가리키는 페이지
논문 (3)
- A Data-Driven Procedure of Providing a Health Promotion Program for Hypertension Prevention
- Prediction of Hypertension Complications Risk Using Classification Techniques
- Prediction of type 2 diabetes using genome-wide polygenic risk score and metabolic profiles: A machine learning analysis of population-based 10-year prospective cohort study