Developing a novel Temporal Air-quality Risk Index using LSTM autoencoder: A case study with South Korean air quality data
Hyerim Park, Wonho Sohn, Eonyong Kang, Jungho Im, 이정혜 (2025) · science-of-the-total-environment 978:179303 · DOI ↗
TARI (Temporal Air-quality Risk Index) — RSLAR (Risk Score-embedded LSTM AutoencodeR) 으로 생성. Risk score-embedded deep learning for biological age estimation: Development and validation 의 RS embedding 패턴 의 환경 도메인 응용. 한국 대기질 실데이터 사례 연구. TARI 가 기존 환경 지표 (AQI 등) 보다 정확 — 안전 vs 위험 지역의 명확한 구분 + 환경 질병 상관관계 강화. 단기·장기 temporal effect 의 선택적 통합.
- RQ: 기존 대기질 지수 (AQI) 의 한계 — 시간 효과 무시, 위험 정량화 부족 — 를 LSTM autoencoder + RS embedding 으로 극복 가능한가?
- 방법론: TARI = RSLAR (Risk Score-embedded LSTM AutoencodeR) — LSTM AE + 변수별 RS adjustment
- 데이터: 한국 대기질 실데이터 + 환경 질병 상관 데이터
- 주요 발견: (1) TARI > 기존 AQI — 안전·위험 지역 명확 구분. (2) 환경 질병과 강한 상관. (3) 단기 (시간) + 장기 (일·계절) temporal effect 선택적 통합 가능. (4) Health information 함의.
- 시사점: 국가 환경 정책 의 위험 정량화 도구. 개인·국가 차원의 환경 도전 인식 + 대응.
요약
이 paper 는 이정혜 의 3 기 SNU TEMEP 의 환경 도메인 응용. Hyerim Park (제 1 저자, SNU TEMEP) + Jungho Im (UNIST 환경) 와의 협업. Risk score-embedded deep learning for biological age estimation: Development and validation (RSAE-BA 의료) → 본 paper (RSLAR 환경) 의 도메인 transfer.
방법론적 핵심: RSLAR (Risk Score-embedded LSTM AutoencodeR):
(i) LSTM autoencoder — 대기질 시계열 (PM2.5, PM10, NO2, SO2, O3, CO 등) 을 latent representation 으로 압축 + 재구성.
(ii) Risk Score embedding — 각 오염물질의 위험 수준 (기준치 초과, 건강 영향 가중치) 을 RS 로 정량화 → bottleneck representation 에 통합.
(iii) TARI 생성 — bottleneck representation → scalar risk index.
핵심 발견: 한국 대기질 데이터에서 TARI 가 기존 AQI 보다:
- 안전·위험 지역 더 명확 구분
- 환경 질병 (호흡기, 심혈관) 과 더 강한 상관
- 단기 (시간) + 장기 (일·계절) temporal effect 선택적 포함
이정혜 의 연구 궤적 안에서 이 paper 는 3 기 환경 도메인 응용 + 실타래 4 (Representation Learning) 의 환경 응용. Risk score-embedded deep learning for biological age estimation: Development and validation (의료 BA) → Household financial health: a machine learning approach for data-driven diagnosis and prescription (금융) → 본 paper (환경) 의 RS embedding 패턴 transfer trilogy.
핵심 결과
| 항목 | TARI vs 기존 AQI |
|---|---|
| 안전·위험 구분 | 더 명확 |
| 환경 질병 상관 | 더 강함 |
| Temporal effect | 단기 + 장기 선택적 통합 |
| Health information | 풍부 |
방법론 노트
RSLAR architecture:
Input: multi-pollutant time series x_t (T window)
LSTM Encoder: x_t → h_t → z (bottleneck)
LSTM Decoder: z → x̂_t
RS predictor: z → R̂S (계산된 위험 점수)
Total loss: ||x - x̂||² + λ * (RS - R̂S)²
TARI = f(z)
식별 가정: (i) Pollutant 의 시계열 패턴 정보성, (ii) RS calculation 의 health-relevant, (iii) LSTM 의 temporal dependency 포착.
연구 계보
이 paper 는 (i) Risk score-embedded deep learning for biological age estimation: Development and validation (RSAE-BA) 직접 선행 (RS embedding 패턴), (ii) Hochreiter & Schmidhuber (1997) LSTM, (iii) 환경 risk index literature (US EPA AQI 등) — 의 결합. 이정혜 의 연구 궤적 3 기 환경 도메인 응용.
See also
- 이정혜
- Hyerim Park
- lstm-autoencoder
- risk-score-embedding
- air-quality-index
- science-of-the-total-environment
- Risk score-embedded deep learning for biological age estimation: Development and validation
- Household financial health: a machine learning approach for data-driven diagnosis and prescription
인접 그래프
- 인물 5
- 방법론 1
- 논문 2