Developing a novel Temporal Air-quality Risk Index using LSTM autoencoder: A case study with South Korean air quality data


Hyerim Park, Wonho Sohn, Eonyong Kang, Jungho Im, 이정혜 (2025) · science-of-the-total-environment 978:179303 · DOI ↗

TARI (Temporal Air-quality Risk Index)RSLAR (Risk Score-embedded LSTM AutoencodeR) 으로 생성. Risk score-embedded deep learning for biological age estimation: Development and validationRS embedding 패턴환경 도메인 응용. 한국 대기질 실데이터 사례 연구. TARI 가 기존 환경 지표 (AQI 등) 보다 정확 — 안전 vs 위험 지역의 명확한 구분 + 환경 질병 상관관계 강화. 단기·장기 temporal effect 의 선택적 통합.

  • RQ: 기존 대기질 지수 (AQI) 의 한계 — 시간 효과 무시, 위험 정량화 부족 — 를 LSTM autoencoder + RS embedding 으로 극복 가능한가?
  • 방법론: TARI = RSLAR (Risk Score-embedded LSTM AutoencodeR) — LSTM AE + 변수별 RS adjustment
  • 데이터: 한국 대기질 실데이터 + 환경 질병 상관 데이터
  • 주요 발견: (1) TARI > 기존 AQI — 안전·위험 지역 명확 구분. (2) 환경 질병과 강한 상관. (3) 단기 (시간) + 장기 (일·계절) temporal effect 선택적 통합 가능. (4) Health information 함의.
  • 시사점: 국가 환경 정책위험 정량화 도구. 개인·국가 차원의 환경 도전 인식 + 대응.

요약

이 paper 는 이정혜3 기 SNU TEMEP 의 환경 도메인 응용. Hyerim Park (제 1 저자, SNU TEMEP) + Jungho Im (UNIST 환경) 와의 협업. Risk score-embedded deep learning for biological age estimation: Development and validation (RSAE-BA 의료) → 본 paper (RSLAR 환경) 의 도메인 transfer.

방법론적 핵심: RSLAR (Risk Score-embedded LSTM AutoencodeR):

(i) LSTM autoencoder — 대기질 시계열 (PM2.5, PM10, NO2, SO2, O3, CO 등) 을 latent representation 으로 압축 + 재구성.

(ii) Risk Score embedding — 각 오염물질의 위험 수준 (기준치 초과, 건강 영향 가중치) 을 RS 로 정량화 → bottleneck representation 에 통합.

(iii) TARI 생성 — bottleneck representation → scalar risk index.

핵심 발견: 한국 대기질 데이터에서 TARI 가 기존 AQI 보다:

  • 안전·위험 지역 더 명확 구분
  • 환경 질병 (호흡기, 심혈관) 과 더 강한 상관
  • 단기 (시간) + 장기 (일·계절) temporal effect 선택적 포함

이정혜연구 궤적 안에서 이 paper 는 3 기 환경 도메인 응용 + 실타래 4 (Representation Learning) 의 환경 응용. Risk score-embedded deep learning for biological age estimation: Development and validation (의료 BA) → Household financial health: a machine learning approach for data-driven diagnosis and prescription (금융) → 본 paper (환경) 의 RS embedding 패턴 transfer trilogy.

핵심 결과

항목TARI vs 기존 AQI
안전·위험 구분더 명확
환경 질병 상관더 강함
Temporal effect단기 + 장기 선택적 통합
Health information풍부

방법론 노트

RSLAR architecture:

Input: multi-pollutant time series x_t (T window)
LSTM Encoder: x_t → h_t → z (bottleneck)
LSTM Decoder: z → x̂_t
RS predictor: z → R̂S (계산된 위험 점수)
Total loss: ||x - x̂||² + λ * (RS - R̂S)²
TARI = f(z)

식별 가정: (i) Pollutant 의 시계열 패턴 정보성, (ii) RS calculation 의 health-relevant, (iii) LSTM 의 temporal dependency 포착.

연구 계보

이 paper 는 (i) Risk score-embedded deep learning for biological age estimation: Development and validation (RSAE-BA) 직접 선행 (RS embedding 패턴), (ii) Hochreiter & Schmidhuber (1997) LSTM, (iii) 환경 risk index literature (US EPA AQI 등) — 의 결합. 이정혜연구 궤적 3 기 환경 도메인 응용.

See also

인접 그래프

1-hop 이웃 8
  • 인물 5
  • 방법론 1
  • 논문 2
이정혜Eonyong KangHyerim ParkJungho ImWonho Sohn기계학습 Developing a novel Te…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동