Revolutionizing Air Pollution Spikes Analysis With a Blockchain-Driven Machine Learning Framework
Eric Nizeyimana, 황준석, Jules Zirikana, Bonaventure Karikumutima, Irene Niyonambaza Mihigo, Pacifique Nizeyimana, Damien Hanyurwimfura, Jimmy Nsenga (2025) · Transactions on Emerging Telecommunications Technologies 36(5):e70143 · DOI ↗
대기오염 spike (급증) 분석을 Ethereum 블록체인 + 머신러닝 결합 framework 로 해결. SNU IoT 센서 1 개월 데이터 (8 parameter: T, H, PM2.5, PM10, CO2, SO2, O3, NO2) 와 서울시 3 년 대기 측정소 데이터 (120 만 record) 를 사용. 블록체인 측 — Ethereum smart contract (AirQualityContract) 로 pollutant threshold 와 fine 자동 enforcement. ML 측 — Exponential Smoothing vs RNN vs ARIMA 비교, MAE / MSE / R² 평가. Exponential Smoothing 이 일관 우위 (PM10 의 R² = 82.4%), ARIMA + RNN 은 SO2 등 일부 pollutant 에서 R² 음수. 블록체인은 IPFS-style 분산 storage + 변조 불가능 ledger 제공.
- RQ: IoT 기반 대기오염 모니터링에서 (i) 데이터 무결성과 (ii) spike 예측 정확도를 동시에 개선할 수 있는 framework 는 무엇인가.
- 방법론: Blockchain (Ethereum + smart contract, AirQualityContract), Web3.js, exponential-smoothing (single parameter), recurrent-neural-network (RNN), arima (AR-Integrated-MA), Time Series Prediction (80/20 train-test split).
- 데이터: (i) Blockchain part — SNU 자체 개발 IoT 센서로 2023.08-09 한 달 수집 (34,131 record, 8 parameter). (ii) ML training — 서울시 3 년 대기 측정소 데이터 (1,200,000 record, 80% train = 960,000 / 20% test = 240,000). pollutant: PM2.5, PM10, CO2, SO2, NO2, O3.
- 주요 발견: (i) Exponential Smoothing 가 일관 우위 — MAE, MSE, R² 모두 ARIMA + RNN 대비 우월. (ii) PM10 의 R² = 82.4% 최고. (iii) ARIMA, RNN 은 일부 pollutant (특히 SO2) 에서 R² 음수 — 평균 예측보다 나쁜 fit. (iv) Smart contract 4 함수 (constructor, setAirQualityData, getAirQualityData, enforceThresholds) 로 자동 threshold 위반 감지 + fine 부과. (v) IoT → CSV → Python script → Web3.js → smart contract 의 pipeline 으로 종단 자동화.
- 시사점: 인프라가 제한적인 르완다 / 개도국 환경에서 분산 데이터 무결성 + ML 결합이 환경 모니터링 신뢰성을 크게 향상시킬 수 있음. 정책 enforcement (fine) 의 자동화로 regulatory cost 절감 가능.

요약
황준석 의 5기 (개도국 ICT 혁신 · 아프리카 협력) 라인의 르완다 분기. Eric Nizeyimana 의 University of Rwanda ACEIoT (African Center of Excellence in the Internet of Things) 박사 라인 + SNU GRC (Global R&D Center) + Carnegie Mellon Africa + Rwanda Polytechnics + Adventist University of Central Africa 의 다자 협력. PASET-RSIF 펀딩 라인의 일부 (자매 An Energy-Efficient Data Collection Protocol for IoT Networks Using Social Network Search Metaheuristic 와 함께). 기존 대기오염 모니터링의 한계는 (i) static sensor + manual collection 으로 real-time 곤란, (ii) centralized DB 의 변조 위험, (iii) ML 단독 적용 시 data quality 의존성. 본 paper 는 블록체인 + ML 통합으로 세 한계 동시 해결.
방법론은 2 축 통합. 축 1 (Blockchain): Ethereum 위에 AirQualityContract smart contract 배포. 4 함수 — (1) Constructor: pollutant threshold (PM2.5/PM10/O3/SO2/NO2/CO2) 와 fine 초기화, (2) setAirQualityData: CSV 업로드된 데이터를 Web3.js 로 smart contract 에 기록, (3) getAirQualityData: 저장된 데이터 조회, (4) enforceThresholds: threshold 위반 시 자동 fine. 데이터 흐름은 IoT 센서 → 로컬 DB → hash → 블록체인 분산 ledger → 다수 node 검증. 축 2 (Machine Learning): 3 모델 비교. (a) Exponential Smoothing (), (b) RNN (hidden state , output ), (c) ARIMA(p,d,q) (AR + Integrated differencing + MA). 80/20 train-test, hyperparameter tuning, MAE/MSE/R² 평가.
핵심 발견 셋. 첫째, Exponential Smoothing 의 일관 우위는 의외 — RNN 의 capacity 가 클 텐데 데이터 양 (서울 3 년) 으로는 부족했거나 air pollution 의 비선형성이 크지 않다는 의미. 둘째, R² 음수 결과는 RNN 과 ARIMA 의 SO2 fitting 실패 — SO2 의 high noise / non-stationarity 가 원인 추정. 셋째, blockchain + ML 의 통합 가치는 단순 결합이 아니라 trust amplification — ML 예측의 신뢰성이 blockchain immutable data 로 강화. 정책 측면에서는 smart contract 의 자동 fine 이 regulatory cost 를 0 에 가깝게 만듬. 한계: 1 month blockchain demonstration data, 서울 3 년 ML data 의 표본 한계, scalability (Ethereum gas fee) 미해결.
핵심 결과
ML 모델 비교 (Exponential Smoothing vs RNN vs ARIMA, MAE/MSE/R²):
| 모델 | 결과 요약 |
|---|---|
| Exponential Smoothing | 모든 parameter 에서 우위, PM10 R² = 82.4% |
| RNN | 일부 pollutant (SO2 등) 에서 R² 음수 |
| ARIMA | 일부 pollutant (SO2 등) 에서 R² 음수 |
데이터셋:
| 데이터셋 | 총 record | Train (80%) | Test (20%) | 용도 |
|---|---|---|---|---|
| 서울 3 년 측정소 | 1,200,000 | 960,000 | 240,000 | ML 학습 |
| SNU IoT 1 개월 | 34,131 | — | — | Blockchain 검증 |
Smart Contract 4 핵심 함수: constructor (threshold + fine init), setAirQualityData (입력), getAirQualityData (조회), enforceThresholds (자동 fine).
모니터링 parameter (8): Temperature, Humidity, PM2.5, PM10, CO2, SO2, O3, NO2.
방법론 노트
Exponential Smoothing (Holt-Winters 류):
는 smoothing parameter — 작을수록 과거에 weight 더 부여. 본 paper 에서 가장 좋은 성능.
RNN (Recurrent Neural Network):
는 hidden state, 는 activation function (tanh, ReLU 등), 는 weight matrix. temporal dependency capture.
ARIMA(p, d, q):
AR(p):
MA(q):
ARIMA(p, d, q):
는 차 differencing (stationarity 확보).
Blockchain + ML 통합: IoT 센서 → hash → Ethereum block 분산 저장 → smart contract 가 ML 예측과 실시간 측정값 모두 비교해 threshold 위반 시 fine. 데이터 무결성은 immutable ledger, 예측 정확도는 ML 의 분업.
평가 metric:
은 모델이 단순 평균보다도 나쁘다는 신호.
연구 계보
황준석 의 5기 아프리카 ICT 협력 라인. SNU GRC (Global R&D Center) 가 르완다·세네갈·카메룬 등 ACEIoT 협력 거점의 hub 역할. 자매 paper An Energy-Efficient Data Collection Protocol for IoT Networks Using Social Network Search Metaheuristic + A Hybrid Biologically-Inspired Optimization Algorithm for Data Gathering in IoT Sensor Networks 와 함께 IoT 측 분기 — 본 paper 는 환경 응용 (air pollution), 자매는 일반 WSN clustering. 황준석 author page anchor 의 “개도국 ICT 혁신” 라인 (Failure of E-Government Implementation: A Case Study of South Sulawesi → Appropriate technology for grassroots innovation in developing countries for sustainable development: The case of Laos → Understanding the Drivers of Agricultural Innovation in Ethiopia's Integrated Agro-Industrial Parks: A Structural Equation Modeling and Qualitative Insights Approach) 의 르완다 환경 분기.
기술적 reference: (i) Blockchain: Nakamoto (2008) Bitcoin original, Ethereum (Buterin 2014) smart contract, IPFS distributed storage. (ii) ML time series: Box & Jenkins (1976) ARIMA, Holt (1957) + Winters (1960) exponential smoothing, Elman (1990) RNN. (iii) Blockchain + ML 통합: 본 paper 가 cited 한 reinforcement learning 기반 Bitcoin mining 최적화 [33], BCFL (Blockchain + Federated Learning) [34, 35] 등이 inspirational ancestor.
황준석 라인 내 위치는 (i) ahp-mcdm / IoT 정책 라인 (Na et al. 2023 IoT 규제) 의 기술 측 분기, (ii) 환경 분야 신규 진출 — 본 paper 가 아프리카 환경 모니터링 응용의 첫 paper. ITPP / GRC 의 50 개국 협력 경험이 르완다 ACEIoT 와의 직접 연결로 결실.
See also
- 황준석
- Eric Nizeyimana
- Transactions on Emerging Telecommunications Technologies
- Blockchain
- smart-contract
- recurrent-neural-network
- arima
- exponential-smoothing
- Time Series Prediction
- 대기오염 모니터링
- 개도국 ICT 혁신
- An Energy-Efficient Data Collection Protocol for IoT Networks Using Social Network Search Metaheuristic
- A Hybrid Biologically-Inspired Optimization Algorithm for Data Gathering in IoT Sensor Networks
인접 그래프
- 인물 8
- 방법론 4
- 주제 3
- 수록처 1
- 분류 1
- 논문 5