CAFO: Feature-Centric Explanation on Time Series Classification
Jaeho Kim, Seok-Ju Hahn, Yoontae Hwang, 이정혜 (2024) · kdd 2024 · DOI ↗
CAFO (Feature-Centric Explanation) — 시계열 분류의 기존 time-centric 설명 (어느 시점이 중요? — saliency map 류) 한계 극복. Feature-centric (어느 변수 가 중요? — 특히 multivariate time series) 관점. 이정혜 의 실타래 1 (Feature Selection) + 실타래 5 (Time Series) 의 합류 — KDD 2024 발표. MB 특성 선택 의 시계열 도메인 부활.
- RQ: Multivariate time series classification 의 해석 가능성 을 feature-centric (변수 중심) 관점에서 어떻게 제공할 수 있는가? 기존 time-centric (saliency) 의 한계는?
- 방법론: CAFO — 시계열 분류 모형의 feature-level (변수별) 기여도 추출 + counterfactual 시각화
- 데이터: 시계열 분류 benchmarks (UCR, UEA 등)
- 주요 발견: (1) Feature-centric vs Time-centric: 시계열 분류에서 어느 변수 가 결정적인지 (time-centric 으로는 못 답함). (2) CAFO 가 interpretable feature importance + interaction 추출. (3) KDD 2024 발표 — 최상위 학회.
- 시사점: 시계열 XAI 의 새로운 frame. 의료, 금융, 제조 등 multivariate time series 분야의 해석가능성에 기여. 이정혜 의 MB 특성 선택 라인 (2015-) 이 시계열 도메인에서 부활.
요약
이 paper 는 이정혜 의 3 기 SNU TEMEP 의 KDD 2024 작업 — 시계열 + XAI 의 합류점. Jaeho Kim (smart insoles 의 같은 제 1 저자) + Seok-Ju Hahn (SuPerFed, AAggFF) + Yoontae Hwang (RI-HAE 의 같은 저자) 의 D3M lab 정수.
방법론적 핵심: Feature-centric vs Time-centric paradigm shift.
(i) 기존 Time-centric (예: saliency map, integrated gradients) — 어느 시점 이 prediction 에 결정적인지 시각화. Multivariate 시계열에서는 어느 변수 인지 답 못 함.
(ii) CAFO Feature-centric — 어느 변수 가 중요한지 (sensor, biomarker, feature dimension 단위). 변수 간 상호작용 도 포착 가능.
핵심 발견: 시계열 classification 에서 feature ablation 또는 counterfactual generation 으로 변수 중요도 추출. Time-centric 보다 actionable — 사용자가 어느 sensor 또는 어느 biomarker 가 결정적인지 알면 실제 개선 행동 가능.
이정혜 author page 의 전환점 4 (CAFO @ KDD 2024) 의 핵심 paper. 1 기 박사 연구 (MB 특성 선택) 가 3 기 시계열 도메인에서 부활 — 10 년에 걸친 연구 궤적의 원환적 발전.
이정혜 의 연구 궤적 안에서 이 paper 는 실타래 1 (Feature Selection) + 실타래 5 (Time Series) 의 합류점.
핵심 결과
| 관점 | 기여 | 한계 |
|---|---|---|
| Time-centric (기존) | 시점 saliency | 변수 식별 X |
| Feature-centric (CAFO) | 변수 importance + interaction | — |
- KDD 2024 발표 (최상위 학회)
- MB 특성 선택 의 시계열 부활
- Actionable interpretability
방법론 노트
CAFO 는 feature ablation 또는 counterfactual 기반:
For each feature f:
Generate counterfactual time series x_(-f) (feature f 만 변경 또는 제거)
Measure prediction change: Δ_f = |ŷ(x) - ŷ(x_(-f))|
Rank features by Δ_f
식별 가정: (i) Feature 가 분리 가능, (ii) counterfactual 의 합리성, (iii) classifier 의 non-trivial dependence on each feature.
연구 계보
이 paper 는 (i) Classification of High Dimensionality Data through Feature Selection Using Markov Blanket 등 MB feature selection 라인의 시계열 부활, (ii) Lundberg & Lee (2017) SHAP / Ribeiro et al. (2016) LIME 의 XAI 정통, (iii) 시계열 saliency (Ismail et al. 2020) — 의 결합. 이정혜 의 연구 궤적 전환점 4, 실타래 1 + 5 의 합류.
See also
- 이정혜
- Jaeho Kim
- Seok-Ju Hahn
- Yoontae Hwang
- feature-centric-explanation
- 설명가능 인공지능
- time-series-classification
- kdd
- Classification of High Dimensionality Data through Feature Selection Using Markov Blanket
- An efficient multivariate feature ranking method for gene selection in high-dimensional microarray data
인접 그래프
- 인물 4
- 방법론 2
- 논문 2