Interleaved Incremental Association Markov Blanket as a Potential Feature Selection Method for Improving Accuracy in Near-Infrared Spectroscopic Analysis
Kyeol Chang, 이정혜, Chi-Hyuck Jun, Hoeil Chung (2018) · talanta · DOI ↗
inter-iamb — iamb 의 grow phase 와 shrink phase 를 interleave 해 MB 크기를 작게 유지 — 를 NIR 분광 분석의 변수 선택에 적용. 연속 변수 + 적은 sample 에 적합한 likelihood-ratio-test (LR) 기반 조건부 독립 검정 을 inter-IAMB 에 embed. 디젤, 가솔린, etchant solution 분석에서 inter-IAMB > IAMB > all variables — 복잡 + 특성 indistinct spectra 에 특히 효과적.
- RQ: iamb 의 unnecessarily large MB 문제를 inter-iamb 으로 해결 가능한가? Spectral 변수 같은 continuous + small sample 데이터에 likelihood-ratio-test 기반 CI 검정이 적합한가?
- 방법론: inter-iamb (grow ↔ shrink interleaving) + likelihood-ratio-test (LR-based CI test) + partial-least-squares (PLS) calibration
- 데이터: NIR spectra — 디젤, 가솔린, etchant solutions
- 주요 발견: (1) inter-IAMB > IAMB — 더 작은 변수 set 으로 더 높은 정확도. (2) 복잡 + 특성 indistinct spectra 에 특히 효과적. (3) LR 기반 CI 검정이 spectroscopic data (continuous, 작은 sample) 에 적합. (4) Specificity-deficient + extensively overlapped spectra 에 inter-IAMB 가 분리 잘함.
- 시사점: 분광 분석 변수 선택에 inter-IAMB + LR 결합 protocol 가 IAMB 보다 우월. IR, Raman 분광 데이터에도 확장 가능.

요약
이 paper 는 이정혜 의 1 기 박사 시기 → 2 기 UNIST 초기 의 transition 작업. Kyeol Chang (POSTECH 박사) 의 NIR 분광 + MB 시리즈 마지막 paper. Kernel-based calibration methods combined with multivariate feature selection to improve accuracy of near-infrared spectroscopic analysis + Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy 의 방법론적 정점 — IAMB 의 한계 인식 후 inter-IAMB 으로 발전.
방법론적 혁신: 2 가지 결합. (i) inter-IAMB — IAMB 가 grow phase 에서 false positive 추가 후 shrink 에서 제거하는데, 이 sequential 구조 때문에 큰 MB 가 일시적으로 발생. inter-IAMB 는 grow 와 shrink 를 interleave 해서 MB 크기를 항상 작게 유지. (ii) LR-based CI test — Spectral data 는 continuous + small sample. 표준 G^2 (categorical) 또는 partial correlation (linear) 가 부적합. Likelihood ratio 기반 일반화된 CI 검정으로 non-linear + small sample 처리.
핵심 발견: NIR 분광 (디젤, 가솔린, etchant) 에서 inter-IAMB > IAMB > all variables. 특히 spectra 가 specificity-deficient + extensively overlapped 인 경우 (분자 구조가 비슷한 hydrocarbons 의 spectral peak 가 겹침) inter-IAMB 가 변수 redundancy 제거 에 효과적.
이정혜 의 연구 궤적 안에서 이 paper 는 1 기 NIR 시리즈의 정점 + Markov blanket-based universal feature selection for classification and regression of mixed-type data (2020 혼합형 데이터 + Inter-IAMB 일반화) 의 직접 선행. MB algorithm 자체의 개선 이라는 알고리즘적 기여.
핵심 결과
| 방법 | 변수 수 | 정확도 |
|---|---|---|
| All variables | 많음 | baseline |
| IAMB | 중간 | 개선 |
| inter-IAMB + LR | 작음 | 최고 |
- 디젤, 가솔린, etchant solutions 모두에서 일관 우위
- complex + overlapped spectra 에 특히 효과
- LR-based CI test 가 continuous + small sample 에 적합
방법론 노트
inter-iamb (vs iamb):
MB = ∅
repeat:
# GROW step
X* = argmax_{X ∉ MB} dep(T, X | MB)
if dep(T, X* | MB) > threshold:
MB.add(X*)
# SHRINK step (interleaved)
for X in MB:
if indep(T, X | MB - {X}):
MB.remove(X)
until convergence
IAMB 는 모든 grow 후 모든 shrink — inter-IAMB 는 매 step 마다 shrink. 이로 MB 크기 작게 유지.
likelihood-ratio-test CI test:
asymptotically with df = parameters difference. Spectral data 의 continuous + non-linear 관계에 robust.
식별 가정: (i) Faithfulness, (ii) LR 의 asymptotic approximation (small sample 에선 약함), (iii) spectra 의 충분한 정보 dimensionality.
연구 계보
이 paper 는 (i) Yaramakala & Margaritis (2005) 의 inter-IAMB 본가, (ii) Kernel-based calibration methods combined with multivariate feature selection to improve accuracy of near-infrared spectroscopic analysis · Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy 직접 선행, (iii) Aliferis et al. (2010) MB algorithm 라인 — 의 결합. 이정혜 의 연구 궤적 1 기 NIR 시리즈의 정점, Markov blanket-based universal feature selection for classification and regression of mixed-type data 의 직접 선행.
See also
- 이정혜
- Kyeol Chang
- Chi-Hyuck Jun
- Hoeil Chung
- inter-iamb
- markov-blanket
- likelihood-ratio-test
- near-infrared-spectroscopy
- talanta
- Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy
인접 그래프
- 인물 4
- 논문 3