Interleaved Incremental Association Markov Blanket as a Potential Feature Selection Method for Improving Accuracy in Near-Infrared Spectroscopic Analysis


Kyeol Chang, 이정혜, Chi-Hyuck Jun, Hoeil Chung (2018) · talanta · DOI ↗

inter-iambiamb 의 grow phase 와 shrink phase 를 interleaveMB 크기를 작게 유지 — 를 NIR 분광 분석의 변수 선택에 적용. 연속 변수 + 적은 sample 에 적합한 likelihood-ratio-test (LR) 기반 조건부 독립 검정 을 inter-IAMB 에 embed. 디젤, 가솔린, etchant solution 분석에서 inter-IAMB > IAMB > all variables복잡 + 특성 indistinct spectra 에 특히 효과적.

  • RQ: iambunnecessarily large MB 문제를 inter-iamb 으로 해결 가능한가? Spectral 변수 같은 continuous + small sample 데이터에 likelihood-ratio-test 기반 CI 검정이 적합한가?
  • 방법론: inter-iamb (grow ↔ shrink interleaving) + likelihood-ratio-test (LR-based CI test) + partial-least-squares (PLS) calibration
  • 데이터: NIR spectra — 디젤, 가솔린, etchant solutions
  • 주요 발견: (1) inter-IAMB > IAMB — 더 작은 변수 set 으로 더 높은 정확도. (2) 복잡 + 특성 indistinct spectra 에 특히 효과적. (3) LR 기반 CI 검정이 spectroscopic data (continuous, 작은 sample) 에 적합. (4) Specificity-deficient + extensively overlapped spectra 에 inter-IAMB 가 분리 잘함.
  • 시사점: 분광 분석 변수 선택에 inter-IAMB + LR 결합 protocol 가 IAMB 보다 우월. IR, Raman 분광 데이터에도 확장 가능.

Inter-IAMB 기반 NIR 분광 변수 선택 알고리즘 구조.

요약

이 paper 는 이정혜1 기 박사 시기 → 2 기 UNIST 초기 의 transition 작업. Kyeol Chang (POSTECH 박사) 의 NIR 분광 + MB 시리즈 마지막 paper. Kernel-based calibration methods combined with multivariate feature selection to improve accuracy of near-infrared spectroscopic analysis + Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy방법론적 정점 — IAMB 의 한계 인식 후 inter-IAMB 으로 발전.

방법론적 혁신: 2 가지 결합. (i) inter-IAMB — IAMB 가 grow phase 에서 false positive 추가 후 shrink 에서 제거하는데, 이 sequential 구조 때문에 큰 MB 가 일시적으로 발생. inter-IAMB 는 grow 와 shrink 를 interleave 해서 MB 크기를 항상 작게 유지. (ii) LR-based CI test — Spectral data 는 continuous + small sample. 표준 G^2 (categorical) 또는 partial correlation (linear) 가 부적합. Likelihood ratio 기반 일반화된 CI 검정으로 non-linear + small sample 처리.

핵심 발견: NIR 분광 (디젤, 가솔린, etchant) 에서 inter-IAMB > IAMB > all variables. 특히 spectra 가 specificity-deficient + extensively overlapped 인 경우 (분자 구조가 비슷한 hydrocarbons 의 spectral peak 가 겹침) inter-IAMB 가 변수 redundancy 제거 에 효과적.

이정혜연구 궤적 안에서 이 paper 는 1 기 NIR 시리즈의 정점 + Markov blanket-based universal feature selection for classification and regression of mixed-type data (2020 혼합형 데이터 + Inter-IAMB 일반화) 의 직접 선행. MB algorithm 자체의 개선 이라는 알고리즘적 기여.

핵심 결과

방법변수 수정확도
All variables많음baseline
IAMB중간개선
inter-IAMB + LR작음최고
  • 디젤, 가솔린, etchant solutions 모두에서 일관 우위
  • complex + overlapped spectra 에 특히 효과
  • LR-based CI test 가 continuous + small sample 에 적합

방법론 노트

inter-iamb (vs iamb):

MB = ∅
repeat:
  # GROW step
  X* = argmax_{X ∉ MB} dep(T, X | MB)
  if dep(T, X* | MB) > threshold:
    MB.add(X*)
  # SHRINK step (interleaved)
  for X in MB:
    if indep(T, X | MB - {X}):
      MB.remove(X)
until convergence

IAMB 는 모든 grow모든 shrink — inter-IAMB 는 매 step 마다 shrink. 이로 MB 크기 작게 유지.

likelihood-ratio-test CI test:

Λ=2[logLfulllogLnested]\Lambda = 2[\log L_{\text{full}} - \log L_{\text{nested}}]

asymptotically χ2\chi^2 with df = parameters difference. Spectral data 의 continuous + non-linear 관계에 robust.

식별 가정: (i) Faithfulness, (ii) LR 의 asymptotic χ2\chi^2 approximation (small sample 에선 약함), (iii) spectra 의 충분한 정보 dimensionality.

연구 계보

이 paper 는 (i) Yaramakala & Margaritis (2005) 의 inter-IAMB 본가, (ii) Kernel-based calibration methods combined with multivariate feature selection to improve accuracy of near-infrared spectroscopic analysis · Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy 직접 선행, (iii) Aliferis et al. (2010) MB algorithm 라인 — 의 결합. 이정혜연구 궤적 1 기 NIR 시리즈의 정점, Markov blanket-based universal feature selection for classification and regression of mixed-type data직접 선행.

See also

인접 그래프

1-hop 이웃 7
  • 인물 4
  • 논문 3
이정혜Chi-Hyuck JunHoeil ChungKyeol Chang Interleaved Increment…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동