Kernel-based calibration methods combined with multivariate feature selection to improve accuracy of near-infrared spectroscopic analysis
이정혜, Kyeol Chang, Chi-Hyuck Jun, Rae-Kwang Cho, Hoeil Chung, Hyeseon Lee (2015) · chemometrics-and-intelligent-laboratory-systems 147:139-146 · DOI ↗
근적외선 (NIR) 분광 분석 의 정확도 개선을 위한 커널 기반 보정 모형 + 멀티변량 특성 선택 결합. kernel-partial-least-squares (K-PLS) + kernel-support-vector-regression (K-SVR) 에 vip-score / weight-vector-coefficient 기반 특성 순위화 적용. K-SVR-WV 가 복잡한 spectra + 미세 변동 인식 필요한 sample 에서 최적. 나프타, etchant solution, 사과 3 datasets 검증. 이정혜 의 실타래 1 (Feature Selection) 의 화학계량학 응용.
- RQ: NIR 분광 분석에서 커널 회귀 + 특성 선택 결합이 정확도를 어떻게 개선하는가? 어느 조합이 복잡한 spectra 에 최적인가?
- 방법론: kernel-partial-least-squares (K-PLS) + kernel-support-vector-regression (K-SVR) + vip-score / weight-vector-coefficient 기반 특성 순위
- 데이터: NIR 분광 데이터 3 종 — 나프타 (석유 제품), etchant solution (반도체 화학), 사과 (식품)
- 주요 발견: (1) K-SVR-WV (Weight Vector 기반 SVR 특성 선택) 가 복잡한 spectra 에 최적. (2) 특성 선택과 kernel calibration model 의 일관성 이 정확도의 핵심. (3) 미세 spectral variation 인식 필요 시 K-SVR-WV 우월. (4) 단순 spectra (사과) 에는 K-PLS 도 충분.
- 시사점: 화학계량학 (chemometrics) 에서 kernel 방법 + 특성 선택 결합이 복잡한 sample 의 양적 분석에 유용. NIR 외 Raman, NMR 분광에도 확장 가능.

요약
이 paper 는 이정혜 의 1 기 박사 시기 의 특성 선택 도메인 응용 (chemometrics). Chi-Hyuck Jun (지도교수) + Hoeil Chung (한양대 화학과) + Kyeol Chang (POSTECH 박사) 의 통계-화학 결합 프로젝트. markov-blanket 이론 작업과 평행하는 방법론 응용 능력 입증.
방법론적 핵심은 2 단계 결합: (i) 특성 순위 — vip-score (PLS 기반) 또는 weight-vector-coefficient (SVR 기반) 로 변수 중요도 측정 후 상위 features 선택. (ii) 커널 회귀 — kernel-partial-least-squares (K-PLS) 또는 kernel-support-vector-regression (K-SVR) 로 비선형 보정. 4 조합: K-PLS-VIP, K-PLS-WV, K-SVR-VIP, K-SVR-WV.
핵심 발견: K-SVR-WV 가 복잡한 spectra + 미세 spectral variation 에 우월. 나프타 (복잡한 hydrocarbons mix), etchant (다성분 반응) 에서 K-SVR-WV > 다른 조합. 사과 (단순) 에는 K-PLS 도 충분. 특성 선택과 회귀 방법의 일관성 — 즉 같은 알고리즘 (SVR) 에서 추출한 weight vector 를 SVR 의 특성 선택에 사용 — 이 정확도 핵심.
이정혜 의 연구 궤적 안에서 이 paper 는 1 기 박사 시기의 도메인 응용 (chemometrics), 후속 kyeol-chang-2016-nir-multivariate (2016 NIR 다변량), Interleaved Incremental Association Markov Blanket as a Potential Feature Selection Method for Improving Accuracy in Near-Infrared Spectroscopic Analysis (2018 NIR Inter-IAMB) 와 함께 NIR 분광 분석 시리즈.
핵심 결과
| 조합 | 적합 spectra |
|---|---|
| K-PLS-VIP | 단순 |
| K-PLS-WV | 단순 |
| K-SVR-VIP | 중간 |
| K-SVR-WV | 복잡한 spectra + 미세 변동 |
| Dataset | 최적 조합 |
|---|---|
| 나프타 (복잡) | K-SVR-WV |
| Etchant solution (다성분) | K-SVR-WV |
| 사과 (단순) | K-PLS 충분 |
방법론 노트
kernel-support-vector-regression (K-SVR) primal:
s.t. , . Dual 풀이 → kernel trick .
weight-vector-coefficient (WV): SVR 의 primal weight vector 의 크기로 특성 중요도. SVR-WV 는 non-kernel SVR 의 weight 를 사용해 kernel SVR 의 특성 선택 에 활용.
vip-score (Variable Importance in Projection): PLS 의 latent variable 에 대한 변수 기여도.
연구 계보
이 paper 는 (i) Wold et al. (2001) 의 PLS / VIP 본가, (ii) Schölkopf & Smola (2002) 의 kernel methods 정통, (iii) Chi-Hyuck Jun 의 화학계량학 라인 — 의 결합. 이정혜 의 연구 궤적 1 기 박사 시기의 NIR 응용 라인.
See also
- 이정혜
- Kyeol Chang
- Chi-Hyuck Jun
- Hoeil Chung
- kernel-support-vector-regression
- feature-selection
- near-infrared-spectroscopy
- chemometrics-and-intelligent-laboratory-systems
인접 그래프
- 인물 6
- 논문 3
이 문서를 가리키는 페이지
논문 (3)
- Acquisition of a series of temperature-varied sample spectra to induce characteristic structural changes of components and selection of target-descriptive variables among them for multivariate analysis to improve accuracy
- Chemistry-informed machine learning: Using chemical property features to improve gas classification performance
- Interleaved Incremental Association Markov Blanket as a Potential Feature Selection Method for Improving Accuracy in Near-Infrared Spectroscopic Analysis