An Interpersonal Dynamics Analysis Procedure with Accurate Voice Activity Detection Using Low-cost Recording Sensors


Dongcheol Lim, Hyewon Kang, Beomseok Choi, Woonki Hong, 이정혜 (2024) · ieee-access · DOI ↗

조직 행동 연구Interpersonal Dynamics 분석저비용 commercial recording sensor 로 가능하게 — 기존 sociometric badge (비싼 전자기기) 대안. 3 단계 VAD modeling (signal preprocessing → data-derived generation → ML 기반 classification + smoothing). 15 명 3 인 그룹 의 대화 데이터로 검증. 대화 features (speaking time, turn-taking, overlap) 추출.

  • RQ: 비싼 sociometric badge 대신 low-cost recording sensorVAD 정확도 + 대화 features 추출 가능한가?
  • 방법론: 3 단계 — (1) signal preprocessing, (2) data-derived generation, (3) ML classification + smoothing
  • 데이터: 15 명 3 인 그룹 (verbal interaction)
  • 주요 발견: (1) VAD 정확도가 기존 sociometric badge 보다 우수. (2) Speaking time, turn-taking, overlap 등 대화 features 신뢰성 확보. (3) Low-cost commercial sensor 로 cost-effective 조직 분석.
  • 시사점: 조직행동 연구의 데이터 수집 비용 장벽 완화. Self-report 의 주관성 대신 objective 데이터.

음성 활성 탐지 모형 본 paper 의 architecture 도식.

요약

이 paper 는 이정혜3 기 SNU TEMEP 의 응용 다변화조직 행동 연구 도메인 진입. Dongcheol Lim (LBC, RI-HAE 의 같은 저자) 의 조직 행동 응용 작업.

방법론적 핵심: 3 단계 VAD pipeline. (i) Signal preprocessing — noise reduction, normalization. (ii) Data-derived generation — 학습용 feature 생성. (iii) ML classification + smoothing — VAD binary classification + temporal smoothing filter (잡음 제거).

핵심 발견: 15 명 3 인 그룹 데이터에서 기존 sociometric badge 기반 연구 대비 VAD 정확도 향상. Conversational features (speaking time, turn-taking, overlapped speaking) 의 신뢰도 확보.

이정혜연구 궤적 안에서 이 paper 는 3 기 응용 다변화 라인 의 한 갈래 (조직 행동).

핵심 결과

항목결과
VAD 정확도기존 sociometric badge 대비 우수
비용low-cost commercial sensor
대화 featuresspeaking time, turn-taking, overlap
데이터15 그룹 × 3 인

방법론 노트

3 단계 VAD:

Stage 1: Signal preprocessing
  Bandpass filter, normalization, segmentation

Stage 2: Data-derived feature generation
  Spectral features (MFCC, energy, zero-crossing rate)
  Temporal features

Stage 3: Classification + smoothing
  ML classifier (RF, SVM, NN)
  Smoothing filter (median, HMM) to remove noise

식별 가정: (i) low-cost sensor 의 signal 충분성, (ii) 3 인 그룹의 cross-talk handling, (iii) ML smoothing 의 temporal coherence.

연구 계보

이 paper 는 (i) Olguin et al. (2009) sociometric badge 정통, (ii) VAD literature (Sohn et al. 1999 등), (iii) A Multi-stage Data Mining Approach for Liquid Bulk Cargo Volume Analysis based on Bill of Lading Data (Dongcheol Lim 의 같은 협업) — 의 결합. 이정혜연구 궤적 3 기 응용 다변화.

See also

인접 그래프

1-hop 이웃 7
  • 인물 5
  • 방법론 1
  • 논문 1
이정혜Beomseok ChoiDongcheol LimHyewon KangWoonki Hong기계학습 An Interpersonal Dyna…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동