Estimation of discrete/continuous choice model: application of Bayesian approach using Gibbs sampling


김연배 (2002) · Applied Economics Letters 9(5):305–309 · DOI ↗

차량 보유 (discrete)주행 (continuous) 처럼 이산-연속 결정이 동시에 일어나는 framework 를 Bayesian + Gibbs sampling 으로 추정하는 방법을 제안. McCulloch-Polson-Rossi (2000) 가 multinomial probit 에 적용한 Markov chain Gibbs sampler 를 discrete + continuous 결합 framework 로 확장한 단신 (short note) 논문. Seoul 293 가구 데이터로 차량 보유·주행 결정에서 가솔린 가격 탄력성을 −0.7601 로 추정.

  • RQ: Discrete (vehicle ownership class) + continuous (vehicle use km) 동시 결정 framework 를 Full-information ML 의 다변량 적분 부담MNP 의 IIA 회피 를 동시에 해결하면서 추정하는 방법은? Bayesian Gibbs sampler 가 두 문제를 동시에 풀 수 있는가?
  • 방법론: 베이지안 추정, 깁스 샘플링, multinomial-probit-model, discrete-continuous-choice-model, markov-chain-monte-carlo
  • 데이터: Seoul 가구 vehicle ownership survey (1998 년 10 월, 293 가구). 변수: ln(income−user cost), 변동비용, 가구주 연령, 연간 주행거리. 차량 class 4 등급 (없음 / sub-compact·compact / intermediate / standard·luxury·복수). Gibbs sampler 10,000 draws, burn-in 1,000.
  • 주요 발견: ln(INCOST) 의 vehicle ownership 효과는 양수·유의 (3.39, SE 1.39). Vehicle use 식의 변동비용 계수는 −0.173 (SE 0.068). Gibbs sampler 추정 + Hajivassiliou CFS simulator 로 계산한 가솔린 가격 탄력성 사후 평균 −0.7601 (비탄력적).
  • 시사점: 가솔린 demand 가 비탄력적이라는 결과는 가솔린 세금 인상이 단기 환경·재정 정책 도구로 효과 제한적 임을 시사. 방법론적 측면에서는, MNP 의 모든 cross-error correlation 을 추정하면서도 simulated MLE 의 convergence 문제를 회피할 수 있는 exact finite-sample inference 가 가능함을 보임.

요약

본 paper 는 short note 형식이지만 김연배방법론 라인의 출발점 에 해당한다 (author page 제1기 ETRI 시대 분류). Dubin-McFadden (1984), Hensher 등 (1990) 의 discrete-continuous choice framework 는 consumer durables 의 선택+사용 같은 동시 결정 모형의 표준이었으나, FIML 추정의 multivariate normal density 적분 부담 때문에 two-step estimator (단순하지만 비효율) 가 사실상 표준이었다. 본 paper 는 McCulloch-Rossi (1994), McCulloch-Polson-Rossi (2000) 의 MNP Gibbs sampler 를 discrete-continuous 결합 framework 로 확장해 full posterior 직접 추출 을 가능케 한다.

방법론적 핵심은 — (i) latent utility UiU_i^* 와 latent continuous variable qiq_i^* 를 동시 결정하는 model 의 covariance matrix Σ\Sigmaidentification 제약 σ11=1\sigma_{11}=1 하에 (γ,Φ)(\gamma, \Phi) 로 재모수화, (ii) Wi,β,Φ,γW_i^*, \beta, \Phi, \gamma 에 대한 sequential conditional posterior 에서 깁스 샘플링 (Albert-Chib 1993 accept/reject 로 truncated multivariate normal draw), (iii) Wishart prior on Φ1\Phi^{-1}, normal prior on γ\gamma. 실증 적용은 Seoul 1998 가구 데이터 — vehicle ownership 4-class discrete choice + annual VKM continuous use. Hausman (1979) annualized capital cost + Hyundai Motors (1998) 가격·연비 데이터로 user cost·variable cost 구성. Gibbs sampler 의 마지막 9,000 draws 에서 posterior mean 추정.

발견은 두 layer. (a) Parameter level — 소득-비용 차이의 logarithm 이 vehicle ownership 에 양의 유의, vehicle use 식의 variable cost 계수는 음의 유의 (−0.173), variance-covariance 의 ση1η1=152.0\sigma_{\eta_1\eta_1} = 152.0 등 cross-error 추정. (b) Policy elasticity — Hajivassiliou-McFadden-Ruud (1996) crude frequency simulator 로 portfolio shift in vehicle holdings 까지 포함한 가솔린 demand elasticity 사후 평균 −0.7601. 비탄력적 결과는 한국 가솔린 세제 정책의 단기 효과 제한을 시사. 한계는 (i) 1998 single cross-section, (ii) 293 sample size 가 MNP 의 high-dim covariance 식별에 빠듯, (iii) 연속 변수 식 1 개로 단순화 (general form 은 J 개 가능).

핵심 결과

Posterior mean 주요 계수 (Table 2)

변수사후 평균SE
Vehicle ownershipln(INCOST)+3.3851.385
Vehicle ownershipVCOST−0.00180.0039
Vehicle ownershipAOH (standard·luxury)+0.00790.0074
Vehicle use (VKM)constant+36.3805.558
Vehicle use (VKM)VCOST−0.1730.068
Vehicle use (VKM)INCOME+0.0710.069
Variance-covarianceσ(η₁η₁)151.9916.66

정량 결론. Vehicle use 식에서 variable cost (won/km) 가 유의하게 음수 (−0.173) — 운행거리는 비용에 반응. Posterior mean 으로 시뮬레이트한 gasoline demand price elasticity = −0.7601 — 비탄력적.

방법론 노트

표준 simulated MLE (GHK simulator) 는 (i) likelihood 가 비-trivial 한 정규 적분, (ii) optimization 의 global maximum 보장 안 됨, (iii) finite-sample asymptotic approximation 의 부정확성 — 특히 variance-covariance 모수 — 문제를 안고 있다. Bayesian Gibbs sampler 는 Markov chain 의 stationary 분포가 posterior 와 일치 하는 성질을 이용해 위 셋을 동시 회피한다 (McCulloch-Rossi 1994 pp. 207-210).

핵심 식. Discrete-continuous joint:

Wi=Xiβ+εi,εiN(0,Σ)W_i^* = X_i \beta + \varepsilon_i, \quad \varepsilon_i \sim N(0, \Sigma)

여기서 Wi=(di,qi)W_i^* = (d_i^{*\prime}, q_i^{*\prime})', did_i^*(J1)×1(J-1) \times 1 relative utility, qiq_i^* 는 latent continuous demand. Identification 제약 σ(ν1,ν1)=1\sigma_{(\nu_1, \nu_1)} = 1 하에 Σ\Sigma(γ,Φ)(\gamma, \Phi) 로 reparameterize:

Σ=[1γγΦ+γγ]\Sigma = \begin{bmatrix} 1 & \gamma' \\ \gamma & \Phi + \gamma\gamma' \end{bmatrix}

Gibbs sampler 의 4-step block:

Wβ,γ,Φ,d,q,X    β    Φ    γW^* | \beta, \gamma, \Phi, d, q, X \;\to\; \beta | \cdots \;\to\; \Phi | \cdots \;\to\; \gamma | \cdots

각 block 은 truncated multivariate normal 또는 Wishart conditional posterior — Albert-Chib (1993) accept/reject 로 draw. 식별은 (i) σ11=1\sigma_{11}=1 제약, (ii) Wishart prior Φ1W(κ,C)\Phi^{-1} \sim W(\kappa, C) + normal prior γN(h,B1)\gamma \sim N(h, B^{-1}), (iii) ranked-choice 응답이 single-choice 보다 information 풍부.

연구 계보

본 paper 는 두 literature stream 의 합집합 위치: (i) Dubin-McFadden (1984), Hensher-Milthorpe-Smith (1990) 의 consumer durables discrete-continuous choice (vehicle holdings + use, residential appliance + electricity 등) framework, (ii) Albert-Chib (1993), McCulloch-Rossi (1994), McCulloch-Polson-Rossi (2000) 의 MNP Bayesian Gibbs sampler literature. 본 paper 의 contribution 은 (ii) 의 sampler 를 (i) 의 결합 framework 로 확장한 technical note. 김연배 author page 의 제1기 (Berkeley/ETRI 2000-2006) 방법론 기반 구축 으로 분류 — 본 paper 는 그 시기의 가장 방법론-중심 작업으로, 이후 Effects of consumer preferences on the convergence of mobile telecommunications devices 의 mobile device convergence 분석, Consumer preferences for alternative fuel vehicles in South Korea 의 alternative fuel vehicle 분석 등 Bayesian MNP/mixed logit 응용 시리즈의 방법론 토대를 제공한다 (author page 제1기 분류). 같은 기술경영경제정책전공 demand-analysis 라인의 자매 작업으로 Evaluation of Technological Innovation in the Cellular Phone Display 가 같은 시기 conjoint analysis 의 rank-ordered logit 응용으로 존재.

See also

인접 그래프

1-hop 이웃 13
  • 인물 1
  • 개관 1
  • 방법론 2
  • 수록처 1
  • 분류 2
  • 논문 6
김연배기술경영경제정책전공깁스 샘플링베이지안 추정Applied Economics…계량경제학 방법론소비자 선택 연구 Estimation of discret…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동