Estimation of discrete/continuous choice model: application of Bayesian approach using Gibbs sampling

김연배 (2002) · Applied Economics Letters 9(5):305–309 · DOI ↗

차량 보유 (discrete) 와 주행 (continuous) 처럼 이산-연속 결정이 동시에 일어나는 framework 를 Bayesian + Gibbs sampling 으로 추정하는 방법을 제안. McCulloch-Polson-Rossi (2000) 가 multinomial probit 에 적용한 Markov chain Gibbs sampler 를 discrete + continuous 결합 framework 로 확장한 단신 (short note) 논문. Seoul 293 가구 데이터로 차량 보유·주행 결정에서 가솔린 가격 탄력성을 −0.7601 로 추정.

RQ: Discrete (vehicle ownership class) + continuous (vehicle use km) 동시 결정 framework 를 Full-information ML 의 다변량 적분 부담 과 MNP 의 IIA 회피 를 동시에 해결하면서 추정하는 방법은? Bayesian Gibbs sampler 가 두 문제를 동시에 풀 수 있는가?
방법론: 베이지안 추정, 깁스 샘플링, multinomial-probit-model, discrete-continuous-choice-model, markov-chain-monte-carlo
데이터: Seoul 가구 vehicle ownership survey (1998 년 10 월, 293 가구). 변수: ln(income−user cost), 변동비용, 가구주 연령, 연간 주행거리. 차량 class 4 등급 (없음 / sub-compact·compact / intermediate / standard·luxury·복수). Gibbs sampler 10,000 draws, burn-in 1,000.
주요 발견: ln(INCOST) 의 vehicle ownership 효과는 양수·유의 (3.39, SE 1.39). Vehicle use 식의 변동비용 계수는 −0.173 (SE 0.068). Gibbs sampler 추정 + Hajivassiliou CFS simulator 로 계산한 가솔린 가격 탄력성 사후 평균 −0.7601 (비탄력적).
시사점: 가솔린 demand 가 비탄력적이라는 결과는 가솔린 세금 인상이 단기 환경·재정 정책 도구로 효과 제한적 임을 시사. 방법론적 측면에서는, MNP 의 모든 cross-error correlation 을 추정하면서도 simulated MLE 의 convergence 문제를 회피할 수 있는 exact finite-sample inference 가 가능함을 보임.

요약

본 paper 는 short note 형식이지만 김연배 의 방법론 라인의 출발점 에 해당한다 (author page 제1기 ETRI 시대 분류). Dubin-McFadden (1984), Hensher 등 (1990) 의 discrete-continuous choice framework 는 consumer durables 의 선택+사용 같은 동시 결정 모형의 표준이었으나, FIML 추정의 multivariate normal density 적분 부담 때문에 two-step estimator (단순하지만 비효율) 가 사실상 표준이었다. 본 paper 는 McCulloch-Rossi (1994), McCulloch-Polson-Rossi (2000) 의 MNP Gibbs sampler 를 discrete-continuous 결합 framework 로 확장해 full posterior 직접 추출 을 가능케 한다.

방법론적 핵심은 — (i) latent utility $U_i^*$ 와 latent continuous variable $q_i^*$ 를 동시 결정하는 model 의 covariance matrix $\Sigma$ 를 identification 제약 $\sigma_{11}=1$ 하에 $(\gamma, \Phi)$ 로 재모수화, (ii) $W_i^*, \beta, \Phi, \gamma$ 에 대한 sequential conditional posterior 에서 깁스 샘플링 (Albert-Chib 1993 accept/reject 로 truncated multivariate normal draw), (iii) Wishart prior on $\Phi^{-1}$ , normal prior on $\gamma$ . 실증 적용은 Seoul 1998 가구 데이터 — vehicle ownership 4-class discrete choice + annual VKM continuous use. Hausman (1979) annualized capital cost + Hyundai Motors (1998) 가격·연비 데이터로 user cost·variable cost 구성. Gibbs sampler 의 마지막 9,000 draws 에서 posterior mean 추정.

발견은 두 layer. (a) Parameter level — 소득-비용 차이의 logarithm 이 vehicle ownership 에 양의 유의, vehicle use 식의 variable cost 계수는 음의 유의 (−0.173), variance-covariance 의 $\sigma_{\eta_1\eta_1} = 152.0$ 등 cross-error 추정. (b) Policy elasticity — Hajivassiliou-McFadden-Ruud (1996) crude frequency simulator 로 portfolio shift in vehicle holdings 까지 포함한 가솔린 demand elasticity 사후 평균 −0.7601. 비탄력적 결과는 한국 가솔린 세제 정책의 단기 효과 제한을 시사. 한계는 (i) 1998 single cross-section, (ii) 293 sample size 가 MNP 의 high-dim covariance 식별에 빠듯, (iii) 연속 변수 식 1 개로 단순화 (general form 은 J 개 가능).

핵심 결과

Posterior mean 주요 계수 (Table 2)

식	변수	사후 평균	SE
Vehicle ownership	ln(INCOST)	+3.385	1.385
Vehicle ownership	VCOST	−0.0018	0.0039
Vehicle ownership	AOH (standard·luxury)	+0.0079	0.0074
Vehicle use (VKM)	constant	+36.380	5.558
Vehicle use (VKM)	VCOST	−0.173	0.068
Vehicle use (VKM)	INCOME	+0.071	0.069
Variance-covariance	σ(η₁η₁)	151.99	16.66

정량 결론. Vehicle use 식에서 variable cost (won/km) 가 유의하게 음수 (−0.173) — 운행거리는 비용에 반응. Posterior mean 으로 시뮬레이트한 gasoline demand price elasticity = −0.7601 — 비탄력적.

방법론 노트

표준 simulated MLE (GHK simulator) 는 (i) likelihood 가 비-trivial 한 정규 적분, (ii) optimization 의 global maximum 보장 안 됨, (iii) finite-sample asymptotic approximation 의 부정확성 — 특히 variance-covariance 모수 — 문제를 안고 있다. Bayesian Gibbs sampler 는 Markov chain 의 stationary 분포가 posterior 와 일치 하는 성질을 이용해 위 셋을 동시 회피한다 (McCulloch-Rossi 1994 pp. 207-210).

핵심 식. Discrete-continuous joint:

W_i^* = X_i \beta + \varepsilon_i, \quad \varepsilon_i \sim N(0, \Sigma)

여기서 $W_i^* = (d_i^{*\prime}, q_i^{*\prime})'$ , $d_i^*$ 는 $(J-1) \times 1$ relative utility, $q_i^*$ 는 latent continuous demand. Identification 제약 $\sigma_{(\nu_1, \nu_1)} = 1$ 하에 $\Sigma$ 를 $(\gamma, \Phi)$ 로 reparameterize:

\Sigma = \begin{bmatrix} 1 & \gamma' \\ \gamma & \Phi + \gamma\gamma' \end{bmatrix}

Gibbs sampler 의 4-step block:

W^* | \beta, \gamma, \Phi, d, q, X \;\to\; \beta | \cdots \;\to\; \Phi | \cdots \;\to\; \gamma | \cdots

각 block 은 truncated multivariate normal 또는 Wishart conditional posterior — Albert-Chib (1993) accept/reject 로 draw. 식별은 (i) $\sigma_{11}=1$ 제약, (ii) Wishart prior $\Phi^{-1} \sim W(\kappa, C)$ + normal prior $\gamma \sim N(h, B^{-1})$ , (iii) ranked-choice 응답이 single-choice 보다 information 풍부.

연구 계보

본 paper 는 두 literature stream 의 합집합 위치: (i) Dubin-McFadden (1984), Hensher-Milthorpe-Smith (1990) 의 consumer durables discrete-continuous choice (vehicle holdings + use, residential appliance + electricity 등) framework, (ii) Albert-Chib (1993), McCulloch-Rossi (1994), McCulloch-Polson-Rossi (2000) 의 MNP Bayesian Gibbs sampler literature. 본 paper 의 contribution 은 (ii) 의 sampler 를 (i) 의 결합 framework 로 확장한 technical note. 김연배 author page 의 제1기 (Berkeley/ETRI 2000-2006) 방법론 기반 구축 으로 분류 — 본 paper 는 그 시기의 가장 방법론-중심 작업으로, 이후 Effects of consumer preferences on the convergence of mobile telecommunications devices 의 mobile device convergence 분석, Consumer preferences for alternative fuel vehicles in South Korea 의 alternative fuel vehicle 분석 등 Bayesian MNP/mixed logit 응용 시리즈의 방법론 토대를 제공한다 (author page 제1기 분류). 같은 기술경영경제정책전공 demand-analysis 라인의 자매 작업으로 Evaluation of Technological Innovation in the Cellular Phone Display 가 같은 시기 conjoint analysis 의 rank-ordered logit 응용으로 존재.

인접 그래프

1-hop 이웃 14개

인물 1
개관 1
방법론 2
수록처 1
분류 2
논문 7

휠 = 확대/축소 · 드래그 = 이동 · hover = 강조 · 클릭 = 페이지 이동

이 문서를 가리키는 페이지

논문 (4)

인물 (1)

김연배