Redefining the role of investors in South Korea's startup ecosystem: A network analysis and explainable AI approach


Hojune Cha, Yeokyung Hwang, 황준석, Junmin Lee (2026) · Journal of Small Business Management · DOI ↗

한국 post-catch-up-paradigm startup 생태계의 이질적 투자자 (Accelerator AC, Venture Capital VC, Financial Institution FI) 의 네트워크 구조-행동 차별화 를 측정한다. Innoforest DB 의 338 investor × 3,570 startup × 15,419 투자 transaction (2019~2023) 으로 양자 네트워크 (3,908 노드 / 11,679 엣지) 구축. 5 개 연결중심성·매개 중심성·고유벡터 중심성·closeness·harmonic centrality + 5 개 firm-level 속성 (capital, 투자 횟수, TIPS 운영자 지위 등) 을 입력으로 xgboost 분류기 학습 (AUC-Macro 0.96, AUC-Weighted 0.95), shap 으로 해석. AC = TIPS-driven early-stage brokerage, VC = network hub coordination, FI = late-stage commercialization 의 차별된 role 식별.

  • RQ: (1) 한국 startup 생태계에서 투자자 이질성은 구조적·행동적 패턴 으로 어떻게 드러나는가? (2) 네트워크 위치와 engagement 행동이 어떻게 구조적 role 차별화 (brokerage / hub / commercialization) 와 연결되는가?
  • 방법론: 사회 네트워크 분석, 기계학습 (xgboost), 설명가능 인공지능 (shap), 연결중심성, 매개 중심성, 고유벡터 중심성
  • 데이터: Innoforest DB — 338 investor, 3,570 startup, 15,419 투자 transaction (20192023). 양자 네트워크 3,908 노드 / 11,679 엣지. 투자자 재분류 (10 → 3 cohort): AC 70, VC 153 (domestic + foreign), FI 39 (FI + asset mgmt + tech holding). Startup 단계: Seed 32.9%, Pre-A 16.4%, Series A 25.1%, B 13.5%, C 4.1%, DPre-IPO 3.2%, M&A 3.8%, IPO 0.9%
  • 주요 발견: XGBoost AUC-Macro 0.96 / AUC-Micro 0.98 / AUC-Weighted 0.95. SHAP global importance: Capital 이 모든 cohort 분류의 핵심 feature (FI ≈1.0 > VC ≈0.6 > AC ≈0.15) — 단계별 투자 규모 차별을 반영 (AC 110 억, VC 10100 억, FI 100 억1 조 KRW). TIPS operator status 가 AC 분류에 ≈0.85 로 결정적 (정부 매칭 펀드 100M900M KRW). VC 는 network centrality 가 상대적으로 우세 → hub coordination role. FI 는 IPO 관련 feature (≈0.15) 유의 → exit 지향
  • 시사점: Top-down 정부 주도 (TIPS, Global Unicorn Project, R&D 특구) 의 latecomer 생태계에서 투자자는 capital 공급자 가 아닌 knowledge broker·mentor·innovation enabler. 정책 설계는 유형별 role 분담 (AC 초기 brokerage, VC hub coordination, FI commercialization) 을 명시 반영해야

투자자-스타트업 네트워크 (Fig 2): 3,908 노드 (338 investor + 3,570 startup) × 11,679 엣지. AC 는 outer boundary 에서 초기 단계 startup 과 연결 (high betweenness, brokerage), VC 는 중앙 (high degree, hub coordination), FI 는 innermost (low degree, deep commercialization 집중). 노드 크기 = total degree, 평균 degree 2.988, weighted degree 3.594, diameter 10, 평균 path length 4.101. 본 논문이 [[xgboost]] + [[shap]] 으로 정량 분류하는 구조-행동 패턴의 visualization.

요약

본 연구는 한국이 catch-up (모방·rapid scaling) 에서 post-catch-up (originality·convergence·risk tolerance, Lee & Lee 2021, Lee & Lim 2001) 으로 전환하는 국면에서 투자자의 이질성을 네트워크 임베디드 현상 으로 재정의한다. 기존 문헌은 (i) 투자자 유형 categorical 구분 (Alvedalen & Boschma 2017, Cohen 2013, Fernandes & Ferreira 2022), (ii) public vs private 자금 성과 비교 (Grilo et al. 2017), (iii) 단순 capital/exit 지표 (Liu et al. 2020 일부 예외) 에 머물러, 투자자 이질성이 어떻게 네트워크 구조와 행동 패턴으로 발현되는지를 묻지 않았다. 본 paper 는 Hochberg-Sorenson-Stuart (2007, 2001) 의 VC 네트워크 frame 위에 model-driven 설명가능 인공지능 approach 를 결합해 그 공백을 메운다.

데이터: Innoforest DB (한국 공식 transaction 의 대다수) — 338 investor, 3,570 startup, 15,419 transaction (2019~2023). 투자자 10 개 raw type 을 규제·기능적 유사성에 따라 3 cohort 로 재분류 (AC 70, VC 153, FI 39, 잔여 cohort 제외). 양자 (bipartite) 투자 네트워크: 3,908 노드 (338 investor + 3,570 startup), 11,679 엣지 (isolate 와 비 AC/VC/FI 투자자 제거 후). 평균 degree 2.988, weighted degree 3.594, diameter 10, 평균 path length 4.101 — sparse 네트워크이나 일부 strong-tie hub 존재.

방법론 chain: (1) Feature engineering — 5 개 사회 네트워크 분석 centrality (degree, eigenvector, closeness, harmonic, betweenness) + 5 개 firm-level (IPO 지위, capital 자본, 투자 기업 수, 투자 횟수, TIPS operator 지위). 결측치는 mode/mean impute, capital 의 skewness 6.47 은 log 변환. (2) Classifier — Chen & Guestrin (2016) xgboost (eXtreme Gradient Boosting) 으로 nonlinear 패턴·feature interaction 자동 학습. 5-fold CV + grid search hyperparameter 튜닝. 80:20 train/test split. (3) Interpretability — Lundberg & Lee (2017) shap (SHapley Additive exPlanations) 의 game-theoretic 분해로 (a) global feature importance, (b) waterfall plot (case-level), (c) beeswarm (distribution + 방향성). 모델 성능: AUC-Macro 0.96, AUC-Micro 0.98, AUC-Weighted 0.95 — 클래스 불균형 하에서도 안정적 분류.

핵심 발견 — SHAP global 분석 결과 capital 이 모든 cohort 의 가장 중요한 분류 feature (FI ≈1.0 > VC ≈0.6 > AC ≈0.15) 로 단계별 투자 규모 (AC 110 억, VC 10100 억, FI 100 억1 조 KRW) 의 systematic 차이를 반영. AC 분류는 TIPS operator status (≈0.85) 가 결정적 — 정부 매칭 펀드의 거버넌스 신호. VC 는 network centrality 지표 (특히 degree, closeness) 가 상대적으로 우세 — hub coordination 역할. FI 는 IPO 관련 feature 가 유의 (≈0.15) — exit 지향. Case-level waterfall plot 도 AC 의 200 번째 sample (AC probability 84.7%) 에서 TIPS (+0.25) + capital 19.9 억 KRW (+0.20) + 투자 기업 수 14 (+0.15) + low betweenness 0.00258 (+0.15) 의 누적 기여를 보임. 이론적 함의: investor heterogeneity 는 단순 capital scale 차이가 아니라 network 위치 + 단계 + institutional logic 의 결합 — Sorenson & Stuart (2001) 의 social proximity, Hochberg et al. (2007) 의 VC network reputation 명제의 한국 post-catch-up 맥락 정량 확장. 황준석 author page anchor 의 *제 5 기 (글로벌 스마트시티와 AI, 20242026)* 의 “네트워크 구조와 혁신”, “AI 와 국가 경쟁력” 실타래의 결정적 방법론 융합 (SNA + XAI).

핵심 결과

Investor CohortN핵심 SHAP featureNetwork role투자 단계
AC (Accelerator)70TIPS operator (≈0.85), capital (≈0.15), low betweennessEarly-stage brokerage, structural hole 메우기Seed, Pre-A
VC (Venture Capital)153Capital (≈0.6), degree/closeness centrality 우세Hub coordination, follow-on roundsSeries A~C
FI (Financial Institution)39Capital (≈1.0), IPO 지표 (≈0.15)Commercialization, exitSeries D~Pre-IPO, M&A, IPO

XGBoost 분류 성능: AUC-Macro 0.96, AUC-Micro 0.98, AUC-Weighted 0.95. N investor = 261 (AC 70 + VC 153 + FI 39 reclassified, 잔여 77 제외), N startup = 3,570, N edge = 11,679 (raw transaction 15,419 → isolate · non-AC/VC/FI 제외 후).

Capital 변동성: Mean 1.76 × 10¹¹ KRW, SD 7.64 × 10¹¹, Max 7 × 10¹², skewness 6.47 — 소수 거대 firm 의 자본 집중. 네트워크 centrality 분포: degree mean 43.42 (Max 257), eigenvector mean 0.11, closeness mean 0.27, betweenness mean 0.01 — 대부분 투자자가 limited 구조적 영향, 소수 hub.

Network 통계: 3,908 노드, 11,679 엣지, 평균 degree 2.988, weighted degree 3.594, diameter 10, 평균 path length 4.101. AC 는 outer boundary (브로커리지), VC 는 중앙 (허브), FI 는 innermost (commercialization).

방법론 노트

핵심 식별 전략은 predictive modeling 을 설명가능 인공지능 interpretation 으로 전환. 전통적 econometric model 은 nonlinear interaction (예: TIPS × capital × centrality) 을 사전 명시해야 하지만 xgboost 는 자동 학습. shap 은 게임이론적 Shapley value 로 feature 의 marginal contribution 을 분해해 black-box 를 투명화.

핵심 식:

ϕi=SF{i}S!(FS1)!F![f(S{i})f(S)]\phi_i = \sum_{S \subseteq F \setminus \{i\}} \frac{|S|! (|F| - |S| - 1)!}{|F|!} \left[ f(S \cup \{i\}) - f(S) \right] y^(x)=ϕ0+i=1Mϕi\hat{y}(x) = \phi_0 + \sum_{i=1}^{M} \phi_i

여기서 ϕi\phi_i 는 feature ii 의 SHAP value (모든 가능한 feature subset SS 에 대한 marginal contribution 의 가중 평균), FF 는 feature 집합, ff 는 학습된 분류 모델, ϕ0\phi_0 은 baseline expectation. XGBoost 분류기는 Chen & Guestrin (2016) 의 gradient boosting + regularization (overfitting 방지). 5-fold CV + grid search 로 hyperparameter (tree depth, learning rate, n_estimators, min_samples_split) 튜닝. 평가는 AUC-Macro/Micro/Weighted 로 class imbalance robust. 해석: (a) global feature importance (mean |SHAP|), (b) waterfall (개별 case 의 cumulative contribution), (c) beeswarm (전체 distribution + sign). 식별의 핵심 — supervised classification 결과 자체가 constructed truth 가 아니라 학습된 패턴 이므로, SHAP 해석이 “투자자 type 이 어떻게 differentiated 되는가” 의 ground evidence.

연구 계보

본 연구는 세 갈래 문헌을 통합한다. 첫째, startup ecosystem & investor heterogeneity — Alvedalen & Boschma (2017), Cohen (2013), Cohen et al. (2019), Fernandes & Ferreira (2022), Stam & van de Ven (2021), Spigel & Harrison (2018), Grilo et al. (2017). 둘째, VC/investor network science — Hochberg et al. (2007) VC reputation network, Sorenson & Stuart (2001) social proximity, Liu et al. (2020) 투자자 network 위치 → valuation, Yang et al. (2020) co-investment clustering, Ancona et al. (2023), Bonaventura et al. (2020), Carniel et al. (2023). 셋째, explainable AI 방법론 — Chen & Guestrin (2016) XGBoost, Lundberg & Lee (2017) SHAP, Arrieta et al. (2020), Molnar (2020), Guidotti et al. (2019). 한국 post-catch-up 맥락: Lee & Lim (2001), Lee & Lee (2021), Lee & Choi (2024), Yim et al. (2024), Hemmert et al. (2023), Rao et al. (2023).

황준석 author page anchor 의 제 5 기 (글로벌 스마트시티와 AI, 2024~2026) 의 “네트워크 구조와 혁신” 실타래 — author page 도 본 paper 를 “투자자를 자본 공급자가 아니라 지식 중개자·멘토·혁신 촉진자로 재정의” + “네트워크 분석 + XAI 의 방법론적 혁신” 으로 명시. Unveiling the Enduring Debate: An Empirical analysis of Venture Capital's Impact on Innovation in South Korea 의 VC 영향력 거시 실증과 자매 (전자는 패턴 식별, 후자는 인과 평가). How similar should collaborators be in inter-organizational learning: Optimal cognitive proximity and knowledge complexity 와 함께 Yeokyung Hwang 의 patent/투자자 network 라인의 한국 startup 응용. The power of regional centrality: specialization, diversity, and their effects on regional economic growth 의 자동차 inter-firm 거래망 라인의 startup 자매.

See also

인접 그래프

1-hop 이웃 19
  • 인물 4
  • 방법론 6
  • 개념 1
  • 주제 2
  • 수록처 1
  • 분류 1
  • 논문 4
황준석Hojune ChaJunmin LeeYeokyung Hwang고유벡터 중심성기계학습매개 중심성사회 네트워크 분석설명가능 인공지능연결중심성투자자 이질성스타트업 생태계Venture CapitalJournal of Small …혁신 경제학 Redefining the role o…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동