Who to collaborate: Exploring the role of knowledge overlap between inventors in innovation performance


Jisoo Hur, Seokhui Lee, 황준석, Keungoui Kim (2026) · Technological Forecasting & Social Change 224:124483 · DOI ↗

EPO PATSTAT + Compustat + Arora et al. (2021) matched dataset 으로 4,661 US-headquartered 상장사 1980-2015 patent 의 intra-firm inventor-pair 3,352,202 쌍 (1,259,964 patents) 을 분석. Kavusan et al. (2016) 류 patent-class 유사도 (Bhattacharyya-style) 로 측정한 knowledge overlappatent output (Hyp 3, β=+0.001~+0.002***) 은 단조 증가시키지만 patent impact (forward citation, Hyp 1) 와 patent distinctiveness (CPC 4-digit pair 의 firm-내 newness, Hyp 2) 와는 U-shaped — Overlap² 계수 양 유의 (impact +0.002***, distinctiveness +1.569***). 중간 overlap 이 최악, 극단 (very low cognitive diversity / very high deep shared expertise) 양쪽이 최상.

  • RQ: Inventor 쌍의 knowledge overlap 이 patent output, impact (forward citation), distinctiveness (firm 포트폴리오 내 새로움) 에 미치는 함수형은 무엇이며, 단조인가 U-자 곡선인가
  • 방법론: 특허 분석 (CPC 4-digit), pooled-ols (output·impact, unbalanced panel 의 2,317,901 distinct group 때문), 로지스틱 회귀 (binary distinctiveness), 음이항 회귀 (count distinctiveness robustness), Kavusan et al. (2016) 의 patent-class overlap 측정
  • 데이터: PATSTAT 1980-2015 US-headquartered 4,661 상장사 patent + Compustat (ROA, R&D, 규모) + Arora et al. (2021) matched dataset; 3,352,202 inventor-pairs on 1,259,964 patents; 약 4.9% multi-firm inventor 제외, intra-firm 만 분석; unbalanced panel (2,317,901 distinct groups — 대부분 1 회만 등장)
  • 주요 발견: (Table 3, Pooled OLS) Overlap → Impact β=-0.001~-0.004***, Overlap² → Impact β=+0.002*** (Hyp 1 U-shape 지지); Overlap → Output β=+0.001~+0.002***, Overlap² → Output β=-0.001*** (Hyp 3, 다만 [0,1] 범위 내 단조 증가 해석); (Table 4, Logistic) Overlap → Distinctiveness β=-2.215***, Overlap² β=+1.569*** (Hyp 2 U-shape 지지); 추가 Table 7 — Impact_top5 (5% breakthrough) Overlap² β 양 유의, Impact_nocit (citation 0) Overlap² β 음 유의 (inverted-U), Output_top5 Overlap 양 유의
  • 시사점: 협업 design 은 극단 선택 (very low cognitive diversity 또는 very high deep shared expertise) 이 둘 다 안전, 중간 overlap 은 가장 회피해야 — moderate familiarity 가 coordination cost ↑ + recombinant 다양성 ↓ 동시 발생; firm 의 R&D 매칭 정책은 ‘diversity 최대화’ vs ‘specialization’ 의 이분법이 아닌 U-자 양 끝점 으로 운영

Inventor 쌍의 knowledge overlap 과 patent output / impact / distinctiveness 의 U-자 관계 시각화

요약

team-diversity 와 innovation 의 관계는 광범위하게 연구됐지만 (Singh and Fleming 2010, Fitzgerald and Liu 2020, Bernstein et al. 2022), with whom should I collaborate? 라는 dyadic 질문 — knowledge overlap 자체가 협업 산출에 미치는 함수형 — 은 거의 다뤄지지 않았다. 본 paper 는 Page (2007) 의 cognitive diversity, Neffke (2019) 의 knowledge complementarity 를 dyadic level 로 환원해 U-shaped 가설을 세운다.

이론적 직관은 두 단계. (i) Overlap 이 낮으면 cognitive diversity 가 새 ideas 의 recombinant 가능성을 키워 high impact, 외부 영역에 receptivity 가 커서 coordination cost 도 작음. (ii) Overlap 이 중간이면 partial familiarity 때문에 새 관점 수용 비용 ↑ + recombinant 다양성 ↓ — 최악. (iii) Overlap 이 매우 높으면 shared deep expertise 로 coordination cost 가 다시 작아져 niche breakthrough 가능. Output 은 별개 — overlap 높을수록 communication 효율로 patent 만 단조 증가.

데이터는 PATSTAT 1980-2015 US-headquartered 상장사 4,661 곳의 patent. Arora et al. (2021) 의 PATSTAT-Compustat matched dataset 로 회사명·소유구조 변경 문제 (M&A 등) 해소. Intra-firm inventor-pair 만 분석 (4.9% multi-firm 제외) — 3,352,202 쌍 / 1,259,964 patents. unbalanced panel (2,317,901 distinct groups, 대부분 1 회만 등장) 이므로 individual fixed effects 가 적절치 않아 pooled-ols + 산업·시기 dummy 사용. 측정변수 — Overlap 은 Kavusan et al. (2016) Bhattacharyya-style kP(k,i,t)P(k,j,t)/PatentsitPatentsjt\sum_k \sqrt{P(k,i,t)P(k,j,t)}/\sqrt{Patents_{it}Patents_{jt}}, Impact 는 5 년 forward citation, Output 은 patent count, Distinctiveness 는 CPC 4-digit pair 가 firm-내 첫 출현인가의 binary.

결과의 핵심은 세 종속변수의 함수형 차이. Impact 와 Distinctiveness 는 Overlap² 양 유의로 U-shape (Hyp 1, 2 지지). Output 은 Overlap 단조 증가 (Hyp 3), Overlap² 음 유의지만 [0,1] 범위 내 peak 가 1 에서 — 사실상 단조. 추가 분석 Table 7 (Impact_top5 = top 5% breakthrough): Overlap 음 + Overlap² 양 유의로 breakthrough 도 U-shape. Impact_nocit (citation 0, poor) 는 Overlap 양 + Overlap² 음 (inverted-U) — 중간 overlap 이 poor 가능성도 가장 큼. Output_top5 도 Overlap 양 유의 — productivity 측면에선 overlap 무조건 양.

Robustness 5 종 — (i) CPC 4-digit count 기반 Overlap (Table 5, 6), (ii) 2 인 team only (Appendix A), (iii) 2011-2015 recent period (Appendix B), (iv) NAICS 2-digit 18 산업 dummy (Appendix C), (v) manufacturing 의 3 sub-industry dummy (Appendix D). 모든 robustness 에서 결과 일관. VIF 최대 3.59 (평균 2.35) 로 multicollinearity 우려 작음. 한계는 (i) intra-firm 한정 (inter-firm collaboration 제외), (ii) US-headquartered 만, (iii) 단방향 인과 해석 (overlap → outcome) 이지만 partner selection endogeneity 잠재. 황준석 · Keungoui Kim 의 5 기 (2024-2026) inventor-network / 특허 분석 라인의 핵심 dyadic 작업, The moderating role of design innovation in the relationship between technology complexity and firm performance 와 sibling.

핵심 결과

Table 3 (Pooled OLS, N=3,352,202):

Dep. varOverlapOverlap²F
Impact (M3)-0.004* (0.000)+0.002* (0.000)0.06615,726***
Output (M5)+0.001* (0.000)0.13236,275***
Output (M6)+0.002***-0.001*** ([0,1] peak at 1)0.13434,475***

Table 4 (Logistic, N=3,352,202):

Dep. varOverlapOverlap²Pseudo R²LR χ²
Distinctiveness (M3)-2.215* (0.060)+1.569* (0.044)0.268387,182***

Table 7 (Logistic, extreme outcomes):

Dep. varOverlap βOverlap² β해석
Impact_top5 (5% breakthrough)음 유의양 유의U-shape — 극단 overlap 이 breakthrough
Impact_nocit (citation 0)양 유의음 유의Inverted-U — 중간 overlap 이 poor 도 양산
Output_top5 (5% prolific)양 유의단조 — overlap 높을수록 다작

기술통계: Overlap 평균 0.630 (SD 0.270, [0,1]), inventor pair 평균 patent count 0.006 (Inv_prod), tenure 평균 9.4 년.

방법론 노트

Knowledge overlap 측정은 Kavusan et al. (2016) 의 Bhattacharyya-style cosine 변형 — inventor 쌍의 patent-class 분포 벡터 유사도:

Overlapijt=kP(k,i,t)P(k,j,t)PatentsitPatentsjtOverlap_{ijt} = \frac{\sum_k \sqrt{P(k,i,t) \cdot P(k,j,t)}}{\sqrt{Patents_{it} \cdot Patents_{jt}}}

여기서 P(k,i,t)P(k,i,t) 는 inventor iitt 시점까지 누적 patent class kk count, PatentsitPatents_{it} 는 총 patent count. [0,1][0,1] 범위로 0 = 완전 disjoint, 1 = 완전 일치. Identification idea 는 (i) Overlap + Overlap² 동시 진입으로 U-shape 검정 (Overlap² 양 유의 = U), (ii) 종속변수 3 종 — Output (count, OLS), Impact (continuous, OLS), Distinctiveness (binary, logistic) — 의 함수형 차이 자체가 output ↑ vs quality ↑ 의 trade-off 식별 증거, (iii) Top-5%·no-citation 같은 극단 outcome 의 logistic 으로 평균 효과를 넘어 breakthrough vs failure 양극단 분포 분리.

Patent count 의 overdispersion 처리는 Table 6 의 음이항 회귀 (4-digit CPC pair 개수 종속). Unbalanced panel 이 distinct group 수 (2.3M) > 관측치/2 이므로 individual FE 대신 산업·시기 dummy 로 통제.

연구 계보

Team diversity 와 innovation 라인 — Singh and Fleming (2010) lone vs team breakthrough, Fitzgerald and Liu (2020) 문화적 다양성, Taylor and Greve (2006) 다양성-exploration, Bernstein et al. (2022) immigrant-native 통합. Cognitive diversity 이론 — Page (2007) cognitive diversity, Hong and Page (2004) diverse solver outperform expert, Janis (1972) groupthink. Knowledge complementarity — Neffke (2019). Patent-based dyadic 측정 — Kavusan et al. (2016) firm-pair technological overlap (본 paper 가 inventor-pair 로 환원). Inventor-network 구조 — Ahuja (2000), Guan and Liu (2016), Dibiaggio et al. (2014), Singh (2005), Wang et al. (2014, 2024). PATSTAT-Compustat matching — Arora et al. (2021). Forward citation 으로 quality 측정 — Trajtenberg (1990), Ernst (2001), Squicciarini et al. (2013). 직접 sibling 으로 The moderating role of design innovation in the relationship between technology complexity and firm performance (동일 1 저자 1 그룹) — 둘 다 patent-based innovation measurement 라인. 황준석 5 기 (2024-2026) 의 특허 분석 / inventor-network 라인, Keungoui KimWhich technology diversification index should be selected?: Insights for diversification perspectives / A dynamic framework for analyzing technology standardisation using network analysis and game theory 와 sibling.

See also

인접 그래프

1-hop 이웃 17
  • 인물 4
  • 방법론 3
  • 개념 1
  • 주제 2
  • 수록처 1
  • 분류 1
  • 논문 5
황준석Jisoo HurKeungoui KimSeokhui Lee로지스틱 회귀음이항 회귀특허 분석지식 중첩발명자 협업혁신 성과Technological For…혁신 경제학 Who to collaborate: E…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동