Dynamic patterns of AI technology diffusion: focusing on time series clustering and patent analysis


Soyea Lee, 황준석, Eunsang Cho (2025) · Scientometrics · DOI ↗

AI 가 General Purpose Technology (GPT) 로 성장할 수 있는지 여부를, 6,852 USPTO AI 특허 (2011-2020) 의 forward citation 시계열로 Dynamic Time Warping (DTW) + K-means 시계열 군집화로 매핑. 5 개 patent index — generality (forward citation 의 기술 분포, Hirschman-Herfindahl 기반), originality (backward citation 의 기술 분포), complementarity (특허의 IPC4 종류 수), technology cycle time (TCT, backward citation 의 median age), radicalness (특허와 backward citation 의 IPC4 차이) — 를 다차원 indicator 로 사용. Phase 1 (2011-2015, 1,228 originating patent) 과 Phase 2 (2016-2020, 5,624 patent) 비교로 시간 진화 추적. 4 cluster 식별 (silhouette score 0.68 / 0.74).

  • RQ: AI 특허의 technological pervasiveness 가 (i) 시간에 따라, (ii) diffusion level 에 따라, (iii) AI sub-technology type 에 따라 어떻게 다른 확산 패턴을 보이는가.
  • 방법론: Dynamic Time Warping (DTW) 으로 unequal-length 시계열 similarity 측정 → K-평균 군집화 time series clustering (silhouette score 평가). 다섯 patent index 계산. Welch’s t-test (heteroscedastic 변량) + Games-Howell post-hoc + Welch’s ANOVA.
  • 데이터: USPTO Bulk Data + Google Patent Search, 2022.09 수집. WIPO (2019, 2022) CPC code + “artificial intelligence” 검색 키. 총 520,613 특허 — 6,852 originating + 343,975 backward + 169,786 forward. Phase 1 (2011-2015): 1,228 originating, Phase 2 (2016-2020): 5,624 originating.
  • 주요 발견: (i) 5 patent index 모두 phase 1 vs phase 2 에서 유의한 차이 (Welch’s t-test, all heteroscedastic). (ii) 4 cluster 식별 — Cluster 1 이 압도적 다수 (Phase 1 80.2%, Phase 2 88.7%, 대부분 점진적 확산), 소수 cluster 가 explosive diffusion 패턴. (iii) Phase 2 의 silhouette 0.74 > Phase 1 의 0.68 — 시간 경과로 AI 의 cluster 분화가 더 뚜렷해짐. (iv) AI sub-tech type (fuzzy logic, ML, computer vision, NLP 등 WIPO 14 카테고리) 별로 indices 분포 상이.
  • 시사점: AI 정책이 단일 처방이 아니라 (i) diffusion stage, (ii) sub-technology type, (iii) pervasiveness index 별로 차별화된 접근 필요. AI 의 GPT 잠재력 실증 — Phase 2 에서 generality 증가 등 GPT-like 특성 발현.

DTW (Dynamic Time Warping) + patent citation 시계열 데이터 — 두 patent A=(a1,...,am), B=(b1,...,bn) 의 길이가 달라도 cumulative distance D(i,j) 최소화로 alignment 매칭. 본 paper 가 AI 확산 분석에 DTW 를 도입한 핵심 시각화.

요약

황준석 의 5기 (AI 와 국가 경쟁력 · 토픽 모델링·계량 분석) 라인의 patent analysis 분기. Soyea Lee 의 SNU TEMEP 박사 라인 + Eunsang Cho 의 SNU Institute of Computer Technology 협력. 자매 paper 로는 AI technology specialization and national competitiveness (국가별 AI 특화), Measuring ethics level of technological topics using phylogenetic tree (AI ethics phylogenetic), Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling (HI 토픽) 이 같은 5기 AI 분기. 기존 AI 영향 연구의 한계는 (i) AI 가 GPT 가 될지 정량 측정 어려움 — early stage 라 spillover 효과 추정 곤란, (ii) TLC (Technology Life Cycle) 연구가 patent stage 차이는 분석했지만 patent 간 차이는 무시. 본 paper 가 두 한계를 동시 극복 — DTW 로 micro-perspective (각 patent trajectory), 5 multidimensional pervasiveness index 로 GPT 잠재력 정량화.

방법론은 4 단계. (i) 데이터 수집: WIPO (2019) 의 AI 카테고리 — 5 technique (fuzzy logic, logic programming, ML, ontology, probabilistic reasoning) + 9 functional application (computer vision, control, distributed AI, knowledge representation, NLP, planning, predictive analytics, robotics, speech). USPTO + Google Patent Search 로 520,613 특허 수집. (ii) 5 patent index 계산: generality (Trajtenberg et al. 1997, forward citation 분포의 Hirschman-Herfindahl 변형), originality (backward citation 분포), complementarity (Lerner 1994, IPC4 종류 수), TCT (Kayal 1999, backward median age), radicalness (Shane 2001, IPC4 차이 비율). (iii) DTW: forward citation 시계열의 unequal length 를 cumulative distance 최소화로 alignment. (iv) K-means time series clustering + silhouette score 로 k=4 결정. 마지막 cluster 별 ANOVA + post-hoc 로 indices 차이 검증.

핵심 발견 셋. 첫째, Phase 1 vs Phase 2 모든 5 indices 유의 차이 (Welch’s t-test) — heteroscedastic 변량으로 standard ANOVA 부적합. 둘째, cluster 1 (대부분 patent, 점진적 확산) vs cluster 2-4 (explosive diffusion 또는 outlier) — AI 의 대부분 patent 는 GPT 라기보다는 일반 incremental, 일부만 GPT-like. 셋째, Phase 2 에서 silhouette score 향상 (0.68 → 0.74) — AI cluster 분화 명확. 한계: USPTO 단일 데이터, 10 년 기간, AI 의 emerging stage 라 long-term GPT 여부 미확정.

핵심 결과

Cluster 분포 (K-means + silhouette):

Phase기간n (originating)SilhouetteC1 (점진)C2C3 (outlier)C4
12011-20151,2280.6793985 (80.21%)44 (3.58%)2 (0.16%)197 (16.04%)
22016-20205,6240.73984,988 (88.69%)88 (1.56%)2 (0.04%)546 (9.71%)

5 Patent Index (technological pervasiveness):

Index정의Range
Generalityforward citation 의 기술 분포 (HHI 변형) — GPT 지표[0, 1]
Originalitybackward citation 의 기술 분포 — 지식 통합 폭[0, 1]
Complementarity특허의 IPC4 distinct 수 — 기술 범위N\mathbb{N}
TCTbackward citation 의 median age (years) — 진행 속도N\mathbb{N}
Radicalness특허와 backward citation 의 IPC4 차이 비율 — 새로움[0, 1]
  • 데이터 규모: 520,613 특허 (6,852 originating + 343,975 backward + 169,786 forward).
  • Phase 2 의 cluster 1 지배 (88.7%) → 대부분 AI 특허는 점진 확산, 소수만 GPT-like explosive 패턴.
  • 모든 5 indices: Welch’s t-test 로 Phase 1 vs Phase 2 유의 차이 (모두 heteroscedastic).

방법론 노트

Dynamic Time Warping (DTW, Sakoe & Chiba 1978, Müller 2007) — 두 시계열 길이가 다를 때의 similarity 측정. Euclidian distance 가 길이 다를 때 부적합하므로 DTW 사용.

Point distance:

d(ai,bj)=(aibj)2d(a_i, b_j) = (a_i - b_j)^2

Cumulative distance (DP):

D(i,j)=d(ai,bj)+min{D(i,j1)D(i1,j1)D(i1,j)D(i, j) = d(a_i, b_j) + \min \begin{cases} D(i, j-1) \\ D(i-1, j-1) \\ D(i-1, j) \end{cases}

이 cumulative 가 두 시계열의 optimal alignment 거리. K-means clustering 의 distance metric 으로 사용.

Generality (Trajtenberg et al. 1997):

Generalityi=1k=1n(CitingikCitingi)2\text{Generality}_i = 1 - \sum_{k=1}^{n} \left( \frac{\text{Citing}_{ik}}{\text{Citing}_i} \right)^2

kk 는 citing patent 의 technology class index (IPC4), nn 은 distinct class 수. Hirschman-Herfindahl 변형 — citation 이 다양한 기술 분야에 퍼지면 generality 높음, GPT 지표.

Originality (대칭 구조, backward citation 기준):

Originalityi=1h=1n(CitedihCitedi)2\text{Originality}_i = 1 - \sum_{h=1}^{n} \left( \frac{\text{Cited}_{ih}}{\text{Cited}_i} \right)^2

Complementarity (Lerner 1994 patent scope):

Complementarityi=ni,n{IPC41,,IPC4n},IPC4pIPC4q\text{Complementarity}_i = n_i, \quad n \in \{\text{IPC4}_1, \ldots, \text{IPC4}_n\}, \quad \text{IPC4}_p \neq \text{IPC4}_q

TCT (Kayal 1999):

TCTi=Med(Δt)\text{TCT}_i = \text{Med}(\Delta t)

Δt\Delta t 는 originating patent ii 의 grant date 와 backward citation grant date 차이.

Radicalness (Shane 2001):

Radicalnessi=b=1nUniquebn\text{Radicalness}_i = \sum_{b=1}^{n} \frac{\text{Unique}_b}{n}

bb 는 patent ii 가 cite 한 patent, Uniqueb\text{Unique}_b 는 patent bb 의 IPC4 중 patent ii 에 없는 distinct 수.

통계 검증은 normality (Kolmogorov-Smirnov + Shapiro-Wilk), homogeneity (Levene + Bartlett) 후 heteroscedastic 인 경우 Welch’s t-test + Games-Howell post-hoc, homoscedastic 인 경우 one-way ANOVA + Bonferroni. K-means cluster 수는 silhouette score (-1~1, 클수록 좋음) 로 평가.

연구 계보

황준석 의 5기 (AI 와 국가 경쟁력) 라인의 patent analysis 분기. author page anchor 의 “AI 와 국가 경쟁력” 라인의 직계 자매 — AI technology specialization and national competitiveness (국가별 AI 특화, PLOS ONE), Measuring ethics level of technological topics using phylogenetic tree (phylogenetic + LDA, finance AI), Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling (HI topic), Lee et al. (2022, Scientometrics) 의 AI 기술 수렴 분석 (industry 비교). 같은 author page anchor 의 “네트워크 분석” 라인 중 Technology convergence capability and firm innovation in the manufacturing sector: an approach based on patent network analysis (특허 네트워크로 기업 TC 측정, R&D Management) 가 patent analysis 측 ancestor.

기술적 reference: (i) Patent index: Trajtenberg, Henderson & Jaffe (1997) generality / originality 원조, Lerner (1994) patent scope, Kayal (1999) TCT, Shane (2001) radicalness, Squicciarini et al. (2013) OECD patent quality measurement. (ii) DTW: Sakoe & Chiba (1978), Müller (2007), Li (2015). 적용 영역 — voice recognition (Rabiner & Juang 1993), motion recognition, biology, stock market. (iii) GPT 이론: Feldman & Yoon (2012), Hall & Trajtenberg (2004), Graf & Menter (2022), Hötte et al. (2022) AI as GPT. (iv) TLC 이론: S-curve 의 Ernst (1997) 4 stage, Gao et al. (2013) patent 지표 단계별 차이.

황준석 author page anchor 의 5기 “AI 와 국가 경쟁력” 라인 (2024-2026 의 시기) 의 paper 측 출력. ITPP / GRC / ASPP 프로그램의 정책 함의 측면 (어떤 sub-tech 에 정책 자원 집중할지) 과 연계 가능.

See also

인접 그래프

1-hop 이웃 20
  • 인물 3
  • 방법론 4
  • 개념 1
  • 주제 3
  • 수록처 1
  • 분류 2
  • 논문 6
황준석Eunsang ChoSoyea Lee특허 분석Dynamic Time Warp…K-평균 군집화Time Series Clust…기술 life cycle범용기술Ai Technology Dif…Technological Per…Scientometricsai-researchtechnology-diffus… Dynamic patterns of A…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동