Dynamic patterns of AI technology diffusion: focusing on time series clustering and patent analysis
Soyea Lee, 황준석, Eunsang Cho (2025) · Scientometrics · DOI ↗
AI 가 General Purpose Technology (GPT) 로 성장할 수 있는지 여부를, 6,852 USPTO AI 특허 (2011-2020) 의 forward citation 시계열로 Dynamic Time Warping (DTW) + K-means 시계열 군집화로 매핑. 5 개 patent index — generality (forward citation 의 기술 분포, Hirschman-Herfindahl 기반), originality (backward citation 의 기술 분포), complementarity (특허의 IPC4 종류 수), technology cycle time (TCT, backward citation 의 median age), radicalness (특허와 backward citation 의 IPC4 차이) — 를 다차원 indicator 로 사용. Phase 1 (2011-2015, 1,228 originating patent) 과 Phase 2 (2016-2020, 5,624 patent) 비교로 시간 진화 추적. 4 cluster 식별 (silhouette score 0.68 / 0.74).
- RQ: AI 특허의 technological pervasiveness 가 (i) 시간에 따라, (ii) diffusion level 에 따라, (iii) AI sub-technology type 에 따라 어떻게 다른 확산 패턴을 보이는가.
- 방법론: Dynamic Time Warping (DTW) 으로 unequal-length 시계열 similarity 측정 → K-평균 군집화 time series clustering (silhouette score 평가). 다섯 patent index 계산. Welch’s t-test (heteroscedastic 변량) + Games-Howell post-hoc + Welch’s ANOVA.
- 데이터: USPTO Bulk Data + Google Patent Search, 2022.09 수집. WIPO (2019, 2022) CPC code + “artificial intelligence” 검색 키. 총 520,613 특허 — 6,852 originating + 343,975 backward + 169,786 forward. Phase 1 (2011-2015): 1,228 originating, Phase 2 (2016-2020): 5,624 originating.
- 주요 발견: (i) 5 patent index 모두 phase 1 vs phase 2 에서 유의한 차이 (Welch’s t-test, all heteroscedastic). (ii) 4 cluster 식별 — Cluster 1 이 압도적 다수 (Phase 1 80.2%, Phase 2 88.7%, 대부분 점진적 확산), 소수 cluster 가 explosive diffusion 패턴. (iii) Phase 2 의 silhouette 0.74 > Phase 1 의 0.68 — 시간 경과로 AI 의 cluster 분화가 더 뚜렷해짐. (iv) AI sub-tech type (fuzzy logic, ML, computer vision, NLP 등 WIPO 14 카테고리) 별로 indices 분포 상이.
- 시사점: AI 정책이 단일 처방이 아니라 (i) diffusion stage, (ii) sub-technology type, (iii) pervasiveness index 별로 차별화된 접근 필요. AI 의 GPT 잠재력 실증 — Phase 2 에서 generality 증가 등 GPT-like 특성 발현.

요약
황준석 의 5기 (AI 와 국가 경쟁력 · 토픽 모델링·계량 분석) 라인의 patent analysis 분기. Soyea Lee 의 SNU TEMEP 박사 라인 + Eunsang Cho 의 SNU Institute of Computer Technology 협력. 자매 paper 로는 AI technology specialization and national competitiveness (국가별 AI 특화), Measuring ethics level of technological topics using phylogenetic tree (AI ethics phylogenetic), Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling (HI 토픽) 이 같은 5기 AI 분기. 기존 AI 영향 연구의 한계는 (i) AI 가 GPT 가 될지 정량 측정 어려움 — early stage 라 spillover 효과 추정 곤란, (ii) TLC (Technology Life Cycle) 연구가 patent stage 차이는 분석했지만 patent 간 차이는 무시. 본 paper 가 두 한계를 동시 극복 — DTW 로 micro-perspective (각 patent trajectory), 5 multidimensional pervasiveness index 로 GPT 잠재력 정량화.
방법론은 4 단계. (i) 데이터 수집: WIPO (2019) 의 AI 카테고리 — 5 technique (fuzzy logic, logic programming, ML, ontology, probabilistic reasoning) + 9 functional application (computer vision, control, distributed AI, knowledge representation, NLP, planning, predictive analytics, robotics, speech). USPTO + Google Patent Search 로 520,613 특허 수집. (ii) 5 patent index 계산: generality (Trajtenberg et al. 1997, forward citation 분포의 Hirschman-Herfindahl 변형), originality (backward citation 분포), complementarity (Lerner 1994, IPC4 종류 수), TCT (Kayal 1999, backward median age), radicalness (Shane 2001, IPC4 차이 비율). (iii) DTW: forward citation 시계열의 unequal length 를 cumulative distance 최소화로 alignment. (iv) K-means time series clustering + silhouette score 로 k=4 결정. 마지막 cluster 별 ANOVA + post-hoc 로 indices 차이 검증.
핵심 발견 셋. 첫째, Phase 1 vs Phase 2 모든 5 indices 유의 차이 (Welch’s t-test) — heteroscedastic 변량으로 standard ANOVA 부적합. 둘째, cluster 1 (대부분 patent, 점진적 확산) vs cluster 2-4 (explosive diffusion 또는 outlier) — AI 의 대부분 patent 는 GPT 라기보다는 일반 incremental, 일부만 GPT-like. 셋째, Phase 2 에서 silhouette score 향상 (0.68 → 0.74) — AI cluster 분화 명확. 한계: USPTO 단일 데이터, 10 년 기간, AI 의 emerging stage 라 long-term GPT 여부 미확정.
핵심 결과
Cluster 분포 (K-means + silhouette):
| Phase | 기간 | n (originating) | Silhouette | C1 (점진) | C2 | C3 (outlier) | C4 |
|---|---|---|---|---|---|---|---|
| 1 | 2011-2015 | 1,228 | 0.6793 | 985 (80.21%) | 44 (3.58%) | 2 (0.16%) | 197 (16.04%) |
| 2 | 2016-2020 | 5,624 | 0.7398 | 4,988 (88.69%) | 88 (1.56%) | 2 (0.04%) | 546 (9.71%) |
5 Patent Index (technological pervasiveness):
| Index | 정의 | Range |
|---|---|---|
| Generality | forward citation 의 기술 분포 (HHI 변형) — GPT 지표 | [0, 1] |
| Originality | backward citation 의 기술 분포 — 지식 통합 폭 | [0, 1] |
| Complementarity | 특허의 IPC4 distinct 수 — 기술 범위 | |
| TCT | backward citation 의 median age (years) — 진행 속도 | |
| Radicalness | 특허와 backward citation 의 IPC4 차이 비율 — 새로움 | [0, 1] |
- 데이터 규모: 520,613 특허 (6,852 originating + 343,975 backward + 169,786 forward).
- Phase 2 의 cluster 1 지배 (88.7%) → 대부분 AI 특허는 점진 확산, 소수만 GPT-like explosive 패턴.
- 모든 5 indices: Welch’s t-test 로 Phase 1 vs Phase 2 유의 차이 (모두 heteroscedastic).
방법론 노트
Dynamic Time Warping (DTW, Sakoe & Chiba 1978, Müller 2007) — 두 시계열 길이가 다를 때의 similarity 측정. Euclidian distance 가 길이 다를 때 부적합하므로 DTW 사용.
Point distance:
Cumulative distance (DP):
이 cumulative 가 두 시계열의 optimal alignment 거리. K-means clustering 의 distance metric 으로 사용.
Generality (Trajtenberg et al. 1997):
는 citing patent 의 technology class index (IPC4), 은 distinct class 수. Hirschman-Herfindahl 변형 — citation 이 다양한 기술 분야에 퍼지면 generality 높음, GPT 지표.
Originality (대칭 구조, backward citation 기준):
Complementarity (Lerner 1994 patent scope):
TCT (Kayal 1999):
는 originating patent 의 grant date 와 backward citation grant date 차이.
Radicalness (Shane 2001):
는 patent 가 cite 한 patent, 는 patent 의 IPC4 중 patent 에 없는 distinct 수.
통계 검증은 normality (Kolmogorov-Smirnov + Shapiro-Wilk), homogeneity (Levene + Bartlett) 후 heteroscedastic 인 경우 Welch’s t-test + Games-Howell post-hoc, homoscedastic 인 경우 one-way ANOVA + Bonferroni. K-means cluster 수는 silhouette score (-1~1, 클수록 좋음) 로 평가.
연구 계보
황준석 의 5기 (AI 와 국가 경쟁력) 라인의 patent analysis 분기. author page anchor 의 “AI 와 국가 경쟁력” 라인의 직계 자매 — AI technology specialization and national competitiveness (국가별 AI 특화, PLOS ONE), Measuring ethics level of technological topics using phylogenetic tree (phylogenetic + LDA, finance AI), Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling (HI topic), Lee et al. (2022, Scientometrics) 의 AI 기술 수렴 분석 (industry 비교). 같은 author page anchor 의 “네트워크 분석” 라인 중 Technology convergence capability and firm innovation in the manufacturing sector: an approach based on patent network analysis (특허 네트워크로 기업 TC 측정, R&D Management) 가 patent analysis 측 ancestor.
기술적 reference: (i) Patent index: Trajtenberg, Henderson & Jaffe (1997) generality / originality 원조, Lerner (1994) patent scope, Kayal (1999) TCT, Shane (2001) radicalness, Squicciarini et al. (2013) OECD patent quality measurement. (ii) DTW: Sakoe & Chiba (1978), Müller (2007), Li (2015). 적용 영역 — voice recognition (Rabiner & Juang 1993), motion recognition, biology, stock market. (iii) GPT 이론: Feldman & Yoon (2012), Hall & Trajtenberg (2004), Graf & Menter (2022), Hötte et al. (2022) AI as GPT. (iv) TLC 이론: S-curve 의 Ernst (1997) 4 stage, Gao et al. (2013) patent 지표 단계별 차이.
황준석 author page anchor 의 5기 “AI 와 국가 경쟁력” 라인 (2024-2026 의 시기) 의 paper 측 출력. ITPP / GRC / ASPP 프로그램의 정책 함의 측면 (어떤 sub-tech 에 정책 자원 집중할지) 과 연계 가능.
See also
- 황준석
- Soyea Lee
- Eunsang Cho
- Scientometrics
- Dynamic Time Warping
- 특허 분석
- Ai Technology Diffusion
- 범용기술
- 기술 life cycle
- AI technology specialization and national competitiveness
- Measuring ethics level of technological topics using phylogenetic tree
- Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling
- Technology convergence capability and firm innovation in the manufacturing sector: an approach based on patent network analysis
인접 그래프
- 인물 3
- 방법론 4
- 개념 1
- 주제 3
- 수록처 1
- 분류 2
- 논문 6
이 문서를 가리키는 페이지
논문 (4)
- Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling
- Measuring ethics level of technological topics using phylogenetic tree
- Smart Mobility Solutions for Urban Transportation in ASEAN: A Bibliometric Study of Trends and Innovations
- Unravelling the impact of design-engineering capability on firm performance