Comparing technology convergence of artificial intelligence on the industrial sectors: two-way approaches on network analysis and clustering analysis
Soyea Lee, 황준석, Eunsang Cho (2022) · Scientometrics · DOI ↗
AI 의 기술 융합을 두 방향 접근으로 분석한다. Top-down 은 USPTO AI 특허 209,211 개의 IPC 공동분류 네트워크에 네트워크 분석 의 degree·betweenness centrality 와 ego-network 를 적용해 영향력 있는 산업 부문과 hub 기술을 식별. Bottom-up 은 특허 초록 텍스트에 gaussian-mixture-model (GMM, AIC 기반) + LSA (90% variance) 클러스터링으로 실제 응용 양상을 추출. 금융·관리, 의료, 운송, 반도체, 게임, 바이오 6개 부문이 AI 융합 핵심으로 도출. CAGR 측면에선 운송 41%, 게임 27%, 금융 23% 가 최고 성장률.
- RQ: (1) AI 기술 융합의 주요 산업 부문은 무엇인가? (2) Top-down (IPC 네트워크) 과 bottom-up (특허 텍스트 클러스터) 접근은 어떻게 상보적으로 결합되는가?
- 방법론: 특허 분석 (USPTO Google Patent Datasets via BigQuery), 네트워크 분석 (degree + betweenness centrality, ego-network), gaussian-mixture-model (Python scikit-learn), latent-semantic-analysis (90% explained variance), 텍스트 마이닝 (spaCy lemmatization, bigram TF-IDF)
- 데이터: USPTO 등록 AI 특허 209,211 건 (2000-2019, KIPO 2018 분류 기반 IPC 코드 — Learning/Reasoning, NLP, Computer Vision), 2,517 IPC group-level codes, 36 sectors → 16 분석 sectors (WIPO IPC-concordance, Schmoch 2008)
- 주요 발견: 6 hub sectors: 금융/관리 (12,603 특허, CAGR 23%, CPP 66.87), 의료 (10,218, 17%, 29.79), 운송 (6,426, 41%, 29.01), 반도체 (1,896, 9%, 22.20), 게임 (1,576, 27%, 45.47), 바이오 (1,188, 12%, 29.59). Hub IPC: G06K-009 (패턴 인식, degree 1위 614,610), G06Q-030 (commerce, 금융 hub).
- 시사점: AI 는 범용기술 로서 산업별 융합 패턴이 다르므로 산업·기술·응용 3차원 동시 분석이 필요. Top-down 은 구조적 정보를, bottom-up 은 응용 양상을 제공해 상호 보완.

요약
기존 기술 융합 연구는 (i) 단일 main 기술의 sub-기술 융합 (Kim et al. 2014 의 printed electronics, Wang et al. 2019b 의 3D printing), (ii) 두 이질 산업 융합 (Kim and Lee 2017 의 IT-BT, Curran and Leker 2011 의 NFF-ICT) 으로 양분되어왔다. 그러나 AI 같은 일반목적기술 (GPT) 의 다 산업 융합을 전체 산업 관점에서 다룬 연구는 부족했다. AI 가 헬스케어 (모니터링·진단), 자동차 (자율주행·전동화), 금융 (robo-advisor) 등 다양한 산업을 동시에 변화시키는 GPT 적 특성 (Brynjolfsson et al. 2017; Liu et al. 2021) 을 고려할 때 전 산업적 융합 패턴의 통합 분석이 필요했다.
저자들은 두 방향 접근을 제안한다. Top-down 은 USPTO 의 AI 특허 209,211 건 (Google BigQuery, 2000-2019) 의 IPC 공동분류 네트워크 (group-level 2,517 IPC) 에 degree·betweenness centrality 와 ego-network 를 적용. Hub 노드 (top 10%, degree 합 96.3%·betweenness 합 96.7%) 가 영향력 기술과 산업 부문을 식별한다. G06K-009 (패턴 인식) 가 양 centrality 1위로 전체 네트워크 hub. 16 sector 중 금융/관리·의료·운송·반도체·게임·바이오 6개가 hub 보유. 금융/관리는 G06Q-030 (commerce), G06Q-020 (payment), G06Q-010 (business management) 등 4개 hub. 의료는 A61B-005 (진단) 가 33위 degree 로 부문 내 최강. 운송은 B60R-021 (사고 방지) 등 차량 통제·모니터링. Ego-network 로 각 hub 의 tie 노드 (top 10 strong tie) 를 분석해 부문 간 공유 기술과 부문 특화 기술을 구분.
Bottom-up 은 6 hub sector 의 특허 초록을 spaCy lemmatization → bigram TF-IDF DTM → LSA (90% variance) 차원 축소 → GMM 클러스터링 (1-10 클러스터, AIC 최소화) 으로 처리. GMM 은 K-means 의 disjoint 제약 (동일 데이터의 다중 클러스터 소속 불가) 과 spectral clustering 의 fully connected affinity 요구를 극복. 클러스터별 top TF-IDF bigram 으로 실제 기술 응용을 추출. 예: 금융의 ‘fraud detection’, 의료의 ‘medical image’, 운송의 ‘autonomous vehicle’. 두 접근은 상보적: top-down 은 구조 (IPC 카테고리), bottom-up 은 응용 (텍스트 기반 실제 구현). 단독 접근으로는 놓치는 입체적 이해를 통합 분석이 제공한다.
함의는 AI 정책·전략 수립에 산업별 차별화의 필요성이다. AI 가 GPT 로서 모든 산업에 동일한 효과를 갖는다는 단순 가정은 위험하며, 부문별 hub 기술 + 응용 클러스터 의 두 차원에서 맞춤 정책이 필요하다. 황준석 의 ICT 산업 분석 라인과 Keungoui Kim 의 patent-based 산업 동학 라인의 결합으로, AI GPT 의 다 산업 융합 패턴 매핑 작업이다.
핵심 결과
| Sector | Patents | CAGR | CPP | Hub IPC (degree rank) |
|---|---|---|---|---|
| Finance/Mgmt | 12,603 | 23% | 66.87 | G06Q-030 (40), G06Q-020 (41), G06Q-010 (53) |
| Medical | 10,218 | 17% | 29.79 | A61B-005 (33), A61B-006 (84) |
| Transport | 6,426 | 41% | 29.01 | B60R-021, B60Q-001, B60W-030 |
| Semiconductors | 1,896 | 9% | 22.20 | H01L-027, H01L-021 |
| Games | 1,576 | 27% | 45.47 | A63F-013 (video games), A63B-071 |
| Biotech/Bio mat. | 2,956 (합) | 12-13% | 29.59-78.76 | C12Q-001, G01N-033 |
(CPP = forward citations per patent. 운송이 최고 CAGR, micro-structure/nano 와 biological materials 가 CPP 양극단. 6 hub sector 는 16 candidate 중 도출.)
방법론 노트
Degree centrality 는 IPC 의 직접 연결 강도, betweenness centrality 는 중개 역할을 측정. 둘 다 상위 10% 인 노드가 hub (Baek et al. 2014 의 hub/bridge/core/periphery 분류 기준).
여기서 는 네트워크 IPC 수, 는 IPC 와 의 공동분류 빈도, 는 IPC 와 의 최단 경로 수, 는 를 거치는 최단 경로 수. Ego-network 는 hub 의 tie value 상위 10 노드 (자기 sector 제외) 로 부문 간 공유 기술 식별.
GMM 클러스터링: , 는 클러스터 수, mixing coefficient. EM 알고리즘으로 5개 random seed × 클러스터 수 1-10 학습 후 AIC 최소 모델 선택 (BIC 는 항상 단일 클러스터를 선호). LSA 로 90% explained variance 유지하며 sparsity 감소. 각 클러스터의 상위 bigram (mean TF-IDF) 가 응용 키워드.
연구 계보
Athereye and Keeble (2000), Rosenberg (1976) 의 기술 융합 = 산업 간 공통 지식 베이스 정의에서 출발. Choi et al. (2015), Nystrom (2008) 의 기술 융합 → 산업 융합 인과 가설. Kim and Lee (2017) 의 3차원 (purpose / methodology / object) 기술 융합 분석 프레임을 GPT 영역으로 확장. IPC 공동분류 방법은 Choi et al. (2015), Kwon et al. (2020), Han and Shon (2016, ICT) 의 전통. Schmoch (2008) 의 WIPO IPC-technology concordance 로 35 → 16 sector 매핑. KIPO (2018) 의 AI 특허 IPC 분류 적용. Brynjolfsson et al. (2017), Liu et al. (2020, 2021) 의 AI = GPT 명제. GMM 클러스터링은 Patel and Kushwaha (2020), Bishop (2006) 의 density-based clustering 전통, Conneau et al. (2017) 의 sentence embedding 과 결합. 황준석 의 4기 (2020-2023) 스마트시티·AI·지속가능 전환 시기의 AI 산업 분석 라인 중심 작업이며, TEMEP 내에서는 Keungoui Kim 의 patent-based 기술 융합 분석 라인의 자매 작업.
See also
인접 그래프
- 인물 4
- 방법론 3
- 주제 3
- 수록처 1
- 분류 1