Technology Opportunity Discovery using Deep Learning-based Text Mining and a Knowledge Graph
MyoungHoon Lee, Suhyeon Kim, Hangyeol Kim, 이정혜 (2022) · Technological Forecasting & Social Change 180:121718 · DOI ↗
이정혜 의 기술경영 라인 정점 — 42 회 인용, TEMEP 이동의 지적 준비. Technology Opportunity Discovery (TOD) 프레임워크 — 4 단계: (1) Doc2vec + LR 로 기술 분류 모형 → (2) NTBF 의 기술 분야 매핑 → (3) NTBF-기술-투자자 3 종 노드 knowledge-graph 구축 → (4) centrality measurement 로 emerging technology index (TOI). Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 top emerging tech 으로 식별.
- RQ: New Technology-Based Firms (NTBFs) 와 투자자 정보를 활용해 기술 기회 (emerging tech) 를 systematically 식별하는 frame 은?
- 방법론: 4 단계 — Doc2vec 기술 분류 + Logistic Regression + NTBF 매핑 + 3-node knowledge graph (TOD-KG) + centrality-based TOI
- 데이터: 한국 NTBF 데이터 + 투자자 정보 + 기술 텍스트 데이터
- 주요 발견: (1) Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 최상위. (2) Doc2vec-LR 기술 분류 모형 정확도 입증. (3) NTBF-기술-투자자 3 종 노드 knowledge graph 가 기술 기회 식별 의 새로운 frame. (4) TOI = centrality measure 기반 complete + interpretable 지표.
- 시사점: 기술 평가 (technology valuation) + 정부 R&D 지원 우선순위 결정 + 투자자 의사결정에 정량적 도구. 한국어 기반이나 noun extraction 으로 다국어 확장 가능.

요약
이 paper 는 이정혜 의 2 기 UNIST 후반 의 기술경영 라인 의 정점 — 42 회 인용. TEMEP 이동의 지적 준비. MyoungHoon Lee (제 1 저자) + Suhyeon Kim (W2V-LSA 의 같은 저자) 와의 협업. Technological Forecasting & Social Change — 기술경영의 정상급 journal.
방법론적 핵심: 4 단계 TOD framework:
(i) 기술 분류 모형 (Doc2vec-LR) — technical text data 를 doc2vec 으로 임베딩 → 로지스틱 회귀 분류기 학습. 기술 분야 (e.g. fintech, blockchain, AI) 다중 분류.
(ii) NTBF 매핑 — NTBF 의 investor relation text 를 위 모형으로 분류 → 각 NTBF 가 관련 기술 분야 에 highly-relevant 매핑.
(iii) TOD Knowledge Graph 구축 — 3 종 노드:
- Technology (기술 분야)
- NTBF (new technology-based firm)
- Investor
엣지: NTBF ↔ Technology (분류 매핑), NTBF ↔ Investor (투자 관계), Technology ↔ Technology (semantic similarity).
(iv) TOD Index (TOI) — 각 기술 노드의 centrality measure (degree, betweenness, eigenvector) 로 emerging potential 산출. TOI 높음 → emerging tech.
핵심 발견: 한국 NTBF 데이터에서 Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 top emerging tech. Real-world 산업 동향과 일치. Doc2vec-LR 분류 모형의 정확도 + validity 실증.
이정혜 의 연구 궤적 안에서 이 paper 는 2 기 후반의 기술경영 도메인 진입 — TEMEP 이동의 지적 준비. 후속 FT-MixE: Fourier transform-based efficient mixing of knowledge graph embeddings for improved link prediction (2026 FT-MixE knowledge graph 임베딩) 으로 KG 라인 발전.
핵심 결과
| Top emerging technology | TOI |
|---|---|
| Fintech big data analysis | 1.101 |
| Human-AI collaboration | 1.089 |
| … | … |
- 4 단계 framework: Doc2vec-LR 분류 → NTBF 매핑 → KG 구축 → TOI
- 3 종 노드 KG: Technology, NTBF, Investor
- 인용 수 42
방법론 노트
doc2vec: 문서를 고차원 vector 로 임베딩 (Le & Mikolov 2014). PV-DM 또는 PV-DBOW 변종.
로지스틱 회귀 multi-class:
= doc2vec embedding, = technology class.
knowledge-graph centrality: degree, betweenness, eigenvector, PageRank. TOI = aggregation of multiple centrality scores.
식별 가정: (i) Doc2vec 의 semantic preservation, (ii) NTBF investor relation text 의 informative content, (iii) centrality 의 emerging potential proxy.
연구 계보
이 paper 는 (i) Le & Mikolov (2014) Doc2vec 본가, (ii) Word2vec-based latent semantic analysis (W2V-LSA) for topic modeling: A study on blockchain technology trend analysis 직접 선행 (text-based tech mining), (iii) Daim et al. (2006) technology opportunity 라인 — 의 결합. 이정혜 의 연구 궤적 2 기 후반 기술경영 진입의 정점, TEMEP 이동의 지적 준비.
See also
- 이정혜
- MyoungHoon Lee
- Suhyeon Kim
- doc2vec
- knowledge-graph
- technology-opportunity-discovery
- 기술 경영
- Technological Forecasting & Social Change
- Word2vec-based latent semantic analysis (W2V-LSA) for topic modeling: A study on blockchain technology trend analysis
인접 그래프
- 인물 4
- 방법론 2
- 주제 1
- 수록처 1
- 논문 3