Technology Opportunity Discovery using Deep Learning-based Text Mining and a Knowledge Graph


MyoungHoon Lee, Suhyeon Kim, Hangyeol Kim, 이정혜 (2022) · Technological Forecasting & Social Change 180:121718 · DOI ↗

이정혜기술경영 라인 정점 — 42 회 인용, TEMEP 이동의 지적 준비. Technology Opportunity Discovery (TOD) 프레임워크 — 4 단계: (1) Doc2vec + LR 로 기술 분류 모형 → (2) NTBF 의 기술 분야 매핑 → (3) NTBF-기술-투자자 3 종 노드 knowledge-graph 구축 → (4) centrality measurementemerging technology index (TOI). Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 top emerging tech 으로 식별.

  • RQ: New Technology-Based Firms (NTBFs)투자자 정보를 활용해 기술 기회 (emerging tech) 를 systematically 식별하는 frame 은?
  • 방법론: 4 단계 — Doc2vec 기술 분류 + Logistic Regression + NTBF 매핑 + 3-node knowledge graph (TOD-KG) + centrality-based TOI
  • 데이터: 한국 NTBF 데이터 + 투자자 정보 + 기술 텍스트 데이터
  • 주요 발견: (1) Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 최상위. (2) Doc2vec-LR 기술 분류 모형 정확도 입증. (3) NTBF-기술-투자자 3 종 노드 knowledge graph 가 기술 기회 식별 의 새로운 frame. (4) TOI = centrality measure 기반 complete + interpretable 지표.
  • 시사점: 기술 평가 (technology valuation) + 정부 R&D 지원 우선순위 결정 + 투자자 의사결정에 정량적 도구. 한국어 기반이나 noun extraction 으로 다국어 확장 가능.

NTBF-기술-투자자 3종 노드 지식 그래프 기반 TOD 프레임워크.

요약

이 paper 는 이정혜2 기 UNIST 후반 의 기술경영 라인 의 정점 — 42 회 인용. TEMEP 이동의 지적 준비. MyoungHoon Lee (제 1 저자) + Suhyeon Kim (W2V-LSA 의 같은 저자) 와의 협업. Technological Forecasting & Social Change — 기술경영의 정상급 journal.

방법론적 핵심: 4 단계 TOD framework:

(i) 기술 분류 모형 (Doc2vec-LR)technical text datadoc2vec 으로 임베딩 → 로지스틱 회귀 분류기 학습. 기술 분야 (e.g. fintech, blockchain, AI) 다중 분류.

(ii) NTBF 매핑 — NTBF 의 investor relation text 를 위 모형으로 분류 → 각 NTBF 가 관련 기술 분야highly-relevant 매핑.

(iii) TOD Knowledge Graph 구축 — 3 종 노드:

  • Technology (기술 분야)
  • NTBF (new technology-based firm)
  • Investor

엣지: NTBF ↔ Technology (분류 매핑), NTBF ↔ Investor (투자 관계), Technology ↔ Technology (semantic similarity).

(iv) TOD Index (TOI) — 각 기술 노드의 centrality measure (degree, betweenness, eigenvector) 로 emerging potential 산출. TOI 높음 → emerging tech.

핵심 발견: 한국 NTBF 데이터에서 Fintech big data (TOI 1.101), Human-AI collaboration (TOI 1.089) 가 top emerging tech. Real-world 산업 동향과 일치. Doc2vec-LR 분류 모형의 정확도 + validity 실증.

이정혜연구 궤적 안에서 이 paper 는 2 기 후반의 기술경영 도메인 진입TEMEP 이동의 지적 준비. 후속 FT-MixE: Fourier transform-based efficient mixing of knowledge graph embeddings for improved link prediction (2026 FT-MixE knowledge graph 임베딩) 으로 KG 라인 발전.

핵심 결과

Top emerging technologyTOI
Fintech big data analysis1.101
Human-AI collaboration1.089
  • 4 단계 framework: Doc2vec-LR 분류 → NTBF 매핑 → KG 구축 → TOI
  • 3 종 노드 KG: Technology, NTBF, Investor
  • 인용 수 42

방법론 노트

doc2vec: 문서를 고차원 vector 로 임베딩 (Le & Mikolov 2014). PV-DM 또는 PV-DBOW 변종.

로지스틱 회귀 multi-class:

P(cd)=exp(wcvd)cexp(wcvd)P(c|d) = \frac{\exp(w_c^\top v_d)}{\sum_{c'} \exp(w_{c'}^\top v_d)}

vdv_d = doc2vec embedding, cc = technology class.

knowledge-graph centrality: degree, betweenness, eigenvector, PageRank. TOI = aggregation of multiple centrality scores.

식별 가정: (i) Doc2vec 의 semantic preservation, (ii) NTBF investor relation text 의 informative content, (iii) centrality 의 emerging potential proxy.

연구 계보

이 paper 는 (i) Le & Mikolov (2014) Doc2vec 본가, (ii) Word2vec-based latent semantic analysis (W2V-LSA) for topic modeling: A study on blockchain technology trend analysis 직접 선행 (text-based tech mining), (iii) Daim et al. (2006) technology opportunity 라인 — 의 결합. 이정혜연구 궤적 2 기 후반 기술경영 진입의 정점, TEMEP 이동의 지적 준비.

See also

인접 그래프

1-hop 이웃 11
  • 인물 4
  • 방법론 2
  • 주제 1
  • 수록처 1
  • 논문 3
이정혜Hangyeol KimMyoungHoon LeeSuhyeon Kim로지스틱 회귀텍스트 마이닝기술 경영Technological For… Technology Opportunit…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동