Exploring trends and topics in hybrid intelligence using keyword co-occurrence networks and topic modelling


Jihye Lim, 황준석 (2025) · Futures 167:103550 · DOI ↗

인간-AI 협력 패러다임으로서 hybrid intelligence (HI) 분야 20 년 (2003-2022) 의 연구 동향을 Keyword Co Occurrence Network (KCN) + Latent Dirichlet Allocation (LDA) 으로 매핑. PRISMA 가이드라인을 따라 Scopus 의 두 search string (“hybrid intelligence” + ChatGPT 가 제안한 299 synonyms) 으로 369 paper 수집 후 manual 검증으로 170 paper 확정. 4 trending topic (decision making · medical science · social factors · automation) 과 3 emerging topic (crowdsourcing · data science · teamwork) 식별. Wiig (1993) 의 4 knowledge type (factual / conceptual / expectational / methodological) 분류로 basic-methodological (research methodology 로서의 HI) 가 3% 에 불과한 사각지대 지적.

  • RQ1: HI 분야의 leading research area 와 trending topic 은 무엇인가. RQ2: HI 의 emerging / promising topic 은 무엇인가.
  • 방법론: Keyword Co Occurrence Network (Barrat et al. 2004 weighted network), Latent Dirichlet Allocation (Blei et al. 2003, coherence score 기반 k=7), PRISMA 체계적 문헌 리뷰, NLTK lemmatization, ChatGPT 기반 synonym 확장.
  • 데이터: Scopus 2003-2022, 4 time window (2003-08, 2008-12, 2013-17, 2018-22). PRISMA 후 170 paper 확정 (article + conference paper). subject area 는 Scopus 분류 기준 (computer science 21.76% top, engineering, mathematics 등).
  • 주요 발견: (i) 2017 (Transformer 등장) + 2018 이후 HI 연구 폭증, computer science / engineering / mathematics 가 main field. (ii) 4 trending topic: decision making, medical science, social factors, automation. (iii) 3 emerging topic: crowdsourcing, data science, teamwork. (iv) knowledge type 사각지대: basic-methodological knowledge (HI 를 연구 방법론으로 활용) 가 170 paper 중 5 편 (3%) 에 불과 — 가장 큰 미개척 영역.
  • 시사점: HI 를 연구 방법론으로 활용하는 새 분야 개척 필요. AI 중심 funding 정책을 HI (human 통합) 로 확장 권고. policymaker 에게 미래 고용·부 분배 전망의 evidence 제공.

HI 의 연구 type × knowledge classification 매트릭스. basic research → conceptual / methodological knowledge, applied research → conceptual / methodological knowledge 의 4 사분면. 87 paper 가 applied-methodological 에 집중, 단 5 paper 만 basic-methodological (research methodology 로서의 HI) 에 위치 — 본 paper 의 가장 중요한 비대칭 발견.

요약

황준석 의 5기 (AI 와 국가 경쟁력) 라인의 systematic literature review 분기. Jihye Lim 의 SNU TEMEP 박사 라인 + Smart City Innovative Talent Education Program 펀딩으로 산출. 자매 Exploring diverse interests of collaborators in smart cities: A topic analysis using LDA and BERT (스마트시티 협력자 관심 토픽) 와 동일 author 의 method 라인 — LDA + KCN 을 다른 domain (스마트시티 → HI) 에 응용. 기존 systematic review 들 (Dellermann et al. 2021, Hemmer et al. 2021, Wiethof & Bittner 2021, Correia et al. 2023) 이 design / collaboration / learning pattern 등 부분 영역만 다룬 것에 비해, 본 paper 는 (i) 20 년 long-window, (ii) KCN + LDA 결합, (iii) knowledge type 분류까지 통합한 first comprehensive map.

방법론은 4 step. (i) data collection: PRISMA 가이드라인으로 Scopus 에서 두 search string — string 1 (“hybrid intelligence” AND “human”/“man”) 으로 pure AI 의 “hybrid” 와 구분, string 2 (synonyms — ChatGPT 가 10 회 반복으로 299 단어 제안, 중복 제거 + 관련도 필터 후 사용) 로 광범위 capture. 369 → 170 paper (manual relevance 검증). (ii) preprocessing: acronym 통일, 유사어 그룹화 (e.g., deep/machine learning), lemmatization (NLTK), 비정보 단어 제거. (iii) KCN: weighted network 에서 node degree kik_i, average link weight wij\langle w_{ij}\rangle, node strength sis_i 의 3 measure (Barrat et al. 2004) 로 quantitative + visual 분석, 4 time window 로 진화 추적. (iv) LDA: title + abstract 로 unsupervised topic extraction, coherence score (UMass) 로 optimal k=7 결정.

핵심 발견은 셋. 첫째, 출판 trend 는 2017 (Vaswani et al. Transformer) → 2018 이후 exponential. 둘째, trending vs emerging 의 구분: trending (decision making, medical science, social factors, automation) 은 LDA + KCN 양쪽에서 일관 식별, emerging (crowdsourcing, data science, teamwork) 은 Window 4 (2018-22) 의 keyword strength 에서 새로 등장. 셋째, knowledge type 비대칭 — Wiig (1993) 의 4 type 분류로 170 paper 를 매핑하면 applied-methodological 87 (51%), applied-conceptual 41 (24%), basic-conceptual 37 (22%), basic-methodological 5 (3%). 즉 HI 를 “연구 방법론 그 자체” 로 활용한 연구는 거의 없다. 저자는 이를 가장 promising future direction 으로 제시. 한계: search term 의 field-specific 누락 가능성, Scopus 한정, title/abstract 만 (full text 미포함), manual selection 의 evaluator bias.

핵심 결과

RankTop 7 LDA topicsTop 7 KCN keywordsFinal trending topics
1Interaction designDecision makingDecision making
2Social knowledgeMedical scienceMedical science
3Decision making & businessKnowledge managementSocial factors
4AutomationCrowdsourcingAutomation
5Social cognitionSocial
6Medical scienceHuman factor
7Organization designAutomation
  • Trending topic: Decision making, Medical science, Social factors, Automation.
  • Emerging topic (Window 4 신규): Crowdsourcing, Data science, Teamwork.
  • Knowledge classification (Wiig 1993): basic-conceptual 37 / basic-methodological 5 (3%) / applied-conceptual 41 / applied-methodological 87. → “HI 를 research methodology 로” 가 가장 큰 미개척.
  • Window 4 (2018-22) top-strength keyword: AI 258, decision making 71, medical science 39, crowdsourcing 39, data science 35, knowledge management 35.
  • Window 1 (2003-07) vs Window 4 strength gap: 2배 → 9.5배 (toptier 토픽 집중도 증가 + 새 토픽 출현).

방법론 노트

Keyword Co Occurrence Network (KCN) 의 weighted network 분석 (Barrat et al. 2004). adjacency matrix Aij=aijwijA_{ij} = a_{ij} w_{ij} 에서:

Node degree (단순 link 수):

ki=jNaijk_i = \sum_{j \in N} a_{ij}

여기서 aij=1a_{ij} = 1 if link exists, 00 otherwise.

Average link weight (degree 결합):

wij(kikj)\langle w_{ij} \rangle \sim (k_i k_j)

Node strength (link 의 weight 까지 반영, weighted network 의 적절한 importance):

si=jNaijwijs_i = \sum_{j \in N} a_{ij} w_{ij}

Latent Dirichlet Allocation (LDA, Blei et al. 2003) 은 unsupervised topic model 로 토픽 분포와 단어 분포를 동시 추정. optimal kk (topic 수) 는 coherence score (UMass) 로 결정:

C=ijscoreUMass(wi,wj)C = \sum_{ij} \text{score}_{\text{UMass}}(w_i, w_j) scoreUMass(wi,wj)=logD(wi,wj)+1D(wi)\text{score}_{\text{UMass}}(w_i, w_j) = \log \frac{D(w_i, w_j) + 1}{D(w_i)}

D(wi)D(w_i) 는 단어 wiw_i 의 paper 빈도, D(wi,wj)D(w_i, w_j) 는 두 단어가 동시 등장한 paper 수. 본 paper 는 coherence score + manual review 로 k=7k=7 채택. perplexity 는 Hasan et al. (2021) 의 비판에 따라 부수적.

KCN 과 LDA 는 상호 보완 — KCN 은 author keyword 만, LDA 는 abstract + title 의 hidden topic 까지 capture. 두 결과의 교집합으로 trending topic 의 신뢰도 확보.

연구 계보

황준석 의 5기 (AI 와 국가 경쟁력 · 토픽 모델링 방법론) 라인. 같은 author / 같은 method 라인의 직계 ancestor 는 Exploring diverse interests of collaborators in smart cities: A topic analysis using LDA and BERT (스마트시티 협력자 토픽, Heliyon 2024) — 본 paper 는 그 method 를 스마트시티에서 HI 로 확장. 자매 paper 로는 Dynamic patterns of AI technology diffusion: focusing on time series clustering and patent analysis (시계열 클러스터링 + AI 특허 분석, Scientometrics) 과 Measuring ethics level of technological topics using phylogenetic tree (phylogenetic + LDA, finance AI ethics) 가 황준석 author page anchor 의 “AI 와 국가 경쟁력 / 토픽 모델링 / 계량 분석” 라인의 동족. AI technology specialization and national competitiveness (국가별 AI 특화) 와 함께 5기 AI 분기를 구성. 기술적 reference 는 (i) HI 정의: Lomov & Venda (1977) 의 원조, Dellermann et al. (2019, BISE) 의 표준 정의 (collective + superior + continuous learning), van der Aalst (2021) 의 human vs AI strength 대비. (ii) KCN: Barrat et al. (2004, PNAS) 의 weighted network architecture, Radhakrishnan et al. (2017). (iii) LDA: Blei, Ng & Jordan (2003, JMLR) 의 원조, Yu & Xiang (2023) 의 AI 토픽 모델링. (iv) Knowledge classification: Wiig (1993) 의 KM 4 type model. (v) PRISMA: Page et al. (2021). 이정동 author page anchor 의 토픽 모델링 도구 라인과도 방법론 연결.

See also

인접 그래프

1-hop 이웃 17
  • 인물 3
  • 방법론 5
  • 주제 2
  • 수록처 1
  • 분류 1
  • 논문 5
이정동황준석Jihye Lim계량서지학토픽 모델링Keyword Co Occurr…Latent Dirichlet …PRISMA 체계적 문헌 리뷰Human Ai Collabor…Hybrid Intelligen…Futuresai-research Exploring trends and …
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동