The structural evolution of the Web 2.0 service network


황준석, Jörn Altmann, Kibae Kim (2009) · Online Information Review 33:1040-1057 · DOI ↗

ProgrammableWeb (2005 년 9 월 – 2007 년 5 월) 의 445 개 Web 2.0 서비스 + 1,929 개 mashup 데이터를 가지고 서비스 (open API) 노드와 mashup 링크로 구성된 웹 2.0 service network 의 구조적 진화를 사회 네트워크 분석 로 추적한다. 3 가설 검증: H1 (preferential attachment) — instant shareness \sim accumulated sharenessα^\alpha, α=0.487\alpha = 0.487 (평균, 20 개월), 일반 선호적 연결 모형 의 exponent 1\sim 1 보다 훨씬 낮음. H2 (developer network 효과) — 기각 (Google·Yahoo 같은 대형 플랫폼 dummy 가 유의 효과 없음). H3 (scale-free) — degree 분포 P(k)kγP(k) \sim k^{-\gamma}, γ=0.530\gamma = 0.530 (평균, 2007년 5월 0.521), 일반 scale-free γ[2,3]\gamma \in [2, 3] 보다 훨씬 낮은 fat-tail. Google Maps 가 ranking 1 위 유지 (Amazon eCommerce, Flickr, delicious 가 top 5 안정 구성원).

  • RQ: Web 2.0 mashup 서비스 네트워크는 어떤 구조로 진화하며, 그 진화 패턴은 일반 척도 없는 네트워크 이론으로 설명되는가
  • 방법론: 사회 네트워크 분석 (degree centrality, instant·accumulated shareness), 선호적 연결 모형 (Barabasi-Albert 1999 model + ln 변환 OLS)
  • 데이터: ProgrammableWeb 2005 년 9 월 ~ 2007 년 5 월 데이터, 445 Web 2.0 서비스 + 1,929 mashup. Isolated 222 개 제거 후 223 + blank node 1 = 224 노드 분석. 20 월별 패널
  • 주요 발견: H1 preferential attachment exponent α=0.487\alpha = 0.487 평균 (Google Maps outlier 제거 시 α=0.791\alpha = 0.791), 유의수준 1% 18/20 기간. H2 (대형 플랫폼 dummy) 기각 — 평균 R2=0.099R^2 = 0.099, β\beta dummy 유의는 2/20 기간만. H3 scale-free γ=0.530\gamma = 0.530 평균 (2007 년 5 월 0.521), R2=0.647R^2 = 0.647 — power-law 따르나 exponent 가 일반 (2~3) 의 1/4 수준. Top 5 ranking 안정 — Google Maps (전 기간 1 위), Amazon eCommerce (top 3), Flickr (22 회 top 5 등장), delicious (20 회), Yahoo Search/Maps 다수
  • 시사점: Web 2.0 는 scale-free 이지만 훨씬 hub 지배적 — 소수 hub (Google Maps, Flickr) 가 시스템을 압도. 구조적 fragility (Google Maps 장애 = mashup 절반 실패) 와 진화 안정성을 동시에 보유. Wikipedia (γ1\gamma \approx 1) 와 Flickr tag (γ<1\gamma < 1) 와 비슷한 낮은 exponent 의 자기조직 네트워크 분류 추가

Web 2.0 service network 의 degree 분포 — log-log scale 에서 power-law 적합, 단 exponent \gamma = 0.53 으로 일반 scale-free (2~3) 보다 훨씬 낮은 fat-tail 구조.

요약

황준석 · Jörn Altmann · Kibae Kim (제자) 의 Web2.0 서비스 진화 트리오의 첫 작품. 정보과학·복잡계 네트워크 문헌은 Barabasi & Albert (1999) 의 선호적 연결 모형 이래 자기조직 네트워크가 power-law degree 분포 (γ[2,3]\gamma \in [2, 3]) 를 가진다고 정립해 왔다 — citation network, actor network, WWW hyperlink 모두 동일 패턴. Web 2.0 는 RSS + AJAX + open API 의 결합으로 user-created content 와 mashup 으로 진화하는 서비스 합성 네트워크 라는 새 분류이지만, 그 구조적 진화는 미답 영역이었다.

본 paper 는 ProgrammableWeb (2005 년 9 월 - 2007 년 5 월) 의 445 서비스 + 1,929 mashup 데이터에서 Web 2.0 service network 를 구성한다 — 노드 = open API 제공 서비스, 링크 = 두 서비스가 같은 mashup 에서 사용된 관계. Degree centrality ci(t)c_i(t) 의 normalize 로 instant shareness ri(t)=ci(t)/jcj(t)r_i(t) = c_i(t) / \sum_j c_j(t) 와 accumulated shareness Ri(T)=t=0Tci(t)/jtcj(t)R_i(T) = \sum_{t=0}^T c_i(t) / \sum_j \sum_t c_j(t) 를 정의. 3 가설 검증: (H1) preferential attachment: ri(t)Ri(t1)αr_i(t) \sim R_i(t-1)^\alpha, (H2) 대형 플랫폼 효과: ri(t)βDir_i(t) \sim \beta D_i (DiD_i = Google·Yahoo 같은 developer network 보유 dummy), (H3) scale-free: P(k,t)kγP(k, t) \sim k^{-\gamma}.

H1 결과: α\alpha 평균 0.487 (20 개월, 1% 유의 18/20 기간). Google Maps outlier 제거시 α=0.791\alpha = 0.791 + R2R^2 평균 0.478 로 더 robust. 이는 preferential attachment 메커니즘 자체는 작동 하지만 일반 scale-free 네트워크의 exponent (보통 1\sim 1) 보다 훨씬 낮음. H2 결과: 기각. 평균 R2=0.099R^2 = 0.099, β\beta dummy 유의는 20 기간 중 2 기간 (2005 년 10 월, 12 월) 만 — 즉 Google·Yahoo 같은 대형 플랫폼 운영 여부가 mashup 채택을 유의하게 가속하지 않는다. H3 결과: power-law 적합. γ\gamma 평균 0.530, 2007 년 5 월 γ=0.521\gamma = 0.521, R2=0.604R^2 = 0.604. 단 일반 scale-free 의 γ[2,3]\gamma \in [2, 3] 대비 1/4 ~ 1/6 수준의 매우 낮은 exponent, 즉 hub 가 훨씬 압도적으로 지배하는 fat-tail 구조.

Ranking 안정성도 흥미롭다. Google Maps 가 전 20 기간 1 위 — first-mover 가 아닌데도 (Amazon eCommerce 2003 출시 vs Google Maps 2005 년 6 월 출시) “browser for the earth” 같은 새 사용자 행동 패턴 (지리 검색의 통합 도구) 으로 지배. Top 5 invariant 구성원 = Google Maps · Flickr · Amazon eCommerce · delicious · Yahoo Search/Maps · YouTube · Microsoft Virtual Earth · Technorati 8 종, 무작위였다면 105 종이 top 5 에 출현했을 통계적 기댓값과 비교하면 극히 안정적인 hub 구조. 본 paper 의 낮은 exponent 의 비정상 scale-free 발견이 The Impact of the Subgroup Structure on the Evolution of Networks: An Economic Model of Network Evolution 의 직접 motivation — subgroup 경계 + 기존 노드 간 추가 링크의 두 메커니즘이 exponent 를 왜곡한다는 가설. Wikipedia (γ1\gamma \approx 1, Hendler et al. 2008) 와 Flickr tag (γ<1\gamma < 1, Angus et al. 2008) 와 같은 낮은 exponent 자기조직 네트워크 클래스에 Web 2.0 service network 가 추가된다.

핵심 결과

가설추정 결과R2R^2 (평균)결론
H1 (ri(t)Ri(t1)αr_i(t) \sim R_i(t-1)^\alpha)α=0.487\alpha = 0.487 (Google Maps 제거 시 0.791)0.321 (0.478)채택 (1% 유의 18/20)
H2 (ri(t)βDir_i(t) \sim \beta D_i)β\beta 비유의 (20 기간 중 유의 2)0.099기각
H3 (P(k)kγP(k) \sim k^{-\gamma})γ=0.530\gamma = 0.530 (5월 2007: 0.521)0.647채택 (1% 유의 20/20)
Top 5 (2007 년 5 월 기준 accumulated degree)Web 2.0 서비스
1Google Maps (전 20 기간 1 위)
2Flickr (22 회 top 5)
3Amazon eCommerce (19 회 top 5)
4delicious (20 회 top 5)
5Yahoo Search / Maps / YouTube / Technorati 등 (8 종 회전)

핵심 명제: Web 2.0 service network 는 preferential attachment 가 작동하는 scale-free 네트워크이나, α=0.49\alpha = 0.49 + γ=0.53\gamma = 0.53 으로 일반 scale-free (α1\alpha \sim 1, γ[2,3]\gamma \in [2, 3]) 보다 훨씬 hub 지배적인 fat-tail 구조. 대형 플랫폼 ownership 더미는 비유의 — 서비스 자체 visibility 만이 mashup 채택을 결정.

방법론 노트

Degree centrality 의 instant shareness 와 accumulated shareness:

ri(t)=ci(t)jIcj(t),Ri(T)=t=0Tci(t)jIt=0Tcj(t)r_i(t) = \frac{c_i(t)}{\sum_{j \in I} c_j(t)}, \quad R_i(T) = \frac{\sum_{t=0}^{T} c_i(t)}{\sum_{j \in I} \sum_{t=0}^{T} c_j(t)}

여기서 ci(t)c_i(t) = 노드 ii 의 시점 tt degree (mashup 에서 사용된 횟수), II = 전체 노드 집합. Shareness 는 링크 수 자체 가 아닌 전체 대비 비율 을 보므로 monthly 링크 생성 수 변동 (network 성장) 의 영향을 제거. H1 의 preferential attachment 식 ri(t)Ri(t1)αr_i(t) \sim R_i(t-1)^\alpha 를 자연 로그 변환:

lnr(t)=αlnR(t1)+a\ln r(t) = \alpha \ln R(t-1) + a

OLS 로 월별 추정 (20 기간). H3 의 scale-free 식 P(k,t)kγP(k, t) \sim k^{-\gamma} 을 자연 로그 변환:

lnP(k)=γlnk+c\ln P(k) = -\gamma \ln k + c

여기서 P(k)P(k) = degree 가 kk 인 노드의 frequency, γ\gamma = power-law exponent. 데이터 cleaning: 222 개 isolated 서비스 (mashup 에 한 번도 사용되지 않은) 제거 + blank service 1 개 (mashup-of-mashup 의 base) 추가 → 224 노드. 식별은 시계열 monthly 패널 + 20 개월 평균 으로 noise 축소. 한계: 본 paper 는 exponent 가 낮은지 정량 식별하지 않음 — 후속 The Impact of the Subgroup Structure on the Evolution of Networks: An Economic Model of Network Evolution 가 subgroup 구조 + 기존 노드 간 추가 링크의 두 메커니즘으로 보완.

연구 계보

직접 선행: Barabasi & Albert (1999) Science “Emergence of scaling in random networks” — 선호적 연결 모형 의 정전. Albert & Barabasi (2002) Reviews of Modern Physics “Statistical mechanics of complex networks” — scale-free 정전 review. Dorogovtsev, Mendes & Samukhin (2000), Krapivsky, Redner & Leyvraz (2000), Hołyst, Fronczak & Fronczak (2004) 의 preferential attachment + power-law 정전. Barabasi et al. (2001) arXiv “Evolution of the social network of scientific collaborations” — citation network scale-free. Fu, Liu & Wang (2008) Physica A 의 Sina blog (γ=2.34\gamma = 2.34), Xiaonei SNS (γ=2.12\gamma = 2.12) — 비교 baseline. Watts & Strogatz (1998) “small world networks”. Hendler et al. (2008) CACM “Web science” — Wikipedia hyperlink (γ<2\gamma < 2), 본 paper 의 비정상 exponent 비교 baseline. Angus, Thelwall & Stuart (2008) Online Information Review Flickr tag (γ<1\gamma < 1). Valverde & Sole (2007) Physical Review E 의 SourceForge open source 네트워크 (γ=2\gamma = 2). Eijkman (2008), O’Reilly (2007), Lai & Turban (2008) 의 Web 2.0 정의·collective intelligence 라인. 황준석 · Jörn Altmann · Kibae Kim 트리오의 후속 Measuring and Analyzing the Openness of the Web2.0 Service Network for Improving the Innovation Capacity of the Web2.0 System through Collective Intelligence + The Impact of the Subgroup Structure on the Evolution of Networks: An Economic Model of Network Evolution 의 직접 시드.

See also

인접 그래프

1-hop 이웃 13
  • 인물 3
  • 방법론 2
  • 개념 1
  • 주제 2
  • 수록처 1
  • 분류 2
  • 논문 2
황준석Jörn AltmannKibae Kim사회 네트워크 분석선호적 연결 모형척도 없는 네트워크네트워크 진화웹 2.0Online Informatio…혁신 경제학network-science The structural evolut…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동