Determinants of Participation in Global Volunteer Grids: A Cross-Country Analysis


황준석, Jörn Altmann, Ashraf Bany Mohammed (2009) · IEEE Workshop on Grid Economics and Business Models (GECON)

SETI@home·fightAIDS@home·Einstein@Home·TANPAKU·primegrid 등 글로벌 자원봉사 그리드 컴퓨팅 의 국가별 참여 격차를 130 개국 BOINC 패널로 다중회귀분석 한다. 종전 Engelbrecht (2005, 2008) 의 social-sharing 이론 기반 분석은 HDI·DAI 같은 composite index 로 ICT 접근성을 추상화했으나, 본 paper 는 ICT 인프라 (PC·broadband·dial-up·ISP 경쟁·국제 대역폭)·경제 역량 (GDP·교육비·R&D 지출)·과학·교육 강도 (연구자·과학자 수·연구 품질)·세계화·국가 그룹 14 개 변수를 분리해 식별한다. Log-log 모델에서 R2=0.911R^2 = 0.911. broadband 와 PC 가 1% 유의로 강한 양 (+) 효과, dial-up·ISP 경쟁은 유의하지 않음. 정책 함의: 단순 인터넷 백본만으로는 개도국 참여를 끌어올릴 수 없으며 R&D·broadband·교육 투자의 동시 패키지가 필요하다.

  • RQ: 글로벌 자원봉사 컴퓨팅 참여를 결정하는 국가-수준 요인은 무엇이며, 인프라·경제 역량·과학·교육 강도·세계화 중 어느 채널이 진짜 binding constraint 인가
  • 방법론: 다중회귀분석 (4 모델: level-level, log-level, level-log, log-log; OLS, F-test 로 unrestricted vs reduced 모델 비교)
  • 데이터: 130 개국 패널 (BOINC 2008 년 1012 월 평균 결과 per capita = 종속변수; ITU World Telecommunication Indicators + IMF + UNDP HDI + WEF 경쟁력 보고서 = 14 개 독립변수; 20062007 년 시점)
  • 주요 발견: Log-log 모델 (unrestricted) 의 R2=0.911R^2 = 0.911, F=83.6F = 83.6. broadband (BS, β=0.329\beta = 0.329) 와 PC (β=0.354\beta = 0.354) 모두 1% 유의 양 (+). dial-up·ISP 경쟁은 통계적으로 비유의. GDP/capita (β=0.449\beta = 0.449, 1%) 와 교육 지출 (EE, 10%) 도 유의. 개도국 더미 (DV, LD) 는 모두 강한 음 (-) 효과 (LD: β=1.2\beta = -1.2, 1%)
  • 시사점: OECD 가 권장한 “Internet-linked workstation 만으로 개도국이 참여 가능” 명제는 기각됨. R&D 센터 확충·교육·산학 협력·R&D 인력 이동·국제 공동 연구가 broadband 와 함께 동시에 필요

글로벌 자원봉사 grid 의 국가별 처리 능력 분포 (Top500.com) — 선진국 hub 가 시스템을 압도적으로 점유하는 fat-tail 구조.

요약

황준석그리드 경제학 라인 (Jörn Altmann HP Labs 시기 협업) 의 글로벌 격차 측면 paper. Engelbrecht (2005, 2008) 가 SETI@home 데이터로 social-sharing 이론을 검증한 선구 작업의 방법론적 한계 (composite index 의 가중치 모호성, DAI 의 mobile·fixed-phone 포함으로 인한 spurious 변수 문제) 를 명시하고, Barjak et al. (2007) 의 4 분류 프레임 (technological frames·scientific shaping·economic·political) 위에 14 개 개별 indicator 를 얹어 ICT 인프라·경제 역량·과학·교육·세계화·국가 그룹의 차별 효과를 식별한다.

종속변수는 BOINC (Berkeley Open Infrastructure for Network Computing) 의 40 여 자원봉사 프로젝트 합계의 결과 per capita (2008 년 10~12 월 3 개월 평균) 로, Engelbrecht 의 SETI 단일 프로젝트 종속변수보다 다양성·중립성 면에서 우수. 4 모델 (level-level·log-level·level-log·log-log) 을 OLS 로 추정하고 F-test 로 unrestricted vs reduced 모델을 선택. Log-log 모델만 unrestricted (F=4.31F = 4.31 > 임계 2.71) 우위로 채택, 나머지는 reduced 가 더 적합. 핵심 발견은 broadband 와 PC 만 유의, dial-up 은 무유의 — 즉 ICT 연결성 type 이 결정적이지 연결 여부 자체가 결정적인 것은 아니다. R&D 지출 자체보다 R&D 연구자 수 (ER, Researchers in R&D) 가 강한 양 (+) 효과를 보이는 점이 흥미롭다 — grid 참여는 hardware 자원뿐 아니라 그 자원을 운용할 사람 이 binding constraint.

정책 함의로는 OECD 가 권고한 “Internet-linked high-performance workstation 만 있으면 개도국이 글로벌 grid 의 modest investment 로 참여 가능” 라는 명제를 기각한다 — 본 paper 결과는 broadband·R&D·교육의 동시 패키지 가 필요함을 시사. 후속 정책은 (i) R&D 센터 확충, (ii) 인력 이동 활성화, (iii) 산학 협력, (iv) 인력 재교육, (v) 국제 공동 연구 프로그램 등의 다축 개입이 권고됨. 황준석 의 후속 그리드 경제학 paper (Two Risk-Aware Resource Brokering Strategies in Grid Computing: Broker-Driven vs. User-Driven Methods, Managing risks in an open computing environment using mean absolute deviation portfolio optimization) 가 시장 메커니즘·위험 관리 측면을 다룬다면, 본 paper 는 공급측 결정요인 측면.

핵심 결과

변수 (log-log unrestricted model)계수 β\betat-stat유의수준
Personal computers (PC)0.3543.131%
Broadband (BS)0.3294.361%
Dial-up Internet (DC)-0.006-0.15n.s.
Competition in ISP (CI)0.4930.97n.s.
GDP/capita0.4492.741%
Education expenditure (EE)0.2851.7410%
R&D expenditure0.0921.36n.s.
Globalization (GL)0.1760.59n.s.
Developing (DV)-0.368-2.011%
Least developed (LD)-1.2-6.091%
R2R^20.911
F-value83.6

핵심 명제: PC·broadband·GDP·교육 지출이 자원봉사 grid 참여를 견인하지만, dial-up 연결성과 R&D 지출 자체는 무유의. R&D 인력 수 와 broadband 가 동시에 필요한 동시 충족 조건 이 핵심이며 개도국 (DV·LD) 더미의 강한 음 (-) 효과는 grid 참여의 진정한 디지털 디바이드를 입증한다.

방법론 노트

종속변수 γ\gamma (per-capita BOINC 결과) 의 unrestricted 회귀 모형:

γ=b0+b1PC+b2BS+b3DC+b4CI+b5IB+b6GDP+b7EE+b8ER+b9NR+b10AS+b11QR+b12GL+b13DV+b14LD+ε\gamma = b_0 + b_1 PC + b_2 BS + b_3 DC + b_4 CI + b_5 IB + b_6 GDP + b_7 EE + b_8 ER + b_9 NR + b_{10} AS + b_{11} QR + b_{12} GL + b_{13} DV + b_{14} LD + \varepsilon

여기서 PC = PC per 인구, BS = broadband subs per 인구, DC = dial-up per 인구, CI = ISP 경쟁 수준, IB = 국제 인터넷 대역폭, GDP = GDP/capita, EE = 교육 지출, ER = R&D 지출, NR = 연구자 수, AS = 과학자·엔지니어 수, QR = 연구 기관 품질, GL = KOF 세계화 지수, DV·LD = 발전 단계 dummy. 4 가지 functional form (level-level·log-level·level-log·log-log) 을 OLS 로 추정. unrestricted vs reduced 모델 선택은 F 통계량으로:

F=(Rur2Rr2)/q(1Rur2)/(nk1)F = \frac{(R^2_{ur} - R^2_r)/q}{(1 - R^2_{ur})/(n - k - 1)}

여기서 qq = 제거된 변수 수 (numerator df), nk1n - k - 1 = denominator df. 5% 임계값 2.71 ~ 2.68. Log-log 모델만 F=4.31F = 4.31 > 2.71 로 unrestricted 채택, 나머지 3 모델은 reduced 가 적합. Multicollinearity 우려는 Pearson 상관 매트릭스로 사전 점검하고 highly-correlated 변수 (AS, QR, NR) 일부를 reduced 모델에서 제거. 식별은 Engelbrecht 의 composite-index 단점 을 회피하고 개별 indicator 의 상대 비교 에서 온다.

연구 계보

직접 선행: Engelbrecht (2005, 2008) 의 SETI@home cross-country 회귀 — 본 paper 가 명시적으로 비판하며 출발한 baseline. Barjak et al. (2007) 의 AVROSS 4 분류 프레임 (technological frames·scientific shaping·economic·political) — 본 paper 의 14 개 변수 carving 의 직접 기반. Chinn & Fairlie (2006) 의 Oxford Economic Papers 글로벌 디지털 디바이드 cross-country 회귀, Lee & Brown (2008) 의 broadband adoption cross-country 분석, Quibria et al. (2003) 과 Dwivedi & Lal (2007) 의 디지털 디바이드 결정요인 라인. 황준석 자신의 1 기 (2000–2006) 대역폭 시장·QoS Interconnection 라인이 네트워크 자원을 시장 거래 가능 상품으로 보는 관점 을 형성한 뒤, 본 paper 에서 글로벌 격차의 cross-country empirical 측면 으로 확장된다. 황준석 의 author page 가 2 기 ICT 정책 라인의 도구화 단계 (2007–2013) 로 분류하는 시기의 초기.

See also

인접 그래프

1-hop 이웃 17
  • 인물 3
  • 방법론 2
  • 주제 6
  • 수록처 1
  • 분류 1
  • 논문 4
황준석Ashraf Bany Moham…Jörn Altmann다중회귀분석주성분 분석개도국 ICT 정책그리드 경제학그리드 컴퓨팅대역폭 시장자원봉사 컴퓨팅QoS Interconnecti…IEEE Workshop on …ICT 정책 Determinants of Parti…
휠 = 확대/축소 · 드래그 = 이동 · hover = 라벨 · 클릭 = 페이지 이동