2. 1. 웹보메트릭스에서 영향력 지수를 안다.
1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석,
웹보메트릭스 그리고 웹 과학계량학적 지표의 희망(2)
3. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
가. 웹 영향력 지수(WIF)
학술지의 Thomson Reuters 영향력 지수처럼 상위 소스 사이트로 된 핵심
리스트를 작성하고 아웃-링크를 색인하고, “인용” 빈도로 그 결과를
분류함으로써 인-링크의 수에 따라 주제별 관련 웹 사이트의 순위나 웹
사이트의 영향력에 대한 대략의 추정치를 간단히 얻게 됨.
야후!서치(Yahoo! Search)와 윈도우 라이브 서치(Windows Live Search)와
같이 알타비스타 형태의 검색엔진이 특정 웹 사이트의 페이지를 한 페이지
이상 링크하고 잇는 웹페이지의 숫자를 집계할 수 있는 능력에 의존했음.
계량서지학자들은 가필드 영향력 지수처럼 웹 사이트의 성능을
상대적으로 평가하는 데 유용한 일종의 사이버메트릭스와 동등한 지수의
속성에 대해 숙고하여 왔음.
4. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
가. 웹 영향력 지수(WIF)
웹 영향력 지수(WIF)
• 1998년 잉베르센이 도입한 웹의 사이트나 분야에 대한 웹 영향력
지수(WIF)는 학술지 영향력 지수와 완벽하게 대칭을 이룸
• 웹 영향력 지수는 특정 시간에 사이트의 “평균” 웹 페이지가 어느 정도나
링크되어 있는지 그 빈도를 측정한 것으로 정의
• 가장 보편적으로 인정받는 공식으로 이것은 특정 시점에 그 사이트나
분야를 링크하고 있는 웹 페이지 수(자기 링크는 제외)와 그 사이트에
포함된 페이지 수(검색엔진으로 색인된)간의 비율.
5. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
가. 웹 영향력 지수(WIF)
예
시간 t에서 사이트 S에 대한(자기링크를 제외한) 전체 링크
페이지가 I=100 이라고 하자. 검색엔진에서 색인된 사이트 S의
웹 페이지의 수가 P=50이라면, 다음과 같은 공식이 성립된다.
6. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
웹 영향력 지수 계산법
- 셀프 링크(self-link)를 제외한 수정된 웹 영향력 지수 계산법
출처 - http://www.slideshare.net/shashiprakash230_01/web-impact-factorsacriticalrevie
7. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
나. 웹 영향력 지수(WIF)의 한계
1
2
3
색인해야 할 문헌이 기하급수적으로 증가하는데도 검색엔진은 월드와이드웹의
일부분을 크롤링하고 색인.(이러한 커버리지 부족 현상을 보여주는 눈에 띄는
사례 중에서 “보이지 않는 웹(invisible web)”을 기술적으로 밝히지 못하는 것.
배제 기준 대상이나 접근제한 정책으로 차단된 웹 페이지와, 사용자 쿼리에
반응하여 매일 웹 데이터베이스 서버가 되돌려 보내는 수억 개의 웹 페이지처럼
분류하기 어려운 수많은 자료에 대해 일시적으로 호의를 보임.)
서로 다른 검색엔진은 별개의 크롤링 알고리즘을 사용.(이는 월드와이드웹 하위
도메인 전역에 걸쳐 크롤링 하는 사이트, 페이지, 링크를 수집함에 있어서 그
효과에 강한 영향을 끼침)
경쟁중인 검색엔진의 데이터베이스 간 중복이 적으므로 다양한 출처에서
데이터를 수집하여 얻은 결과를 비교하기 어려움.(동일한 데이터베이스
안에서도 매일 평균적 변동이 발생하여 매우 불안정해지는 결과를 야기)
8. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
나. 웹 영향력 지수(WIF)의 한계
검색엔진의 포괄범위가 치우치지 않는다면 웹 영향력 지수는 여전히
웹보메트릭스적 척도로서 훨씬 더 훌륭하게 남아있었을 것.
웹 영향력 지수 공식의 분자와 분모 모두 분명하게 정의하기 어렵고 그
모호성은 웹 페이지가 최고의 집계 단위라는 가정과 밀접하게 연관
웹페이지가 같은 기관의 사이트에 속한다면 인-링크로서 무엇을 집계할
것인가(대학 사이트에서계열 학과 사이트로 연결된 것은 인-링크인가 자기
링크인가?)는 분명해지지 않음.
마찬가지로 분모의 웹 페이지의 수는 연결 가능한 웹 자원의 몫에 대해
신뢰할만한 척도가 되지 못함.
온라인 HTML 책과 같이 전체가 하나의 페이지에 호스트되거나 가독성을
증가시키기 위해 100페이지로 나누어 1 또는 100으로 가중치를 부여해
계산할지도 모른다는 점에서 영향을 줄 수 있음.
9. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
다. 웹 영향력 지수(WIF)의 한계의 극복
2000년부터 울버햄튼 대학교 통계 사이버메트릭스 연구그룹
• 학술적 웹 링크 데이터베이스 프로젝트를 시작.
• 이 연구그룹은 직접 개발한 웹 크롤러를 통해 뉴질랜드,
오스트레일리아, 영국, 스페인, 중국, 타이완의 학술적 웹 공간과
관련된 대학 링크 데이터를 수집해오고 있음.
10. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://webometrics.wlv.ac.uk/
11. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
다. 웹 영향력 지수(WIF)의 한계의 극복
웹보메트릭스학자들
• 독자적인 분석 대상으로”웹페이지”를 더 이상 쓰지 않고, 적절하게
하나의 “웹 문서”를 구성하고 응집된 자료에서 불변의 조각을 찾기
위해 발견적Heuristic 방법론에 의지.
12. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://www.authormapper.com/search.aspx?q=webometrics&Facet=orgname
13. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
다. 웹 영향력 지수(WIF)의 한계의 극복
마이크 델월(Thelwall)의 “대안 문서 모형(ADMs)”
• 해당 웹 페이지의 링크 URL보다 상위 수준의 링크 URL로
절단함으로서 링크 분석에 대한 조정을 할 수 있도록 함.
• 이와 같은 분석은 디렉토리(같은 디렉토리 안의 모든 페이지를 하나의
링크 대상으로 집계한다), 도메인(URL 내에서 같은 도메인명을 가진
모든 페이지를 하나의 링크 대상으로 집계한다) 및 사이트(특정
도메인명으로 끝나는 하위사이트에 소속된 모든 페이지를 하나의
링크 대상으로 집계한다) 등의 수준으로 조정할 수 있음.
14. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://www.scit.wlv.ac.uk/~cm1993/mycv.html
15. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://www.scit.wlv.ac.uk/~cm1993/mycv.html
16. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://www.scit.wlv.ac.uk/~cm1993/mycv.html
17. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
다. 웹 영향력 지수(WIF)의 한계의 극복
2004년 스페인 연구재단의 정보문서화 센터(CINDOC)에 속한 사이버
메트릭스 연구실의 Webometrics Ranking of World Universities
• 대규모 웹보메트릭스적 분석.
• 이 사이트는 전 세계 학술 기관의 웹 도메인에 대해 해당 콘텐츠의
크기, 가시성, 영향력에 따라 순위를 부여.
• 웹 영향력 지수는 상용 검색엔진에서 되돌아오는 인-링크 비율로
측정되는 가시성과 호스팅한 웹 페이지의 수로 측정되는 크기 사이의
비율의 계산하여 적용.
• 나머지 두 척도는 “Rich File”과 “Scholar”라는 지수이며 각각 표준
형식으로 작성된 적합한 학술 결과물의 크기와 구글 스칼라에서 각
학술 도메인마다 논문 수 및 인용 횟수를 적용하기 위해 도입된 것.
18. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
출처 - http://www.webometrics.info/es
19. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
웹영향력지수에 대한 국내 언론보도
대학 웹 영향력 한국은 `까마득`
미국 대학 „황새‟, 한국 대학 „뱁새‟
하바드대 인터넷 영향력 1위, 서울대는 224위
http://www.etnews.com/news/international/2220156_1496.html
추락하는 국가경쟁력 올리려면
스페인 국립연구원의 사이버메트릭스랩(CINDOC)의 최근 발표에 따르면, 세계 1만7036
개 대학 가운데 미국 하버드대의 영향력이 가장 큰 것(1위)으로 조사됐다. 아시아에서는
싱가포르국립대가 54위로 아시아 최고였고 중국 칭화대(57위), 일본 도쿄대(63위), 국립
대만대(66위), 중국의 베이징대(67위), 치장대(76위), 우한대(92위), 상하이교통대(94위),
푸단대(107위)가 그 뒤를 따랐다. 한국 대학들의 순위는 낮았다. 서울대가 108위로 아시
아에서 10번째였다. 한국과학기술원(KAIST)은 144위, 고려대(339위), 연세대(383위),
한양대(477위), 포스텍(499위), 성균관대(506위) 순이었다.
http://www.hankyung.com/news/app/newsview.php?aid=2013100290191&intype=1
사이언스온 - [단신] 세계 연구기관 '웹소통' 누가 잘했나.. 1위 'NIH'
화학공학연구정보센터, 국내연구기관 웹영향력 1위 - 중앙일보 경제
스페인 사이버메트릭스 연구실 세계연구기관 웹순위 발표
20. 1. 가상세계의 인용분석: 하이퍼링크 네트워크 분석, 웹보메트릭스
그리고 웹 과학계량학적 지표의 희망(2)
다. 웹 영향력 지수(WIF)의 한계의 극복
더 작은 규모에서 델월(Thelwall)과 그 동료들의 링크 분석 방법론
• 국가적 수준에서 선별된 학술 사이트 집단 간 연결 패턴에 대해 주목.
• “그들이 주장하기로는 한 국가에 속한 대학 간 상호연결을 분석하는
것이 이상적인 연구 규모다. 분석할 대상의 수(국가 차원에서 대학당
한 사이트)가 관리하기 쉽고 전체 대학 사이트로 향한 모든 링크를
집계하는 것이 충분히 높은 수준의 집합을 제공함으로써 신뢰성 있는
결과를 생산할 수 있게 해주는 것으로 보인다.”
• 종단 연구에서 대학 웹 사이트가 다른 가상의 결과보다 상대적으로 더
안정적이라는 것이 알려 짐.
• 개별 기관 수준에서 변동의 폭이 큼에도 불구하고, 그들의 내부링크와
외부링크 비율의 상대적 안정성도 증명됨.
• 따라서 학술기관의 연구 지향적 특성까지 고려하면 그들의 링크
정책을 지적 임무에 관련된 몇몇 척도 안으로 끌어들이는 것도 꽤
타당할 것으로 예측.
21. QUIZ.
“대안 문서 모형(ADMs)”으로 해당 웹 페이지의 링크 URL보다 상위 수준의
링크 URL로 절단함으로서 링크 분석에 대한 조정을 할 수 있도록 한 인물은?
마이크 델월(Thelwall)
22. 정리하기.
웹 영향력 지수는 특정 시간에 사이트의 “평균” 웹 페이지가 어느
정도나 링크되어 있는지 그 빈도를 측정한 것으로 정의된다.
웹 영향력 지수(WIF)의 한계를 다양한 연구를 통해 극복하였다.
23. 참고문헌.
• http://hanpark.net
• 니콜라 드 벨리스(2010), 계량서지학과 인용분석,
한국과학기술정보연구원.
• Park, ”Hyperlink Network Analysis: A New Method for the Study of
Social Structure on the web”Connections25, no. 1(2003): 49-61
• http://www.leydesdorff.net/
• http://asia-triplehelix.org/home
• http://www.scit.wlv.ac.uk/~cm1993/mycv.html
• http://www.webometrics.info/es
• http://www.slideshare.net/shashiprakash230_01/web-impactfactorsacriticalreview