1. 이 슬라이드는
박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색
프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가
시성 분석과 신종플루 관련단어의 연관성 분석. Journal of the
Korean Data Analysis Society. 11권 6호 (B). 3427-3440.
을 기초로 연구자들이 학술적 목적으로 Naver-API 서비스를 쉽게
사용할 수 있도록 만든 매뉴얼임.
* This slide was made by Han Woo Park and his students to help
researchers and students use the WeboNaver. Please cite Park’s
works using the WeboNaver.
•이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람.
박한우 편 (2014). 웹보네이버를 이용한 웹보메트릭스 네트워크 분석.
•경산: 영남대학교. http://www.slideshare.net/hanpark/webo-naver2012-0902
2. 1. Webonaver
WeboNaver 프로그램 다운
[Hanpark.net] 접속 – 카테고리 중 [Software] 클릭
- [naver]로 글 검색 후, Webonaver OpenAPI 글에 있는
첨부파일 다운로드. 확장자를 exe로 변경 후 사용가능
1. 컴퓨터프로그램 개요
가. 프로그램 명칭 : 웹보네이버2.0
나. 접수번호(접수일) : 2014-011159-1 (2014.05.19)
다. 개발자 : 박한우
라. 저작자 : 영남대학교 산학협력단
마. 등록일 : 2014.05.20
바. 등록번호 : 제C-2014-011480호
3. 웹보네이버 활용동의서
• 안녕하세요.
• Hanpark.net 의 Software 코너에 소개된 웹보메트릭스 툴들에 대해서 많은 관심을 보여주셔서
감사합니다. 저희 쪽에서 개발된 툴의 사용을 위해서 Authentication Key가 반드시 필요합니다.
인증키를 모두 공개하고 싶지만, 저희도 테스트를 하면서 사용중인지라 불가피하게 비공개하고
있습니다. 설상가상으로, 풀타임 프로그래머가 사직한 관계로 어려움이 많으니 양해바랍니다.
• 오프라인 모임에 참석하여 인증키를 받으신 분들 가운데, 동의서를 작성하지 않은
분은 아래 링크에서 작성하여 제출해 주기 바랍니다.
http://bit.ly/1i7jQAs
• 인증키를 주변인에게 전달하는 행위를 금지합니다! 연구실에서는 해당 사용자와
웹보메트릭스툴에 관해서 앞으로 어떠한 협력도 하지 않을 것입니다. 신중하게 사용해 주시기
바랍니다.
• 학술논문 이외의 기업 컨셜팅, 용역/계약 연구 (한국연구재단 포함) 등 상업적 분석사례가
많아지고 있습니다. 프로그래머를 고용하여 개발하기 바랍니다. 소프트웨어 산업이 죽고
있습니다
• Limit 버전은 20회 사용제한이 있습니다. Professional 버전은 구매해야 합니다. 구매를 원하시면
아래 주소로 연락바랍니다. 가격은 사용용도와 데이터 처리량에 따라 다릅니다.
hanpark@ynu.ac.kr parkhanwoo@hotmail.com
4. 1. Webonaver
WeboNaver 동의서 작성
URL :
https://docs.google.com/forms/d/
1NyLAnXg3mFbFQPSQNLkTtF_5Iir
BGqTsdPzyEkUiEu0/viewform
WeboNaver 사용 전 반드시
위의 URL에 방문하여
웹보매트릭스툴 사용동의서 작성
5. WeboNaver 관련 논문
• WeboNaver을 이용할 때에는 아래 참고문
헌을 반드시 적기 바랍니다. 저도 모르는
사이에 상업적 이용으로 보이는 분석사례
가 많아지고 있습니다.
• 사이버감성연구소는 지식의 사회적 확산
을 위해서 비상업적으로 사용하는 이용자
를 위해서 배포하고 있습니다.
6. WeboNaver 관련 논문
• 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가시성 분석
과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data Analysis Society. 11권 6호 (B). 3427-3440.
• 박한우 (2010년 12월). e-사이언스 시대의 인문사회학 연구하기-인터넷 연구방법을 중심으로. 사회과학연구. 30권, 2호, 195-211.
• 임연수, 박한우 (2010년 2월). 10.28 재보궐 선거의 블로그 캠페인에 대한 웹계량화 분석. Journal of the Korean Data Analysis Society,
12권, 1호 (B), 539-551.
• Khan, G. F., & Park, H. W. @ (2011). Measuring the Triple Helix on the Web: Longitudinal Trends in the University-Industry-
Government Relationship in Korea. Journal of the American Society for Information Science and Technology*.16 (12), 2443-2455.
• Khan, G.F., Cho, S.E., & Park, H. W. @ (2012). A Comparison of the Daegu and Edinburgh Musical Industries: A Triple Helix Approach.
Scientometrics*. 90 (1), 85-99.
• Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South
Korean Politicians. Government Information Quarterly*. 28 (4), 514-521.
• Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South
Korean Politicians. Government Information Quarterly*. 28 (4), 514-521.
• Lim, Y. S., & Park, H.W. @ (2013 forthcoming). The Structural Relationship between Politicians' Web Visibility and Political Finance
Networks: A Case Study of South Korea's National Assembly Members. New Media & Society*.
• Lim, Y. S., & Park, H.W. @ (2013). The Structural Relationship between Politicians' Web Visibility and Political Finance Networks: A
Case Study of South Korea's National Assembly Members. New Media & Society*. 15(1), 93-108.
• Nam, Y., Lee, Y.-O., Park, H.W. @ (2013). Can web ecology provide a clearer understanding of people’s information behavior during
election campaigns?. Social Science Information*. 52(1), 91-109.
• Nam, Y., Lee, Y., & Park, H.W.@ (2014 Accepted). Measuring web ecology by Facebook, Twitter, Blog and online news: 2012 general
election in South Korea. Quality & Quantity*. DOI: 10.1007/s11135-014-0016-9.
• Ozel, B., & Park, H. W. @ (2012). Examining Korean political figures using co-word analysis in agreement with facial expressions in
posted self-images. COLLNET JOURNAL OF SCIENTOMETRICS & INFORMATION MANAGEMEN, 6 (1), 43-60.
• Ozel, B., & Park, H. W. @ (2012). Online Image Content Analysis of Political Figures: An Exploratory Study, Quality & Quantity*. 46
(4), 1013–1024. DOI 10.1007/s11135-011-9445-x
• Sams, S., Lim, Y. S., & Park, H. W. @ (2011). E-research applications for tracking online socio-political capital in the Asia-Pacific
region. Asian Journal of Communication*. 21 (5), 450-466.
• Vergeer, M., Lim, Y. S., & Park, H. W. (2011). Mediated relations: New methods to study online social capital. Asian Journal of
Communication*. 21 (5), 430-449.
7. WeboNaver 관련 발표
* 박한우 (2014.4.10.). 사이버 소셜여론 조사도구로서의 네이버-웹보메
트릭스와 빅데이터 분석. 한국사이버커뮤니케이션 ‘네이버와 포털’ 특
별세미나. http://www.slideshare.net/hanpark/4march2014
* Park, H.W.(2014.4.4). The coming of shadows in big data research?
Widening and narrowing scholarly divide. International Workshop on
Social Media and Culture, KAIST. http://www.slideshare.net/hanpark/big-data-
divided-24-march2014
8.
9. 1. Webonaver
WeboNaver 프로그램 소개 (ver.2014.05.07)
Save Data Type
-> 기록 방식을 선택
Data Sources
-> 검색이 되는 카테고리를 선택
OutPut Format
-> 자료가 저장될 때에 포맷을 선택
Query File
-> 검색할 단어가 들어있는 TXT를 선택
Naver API, Authentication Key
-> 가지고 있는 키를 적어 넣는다.
Run Queries
-> 검색을 실시
13. 1. Webonaver
Query File 만들기
메모장에 쿼리를 입력한 후
[다른 이름으로 저장]한다.
만약, 띄어쓰기가 포함된 쿼리를
입력할 경우, 큰따옴표(“,”)를
사용하여 단어를 한정해준다.
• 저장 시
‘인코딩’은 반드시 ‘UTF-8’
파일 제목은 ‘text’로 저장함
14. 1. Webonaver
Query File 만들기
1. [Query File]에 ‘text’ 파일을 불
러옴
2. [Naver API Key]와
[Authorification Key]를 입력함
3. 원하는 [Data Sources] 체크
4. 하단에 [Run Queries] 클릭하
여 프로그램 실행
15. 1. Webonaver
Output
1. ‘Done’ 이라는 창이 뜨면 실행 완료된 것
2. ‘Text’를 저장한 폴더에 들어가 보면
체크했던 Data Sources에 따라
많은 Output 파일 생성된 것을 볼 수 있음
16. 1. Webonaver
Output - Count
각각의 count 파일
: 각각 쿼리가 가지고 있는 검색량(게시글) 수
: 가장 끝에 있는 값이 실제 네이버에서 검색결과를 갖고 있는 값
: 쿼리 뒤에 나열된 숫자들이 차이가 난다면 이는 프로그램의 오류가 아니라
첫 숫자는 존재할 수 있는 검색량의 가능성이며,
점차 숫자가 줄어드는 것은 실제 네이버에 저장된 검색량의 오차를 줄여가는 과정임.
17. 1. Webonaver
Output - Records
각각의 Records 파일
: 실제 검색된 글과 URL 주소 확인 가능
: URL 주소는 ‘www~’형식이 아닌 ‘OpenAPI’ 형식으로 나옴.
Webonaver 프로그램의 [Manipulate] 가능을 활용해
원래의 URL 주소(www~)를 얻을 수 있다.
: 각 쿼리 당 최대 1,000개까지 저장 가능
18. 1. Webonaver
Manipulate
원래 URL 얻기
1. Records 파일을 엑셀로 연다
2. OpenAPI 형식으로 된 주소
(C열)을 복사하여 메모장에
복사
3. 메모장을 [다른 이름으로 저장]
* 저장할 때!
: 파일명은 무엇이든 상관 없음
: 인코딩은 ‘ANSI’로
21. 3. KrKwic
KrKwic이란?
1. Korean Key Words In Context
2. 커뮤니케이션 메시지의 의미가 ‘자주 사용되는 단어’
에 있다고 판단하여, 특정 텍스트에서 자주 사용되
는 단어를 찾기 위해 사용
3. 오픈 사이언스 정신에 입각한
유일한 한글 Semantic Network Analysis
4. KrKwic/KrWords, KrTitle, KrText로 나뉘어져 있음
22. 3. KrKwic
KrKwic 구성
1. KrKwic/KrWords: 단어 빈도 분석을 통해 내용의 핵
심어, 주요 이미지, 중요 이슈를 파악함
2. KrTitle: 논문, 웹사이트, 기사, 특허, 법조문 등의
제목과 요약문 또는 주관식 응답, 드라마나 영화의
대사, 조직 목표, 광고 카피, 일상 대화 같이 비교적
짧은 메시지
3. KrText: KrTitle로 처리하기에 분량이 비교적 많은
메시지를 독립적인 파일로서 취급하여 분석
24. 3. KrKwic
KrKwic 주의
1. KrKwic 프로그램 설치 시, 오류 최소화를 위해
C드라이브에 바로 설치
- 혹은 ‘dev’라는 폴더를 새로 생성하여
‘dev’ 폴더 안에서 작업을 하는 것이 좋음
2. KrKwic는 도스버전과 윈도우버전이 존재하나
비교적 안전한 도스버전 사용 권장
* 윈도우 버전은 현재 버그 수정 중이며, 소프트웨어 등
록 후에 판매함
25. 3. KrKwic
KrKwic 사용 전 동의서 작성
URL:
https://docs.google.com/forms/d/1zJ
cFVQEF0JZML0bq-
gnQNNyzc1LfD_rzbzE2nEjCh_Y/viewf
orm
KrKwic 프로그램 사용 전에 반드시
위의 URL에 접속하여
KrKwic 사용 동의서 작성해야 함
30. 3. KrKwic
KrWords
엑셀을 이용해 ‘wrdfrq.dbf’ 파일을 열면
각각 단어의 빈도수를 알 수 있음
단어 빈도 목록을 이용하여 메시지의
핵심어를 파악할 수 있음
실제 조사에서는 정제 과정을 거쳐
무의미한 단어를 최대한으로 걸러주는
작업을 거쳐야 함
34. 3. KrKwic
KrTitle
폴더로 돌아가면 프로그램 실행 후 얻어
진 파일들을 확인할 수 있다
matrix.dbf
: 메시지(사례) X 단어(변인) 행렬로,
각 칸의 값은 단어가 메시지에서
출현한 빈도 나타냄
coocc.dat와 coocc.dbf
: 단어 X 단어 공출현 빈도 행렬로,
각 칸의 값은 단어들이 메시지에서
동시에 출현한 빈도를 나타냄
cosine.dat와 cosine.dbf
: 단어 X 단어 코사인 행렬로,
각 칸의 값은 단어 간 거리를 나타냄
45. 두 검색어의 관계
두 가지 단어를 동시에 검색하여 두 단어간의 관계 알 수 있음
Webonaver로 쿼리 검색 후 바로 네트워크 그릴 수 있음
46. 두 검색어의 관계
1. 두 가지 검색어를 함께
Webonaver(최신ver)로
분석해 각종 records와
count 파일을 얻어냄
- 이는 두 브랜드의 연관관계를
알기 위함이며
- 검색어 간의 그루핑(Grouping) 가능
** 유의사항
검색어를 메모장으로 저장할 때,
인코딩은 반드시 ‘UTF-8'로!!!!
4-2. 두 검색어의
관계
47. 2. 추출한 Count 파일을
엑셀로 연다
1) 카운트 된 숫자들 중
첫 번째 숫자들만 놔두고 지움
2) 그리고 다시 저장
(저장할 때 형식은 ‘Excel통합문서’로!!!,
이름은 상관없음)
4-2. 두 검색어의
관계
두 검색어의 관계
48. 3. 저장된 자료를 UCINET6에서 불러옴
- [Data] – [Import Excel] – [DL Type Format] 클릭 후
‘DL Editor’ 창이 뜨면 [File] – [Open Excel File] 클릭하여
저장한 파일 불러오기
(혹은 위의 이미지에 표시된 단축 아이콘들을 눌러서 불러오기)
4-2. 두 검색어의
관계
두 검색어의 관계
49. 4. 열린 창의 우측에 있는
‘Data format’을
‘Edgelist1’로 설정
1) 또, ‘Output Options’에서
‘Force Symmetry’를 체크해줌
(방향성이 없는 경우에만 해당함)
5. 설정을 마친 후,
파일 저장
-> 그러면 UCINET6에 사용되는
포맷으로 저장된 것임
4-2. 두 검색어의
관계
두 검색어의 관계
50. 6. Visual Network Map을 그리기 위해
UCINET6에 있는 [Netdraw]를 열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
51. 7. 위의 단축 아이콘을 차례로 눌러,
금방 저장했던 UCINET 포맷의 파일을
열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
52. 각 검색어 간의 네트워크를 나타낸 Map 확인할 수 있음
* 여러 옵션을 통해 네트워크 선의 굵기 등 설정 가능
4-2. 두 검색어의
관계
두 검색어의 관계
62. 단어구름 - Tagxedo
5. 네트워크
그리기
KrKwic 프로그램으로 얻은
‘wrdfrq.dbf’ 파일을 열어
자료 복사
63. 단어구름 - Tagxedo
5. 네트워크
그리기
Tagxedo – Creator
http://www.tagxedo.com/app.html
‘Load’를 클릭하여
‘Enter Text’에 자료 붙여 넣은 후
‘Submit’를 누른다.
64. 단어구름 - Tagxedo
5. 네트워크
그리기
단어구름 완성!
좌측에 있는
Respins와 Options를
이용해 단어 구름의
모양, 색깔 설정 가능
65. 이 슬라이드는 Thelwall, Webometric Analyst Manual 을 기초로
한국 이용자들이 Webometric Analyst 를 쉽게 사용할 수 있도록
만든 매뉴얼입니다. Webometric Analyst 최근 버전을 사용했으며,
사례 또한 원제와 상이합니다.
* This slide was made by Han Woo Park and his students to help
Korean users use the Webometric Analyst
WeboNaver와
Webometrics Analyst와 연결하기
74. 또 다른 방법
6-2. 또다른 방법
Query를 저장한 파일을 이
용해 Data Sources를 추출
하는 과정에서부터 원래의
URL을 함께 얻을 수 있는
방식
1. 초반에 만들었던 Query 파일
(‘text’라고 저장한 파일)을
[Query File]에 불러옴
2. [Naver API Key]와 [Auth. Key]
를 입력함
3. 원하는 [Data Sources] 체크
4. Output Format에서
[Webometric Analyst 2.0] 체크
5. 하단에 [RunQueries] 클릭하여
프로그램 실행
75. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
폴더로 돌아가면 records 파일이
생성된 것을 알 수 있음
76. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
Records 파일을 엑셀로 열어 오류가 난 부분은 삭제해 줌
(정제과정을 거치지 않으면 제대로 된 결과를 얻을 수 없음)
77. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
정제과정을 거친 파일을 [다른 이름으로 저장]함
* 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
78. 정제하여 저장한 파일을 다시 메모장으로 열어준다.
그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다.
원래의 URL 얻기 / 또 다른 방법
6-2. 또다른 방법
87. Prof. Han Woo PARK
CyberEmotions Research Center
Department of Media and Communincation,
YeungNam University, Korea
hanpark@ynu.ac.kr
http://www.hanpark.net
Formerly,
World Class University Webometrics Institute
WCU
WEBOMETRICS
INSTITUTE
INVESTIGATING INTERNET-BASED POLITIC WITH E-RESEARCH TOOLS