SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
통계연구(2012), 제17권 제2호, 53-66
언어네트워크분석을 이용한 통계법 내용분석
장정우1) ∙ 최경호2)
요약
언어네트워크분석은 최근 국내 언론매체 연구를 중심으로 소수연구들에서 실시되고 있는 연구방
법론으로, 재난안전관리기본법을 대상으로 한 류상일 등(2011)과 대통령의 연설문을 대상으로 한
이창길(2010)의 연구 등이 언어네트워크분석을 사용한 연구에 해당된다. 그러나 아직까지 통계법
에 대하여 계량적인 접근을 시도한 연구는 드물다. 이에 본 연구에서는 언어네트워크분석을 이
용하여 통계법에 대한 내용분석을 수행해 보았다. 현재 통계법은 법률 제10196호로 2010년 3월
31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성되어 있다.
그 결과 분석대상으로 삼은 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치
에 있음을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 국가에 있어
서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체제 구축이 되어
야 효율적인 국가통계운용이 된다고 할 수 있겠다. 텍스트로 구성된 자료를 계량적으로 분석하
여 시각적으로 확인해 보았다는 점에서 본 연구는 차별화 되었다고 할 수 있으며, 통계법을 법리
적인 측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법 등과의
비교연구 시 기초자료로 활용될 수 있을 것이다.
주요용어 : 계량적 접근, 내용분석, 언어네트워크분석, 통계법
1. 서론
통계제도는 한 나라에서 필요로 하는 통계정보를 어떤 체계로 생산하느냐에 따라
집중형 통계제도와 분산형 통계제도로 대별할 수 있다. 집중형 통계제도는 모든 통계
활동이 하나의 전문화된 통계작성기관에 집중되어 각 기관에서 필요로 하는 통계를
모두 작성․공급토록 되어 있는 통계제도이며, 분산형 통계제도는 통계활동이 각 기
관에 분산되어 각 기관의 고유 업무수행에 필요한 통계를 자체적으로 작성․이용하는
통계제도로서 우리나라 통계제도는 기본적으로 분산형 통계제도에 가깝다고 할 수 있
다(김재신, 1996). 그런데 분산형 통계제도 하에서는 통계중복 생산으로 인한 자원의
낭비, 응답자의 응답부담 가중, 질 낮은 통계의 생산 등 적지 않은 문제가 발생될 소
지가 있다. 이에 분산형 통계제도를 채택하는 국가에서는 발생할 수 있는 문제점을
종합조정하고 통계작성 체계를 정비함으로써 통계의 신뢰성과 통계제도 운용의 효율
1) 서울대학교 대학원 법학과, 석사과정. E-mail: lomah@hanmail.net
2) 교신저자. 전주대학교 기초의과학과(통계학), 교수. E-mail: ckh414@jj.ac.kr
54 장정우 ․ 최경호
성 확보를 위하여 통계법을 두고 있다. 우리나라도 예외는 아니어서, 법률 제10196호
로 2010년 3월 31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부
칙으로 구성된 통계법이 있다.
통계에 관한 사항을 종합적으로 조정하고 체계를 정비함으로써 통계의 진실성과
통계제도의 효율성 확립을 도모하기 위한 통계법이 제정․운용되고 있음에도 불구하
고, 아직까지 통계법 자체에 대한 연구는 드문 실정이다. 특히 통계법이 효율적으로
운용되기 위해서는 누가(또는 무엇이) 중심이 되어야 하며, 어떤 기관(또는 조직)들이
유기적인 협조체제를 구축해야 하는지 등에 대한 객관적이고 계량적인 분석이 필요하
다. 이를 위한 연구방법으로 최근에 각광을 받고 있는 연구방법으로 언어네트워크분
석(semantic network analysis)이 있다. 언어네트워크분석은 사회네트워크분석(social
network analysis)을 응용한 내용분석의 한 방법으로, 단어가 특정형태로 다른 언어들
과 조합되어 특별한 의미체계를 만드는 경향이 있기 때문에, 단어들 사이의 의미 네
트워크 행렬(semantic network matrix)을 만들어서 사회네트워크분석의 관점에서 시
각화한 분석방법이다.
본 연구에서는 언어네트워크분석을 통하여 통계법을 내용분석함으로서 특징과 그
구조적 모습에 대해 계량적 측면에서 살펴보고자 한다. 본 연구는 통계법을 법리적인
측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법
등과의 비교연구 시 기초자료로 활용될 수 있을 것으로 사료된다.
2. 통계법 개정현황
현행 통계법(시행 2010.7.1, 법률 제10196호, 2010.3.31, 일부개정)은 7개의 장과 41
개의 조문, 그리고 부칙으로 구성되어 있다. 이 법의 근간이 되는 2005년도 통계법 개
정작업 현황(국가통계인프라 강화 추진단, 2005)을 중심으로, 개정의 필요성, 주요 검
토사항 등에 대하여 살펴보면 다음과 같다. 급변하는 통계환경 변화에 능동적으로 대
처하고 다양한 통계수요에 적절히 부응하며, 국내 통계의 종합적 조정강화 및 통계위
원회 등 기구․제도 개선을 통한 통계의 품질개선과 업무의 효율성을 증대시킬 필요
가 발생되었다. 이에 ‘국가통계인프라 강화방안’을 근거로 통계법 개정(안)이 작성되었
는데, 주요 검토사항으로는 국가통계위원회신설(개편), 통계품질관리강화, 행정자료 통
계목적 활용화, 통계연구기관 등 통계기반 강화 내용 등이 선정되었다. 이에 더하여
세부 작업 과정에는, 법 개정관련 규정검토, 주요 개정사항의 주제별 정리, 국내 및
외국의 통계법 및 제도 검토, 통계작성기관(정부, 민간 등)회의, 개정 통계법(안) 작성
등이 포함되었다.
2005년도 통계법 개정작업의 주요내용을 정리해 보면 다음과 같다.
첫째, 통계발전계획 수립. 새로운 통계수요를 반영한 통계발전 방향을 제시할 필요
에 따라, ‘통계청장은 통계의 발전을 위하여 통계발전계획을 3~5년 단위로 수립․시행
언어네트워크분석을 이용한 통계법 내용분석 55
할 수 있다’는 조항을 신설하였다.
둘째, 국가통계위원회 설립. 자문위원회 성격의 심의․의결 기능을 담당하는 조직
의 필요성에 따라, ‘정부는 통계정책 및 통계작성․보급에 관한 주요사항을 심의․의
결하기 위하여 국가통계위원회를 둔다’는 조항을 신설하였다.
셋째, 통계품질진단. 통계품질 진단을 위한 명문규정을 신설하고자, ‘국가통계위원
회 위원장은 통계작성 제반 과정을 진단할 수 있다’는 조항을 신설하였다.
넷째, 행정자료의 제공. 부처간 행정자료 공유를 위한 명문규정 신설의 필요에 따
라, ‘통계작성기관의 장이 통계작성을 위하여 행정자료를 청구한때는 행정기관 및 공
공기관 등은 특별한 사유가 없는 한 응하여야 한다’는 조항을 신설하였다.
다섯째, 공표협의 사전신고제 폐지, 공표중지 명령제 도입. 통계작성기관 책임 공
표 및 자율성 보장을 위하여, ‘공표협의 의무 폐지 및 공표중지 명령제 도입’에 관한
조항을 부분 개정하였다.
3. 연구방법
3.1 언어 연결망 분석
언어네트워크 혹은 언어 연결망 분석은 구성요소들 간의 관계를 찾아내 시스템의
구조를 파악하는 사회네트워크분석을 의사소통메시지에 적용한 방법론으로, 공유된
의미를 통해 의사소통 구조를 파악하는데 유용한 방법이다. 언어네트워크분석에서 도
출된 네트워크 구조 간의 차이를 비교함에 있어 활용되는 지표에는 개별적 노드
(node)의 국소적(local) 특성을 나타내는 연결선 수(degree), 네트워크의 전역적
(global) 특성을 나타내는 밀도(density) 그리고 중심성(centrality) 등이 있다. 연결선
수와 관련하여, 연결정도는 한 노드가 맺고 있는 결점의 숫자로서 정의된다. 사람 간
의 네트워크에서 친구가 많은 사람이나 혹은 마당발이라고 불리는 사람은 연결정도가
많은 사람이다. 이러한 사람들은 동원할 수 있는 자원이 많고, 정보의 흐름에서도 핵
심적인 역할을 한다. 만일 이런 사람을 연결망에서 제거한다면 연결망은 와해되다시
피 할 정도로 연결망 결속에 중요한 역할을 담당한다. 을 노드의 수라 할 때, 밀도
란 가능한 총 관계 수 중에서 실제로 맺어진 관계 수의 비율로  

로 정의된
다(김용학, 2003). 중심성은 각 노드가 중심에 근접한 정도를 평가하는 지표로 집중도
(centralization)와는 다른 개념이다. 집중도는 네트워크 전체가 한가지의 중심으로 집
중된 정도를 의미한다. 이에 반하여 중심성은 각각의 노드가 네트워크 구조 내에서
얼마나 중심에 위치하고 있는가를 나타내는 지표이다(손동원, 2010). 중심성에는 근접
중심성(closeness)과 중개중심성(betweenness) 등이 있는데 각각 다음과 같다(허명회,
2010).
56 장정우 ․ 최경호
근접중심성 :    ≠ 
 

  ⋯
단, 는 노드 에서 에 이르는 ‘거리’ 즉 비근접도이므로 는 노드 
에서 에 이르는 근접도의 개념이다.
중개중심성 :    ≠ 
 ≠ ≠ 


  ⋯
단, 는 노드 에서 ≠ 로 가는 최단경로의 수이고, 는 노드 에서
≠ ≠ 로 가는 최단경로 가운데 노드 ≠ 를 거치는 경로의 수이다.
3.2 분석자료
본 연구에서 분석대상으로 활용한 통계법은 법률 제10196호로 2010년 3월 31일 일
부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성된 법률이
다. 전체 7장 중에서 내용분석으로 의미가 있다고 판단된 네 개의 장을 선택하였다.
내용어 뿐만 아니라 기능어를 포함한 단어를 분석단위로 하였는데, 이 과정에서 “제1
조(목적)” 등과 같이 조문의 의미를 나타내는 용어는 분석대상에서 제외하였다. 단어
를 코딩하는 과정에서 조사(~는, ~은, ~이, ~가 등)와 기능어(~되어야 한다, ~말한다
등)는 가급적 생략하였다. 또한 ‘통계의 작성․보급’과 같은 표현은 ‘통계작성’과 ‘통계
보급’으로 분리하여 그 뜻이 정확하게 되도록 분류 및 입력하였다. 다만 중복성을 방
지하고 연결망의 단순화를 위하여 ‘용어정의’나 ‘호’는 제외하였다. 이 과정에서 주관성
의 개입을 최소화하기 위하여 윤수재 등(2011)에서와 같이 기준표를 작성하고 각자
코딩하여 차이가 있는 경우 논의를 통해 이를 통일하는 방식으로 더 이상 차이가 생
기지 않을 때까지 계속 반복하였다.
<표 3.1> 분석대상 법조문
장 제목 구성
1장 총칙 5개 조항
2장 통계의 작성․보급 및 이용 기반 구축 10개 조항
4장 통계의 작성․보급 및 이용 14개 조항
5장 통계응답자의 의무 및 보호 등 3개 조항
언어네트워크분석을 이용한 통계법 내용분석 57
3.3 분석도구
통계법에 대한 언어네트워크분석을 위해서는 먼저 행렬을 만들어야 한다. 이를 위
해서 박한우 등(2004)이 만들고 공개한 KwKic을 활용하였다. KwKic 프로그램은 KrKwic,
KrTitle, KrText 등 3개의 하위 프로그램으로 구성되어 있는데, 먼저 KrKwic을 이용하여
핵심어를 파악한다. 핵심어는 선택된 메시지에서 자주 출현하는 단어로 조작적 정의된
다. 다음 KrTitle을 이용하여 공출현빈도(co-occurrence) 대칭행렬을 도출한다. 공출현
빈도 행렬이 만들어지면 R의 sna 패키지 내의 다양한 함수를 이용하여 밀도, 연결선
의 수, 중앙성 지표 등을 구하고, 나아가 연결망 그래프 등을 그리게 된다. 한편 지표
의 표현에 있어 연결선의 수는 김지수(2011)에서와 같이 상대적 크기로 환산하여 비
교하였다.
KwKic 프로그램은 http://www.hanpark.net/에 공개된 소프트웨어로 내려 받아 설
치하면 된다. 도스버전이라 처음 사용하는데 야간 어려움이 있으나, 텍스트자료에 대
한 네트워크분석을 위한 전 단계처리로는 매우 유용한 소프트웨어이다. 하위 3개의
프로그램 중 단어빈도분석이 주목적인 KwKic의 경우 입력파일은 ASCII 인코딩의 텍
스트 파일형태로, 각 줄은 1,000개의 문자를 초과하면 안 된다. 디폴트는 text.txt이다.
프로그램을 실행하면, 텍스트 파일형태의 wrdfrq.txt 파일이 결과로서 생성된다. 다음
으로 하위 프로그램 중 KrTitle은 논문, 웹페이지, 기사, 특허, 법조문 등의 제목 및
요약문과 같이 비교적 짧은 메시지를 분석하기 위한 것이다. 이를 이용한 분석도
ASCII 인코딩의 텍스트 파일형태여야 하며, 문자수가 공백을 포함하여 999개를 초과
하면 안 된다. 분석결과 도출되는 coocc.dbf 파일은 단어(words)x단어(words)의 1모드
공출현빈도 대칭형 행렬인데, 이는 SPSS나 Excel 등에서 이용가능하다(박한우 등,
2004).
4. 언어네트워크분석
KwKic 프로그램과 R의 sna 패키지 내의 다양한 함수를 이용하여 수행한 언어네
트워크분석 결과를 살펴보자. 먼저 전역적 특성을 나타내는 밀도와 빈도수가 2이상인
단어의 목록은 <표 4.1>과 같다. 네트워크 내의 노드가 서로 얼마나 많은 관계를 맺
고 있는지를 표현하기 위한 지표인 밀도에 대해서는 제1장 총칙이 가장 크게 나타났
다. 각 장의 크기가 크게 달라 큰 의미를 부여하기는 어렵지만 제4장의 경우 빈도수
가 2이상인 단어가 다른 장에 비하여 많게 나타났다. 각 장마다 그 장에서 추구하고
자 하는 목적을 나타내는 단어들이 중심이 된 가운데, 제1장의 경우 통계보급, 통계이
용, 통계작성 등이 빈도수가 높은 것으로 나타났다. 이는 제1장이 통계법의 목적과 기
본이념 그리고 국가의 책무 등을 정하고 있는 부분인 바, 통계의 보급과 이용 및 작
성에 관한 필요사항이 많이 언급된 때문인 것으로 사료된다.
58 장정우 ․ 최경호
<표 4.1> 밀도와 빈도수가 2이상인 단어
장 밀도 빈도수가 2이상인 단어
1장 1.156
통계보급, 통계이용, 통계작성, 통계, 통계법, 국가, 비밀보장, 자료제출,
통계작성기관장, 통계청장
2장 0.519
통계청장, 통계작성기관장, 정기통계품질진단, 대통령령, 수시통계품질
진단, 통계작성, 자체통계품질진단, 통계보급, 통계, 통계교육, 통계작성
기관, 국가통계위원회, 방법, 예산, 인력, 절차, 기술지원, 기획재정부장
관, 통계이용, 통계종사자, 통계책임관
4장 0.321
통계작성기관장, 통계청장, 통계작성, 통계자료, 제공, 대통령령, 행정자
료, 협의, 개인, 단체, 법인, 통계, 승인, 승인취소, 통계작성기관, 표준분
류, 고시, 요청, 통계간행물, 통계공표, 통계데이터베이스구축, 공표, 요
청기관장, 자료제출, 제공기관장, 제공방법, 지정통계작성, 협조요청, 공
공기관장, 관계인, 권고, 발간, 발간내역, 변경, 분류코드, 새로운, 소요
경비, 요구, 자료, 작성, 작성중지, 정보보호조치, 제한, 조사, 조사대상,
조사방법, 지방자치단체장, 지정통계, 질문, 통계데이터베이스, 통계데이
터베이스연계, 통계데이터베이스통합, 통계이용자, 표준화, 확인
5장 0.220 통계작성, 개인, 단체, 법인
4.1 제1장 총칙에 대한 분석
제1장 총칙은 모두 5개의 조항으로 구성되어 있는데, 주요 단어에 대한 연결선의
수와 근접중심성을 살펴보면 <표 4.2>와 같다. 연결선의 수는 ‘통계작성’이 가장 큰
가운데 ‘통계보급’과 ‘통계이용’이 그 다음 큰 것으로 나타났다. 이는 연결망 그래프로
부터도 확인할 수 있다. <그림 4.1>에서 볼 수 있듯이 관계망의 중심에 이들 3 단어
가 있음을 알 수 있다. 결국 제1장 총칙은 통계의 작성과 보급과 이용에 필요한 제반
사항을 정하는 부분임을 알 수 있다.
<표 4.2> 제1장의 연결선의 수와 근접중심성
단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성
통계보급 0.192 2.91 국가 0.019 0.71
통계이용 0.163 2.46 비밀보장 0.067 1.23
통계작성 0.269 3.20 자료제출 0.077 1.83
통계 0.000 0.00 통계작성기관장 0.087 1.98
통계법 0.067 1.31 통계청장 0.058 1.27
언어네트워크분석을 이용한 통계법 내용분석 59
<그림 4.1> 제1장에 대한 연결망 그래프
비교를 위하여 중국통계법에 대한 언어네트워크분석 결과를 간략하게 살펴보자.
본 연구에서 활용한 중국통계법은 1983년 12월 8일 제6차 국민의회 상임위원회의 3차
모임에서 채택되고, 1996년 5월 15일 채택된 중국통계법 개정에 관한 국민의회 상임
위원회의 결정에 다라 개정된 법률이다(통계청, 2001). 법체계가 다르기 때문에 우리
나라 통계법과 대응비교는 어렵기에, 일단 우리나라 통계법의 총칙과 유사한 제1장
일반적 조항에 대한 연결망 그래프를 그려보면 <그림 4.2>와 같다. 전체 8조로 되어
있어 내용이 우리나라 제1장 총칙보다 많음을 감안하더라도 법률에서 사용된 단어가
우리나라 보다 훨씬 다양한 것으로 나타났다. 그러함에도 불구하고 연결망의 밀도가
0.94로 나타나 단어들 간의 연결 관계 정도가 높음을 알 수 있다. 한편 근접중심성에
대해서는 ‘국가’가 2.92로 가장 높고, 다음으로 통계작업(2.84), 통계자료(2.41), 통계법
(2.35), 통계기구(2.17)의 순으로 나타나, 국가가 중심이 된다는 점에서 통계의 작성과
이용․보급이 중심이 되는 우리나라와는 많은 차이가 있음을 알 수 있다. 중국통계행
정시스템에 대한 면밀한 분석이 있어야 하나, 일단 이러한 차이는 중국이 사회주의국
가이기 때문에 기인한 것으로 여겨진다.
60 장정우 ․ 최경호
<그림 4.2> 중국통계법 제1장 연결망 그래프
4.2 제2장 통계의 작성 ∙ 보급 및 이용 기반 구축에 대한 분석
모두 10개의 조항으로 구성된 제2장에 대한 주요 단어의 연결선의 수와 근접중심
성을 살펴보면 <표 4.3>와 같다. 각각의 노드가 네트워크 구조 내에서 얼마나 중심에
위치하고 있는가를 나타내는 중심성지표 중의 하나인 근접중심성에 대해서는 ‘통계청
장’이 가장 큰 값을 보이고 있다. 이는 연결망 그래프로 부터도 확인 가능하다. 이로
부터 제2장의 법령이 시행되는데 있어서는 통계청장이 가장 중용한 역할을 담당함을
알 수 있다. 참고로 통계청장은 정부조직법 제23조(기획재정부) ⑩항(통계청에 청장 1
명과 차장 1명을 두되, 청장은 정무직으로 하고, 차장은 고위공무원단에 속하는 별정
직국가공무원으로 보한다)에 그 근거를 두고 있다.
<표 4.3> 제2장의 연결선의 수와 근접중심성
단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성
통계청장 0.174 2.17 국가통계위원회 0.041 0.66
통계작성기관장 0.000 0.00 방법 0.046 1.07
정기통계품질진단 0.096 1.78 예산 0.055 1.23
대통령령 0.110 1.56 인력 0.041 1.40
수시통계품질진단 0.000 1.62 절차 0.018 1.01
통계작성 0.073 0.00 기술지원 0.018 0.89
자체통계품질진단 0.106 1.45 기획재정부장관 0.028 0.63
통계보급 0.000 1.61 통계이용 0.023 0.87
통계 0.041 0.00 통계종사자 0.018 0.92
통계교육 0.000 1.45 통계책임관 0.000 0.63
통계작성기관 0.023 0.00 1
언어네트워크분석을 이용한 통계법 내용분석 61
<그림 4.3> 제2장에 대한 연결망 그래프
4.3 제4장 통계의 작성∙보급 및 이용에 대한 분석
모두 14개 조항으로 구성된 제4장에서는 통계작성의 승인, 통계작성 승인의 취소,
표준분류, 행정자료의 제공, 자료제출명령, 실지조사 등에 대한 내용을 규정하고 있다.
제4장의 주요 단어에 대한 연결선의 수와 근접중심성은 <표 4.4>와 같다. <표 4.4>와
<그림 4.4>로부터 제4장의 핵심이 되는 단어는 통계작성, 통계자료, 통계청장 등임을
알 수 있다. 제4장의 목적인 통계의 작성과 보급 및 이용에 있어서도 역시 통계청장
의 역할이 매우 중요함을 알 수 있다. 즉, 법령으로 규정된 통계법의 효율적 운용을
위해서는, 무엇보다도 통계청장의 역할이 중요함을 계량적으로 확인할 수 있다.
<표 4.4> 제4장의 연결선의 수와 근접중심성
단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성
통계작성기관장 0.000 0.00 공공기관장 0.011 0.67
통계청장 0.078 2.83 관계인 0.006 0.79
통계작성 0.192 3.59 권고 0.006 1.03
통계자료 0.065 2.93 발간 0.000 0.00
제공 0.000 0.00 발간내역 0.000 0.00
대통령령 0.029 1.57 변경 0.015 1.23
행정자료 0.051 1.58 분류코드 0.008 0.86
협의 0.048 2.32 새로운 0.008 1.03
개인 0.058 2.31 소요경비 0.013 0.89
단체 0.067 2.45 요구 0.012 1.05
법인 0.055 2.26 자료 0.000 0.00
62 장정우 ․ 최경호
단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성
통계 0.000 0.00 작성 0.000 0.00
승인 0.000 0.00 작성중지 0.000 0.00
승인취소 0.000 0.00 정보보호조치 0.018 1.00
통계작성기관 0.000 0.00 제한 0.018 1.00
표준분류 0.027 1.85 조사 0.000 0.00
고시 0.019 1.57 조사대상 0.000 0.00
요청 0.000 0.00 조사방법 0.000 0.00
통계간행물 0.016 1.44 지방자치단체장 0.015 0.98
통계공표 0.013 1.27 지정통계 0.017 1.25
통계DB구축 0.000 0.00 질문 0.012 1.05
공표 0.023 1.92 통계DB 0.000 0.00
요청기관장 0.028 1.20 통계DB연계 0.000 0.00
자료제출 0.000 0.00 통계DB통합 0.000 0.00
제공기관장 0.028 1.20 통계이용자 0.006 0.70
제공방법 0.000 0.00 표준화 0.008 0.86
지정통계작성 0.017 1.25 확인 0.012 1.05
협조요청 0.000 0.00 1
<그림 4.4> 제4장에 대한 연결망 그래프
언어네트워크분석을 이용한 통계법 내용분석 63
4.4 제5장 통계응답자의 의무 및 보호 등에 대한 분석
제5장은 단3개의 조항으로 이루어지는 등 전체적인 내용이 많지 않을 뿐 아니라,
<표 4.1>에서 보듯이 빈도수가 2이상인 단어도 많지 않다. 따라서 각종 지표를 보는
것은 별 의미가 없기에 모든 단어를 대상으로 연결망 그래프만 그려 보았다. <그림
4.5>에서 보듯이 비밀보호와 관련된 사항, 조사 및 응답에 관한 사항 등 3개 정도의
그룹으로 분할됨을 알 수 있다. 전체적인 연결정도가 작아 연결망의 밀도도 가장 낮
은 0.220으로 나타났다. 언어네트워크 측면에서 볼 때 제5장은 조항 간의 연결정도가
낮은 장이라고 하겠다.
<그림 4.5> 제5장에 대한 연결망 그래프
5. 결론
통계법을 해설한 김재신(1996)에 따르면, 통계법은 통계의 작성․보급 및 이용과
그 기반구축 등에 관하여 필요한 사항을 정함으로써 통계의 신뢰성과 통계제도 운용
의 효율성을 확보함을 목적으로 한다. 이와 같은 목적을 달성하기 위하여 통계법은
통계청장에게 많은 권한과 의무를 부여하고 있는 바, 지정기관 및 지정통계의 지정,
통계작성승인․공포협의․발간승인 등 일련의 통계작성활동에 대한 조정 등의 권한과
64 장정우 ․ 최경호
함께 통계자료를 널리 활용할 의무 및 통계작성과정에서 수집된 통계자료의 비밀을
보호할 의무 등을 부여하여 정확한 통계가 시의성 있게 널리 활용될 수 있도록 도모
하고 있다.
그런데 현재까지 통계법이 실제로 목적달성을 위하여 통계청장에게 많은 권한과
의무가 부여된 형태로 제정되었는지 여부를 계량적으로 확인할 수는 없었다. 그 이유
는 텍스트위주의 언어적 자료를 계량적으로 분석하는 방법론이 많지 않았기 때문이
다. 그러나 최근 들어 이러한 문제에 대한 해결방안의 일환으로 언어네트워크분석이
개발되었다. 이에 본 연구에서는 언어네트워크분석을 이용하여 통계법에 대하여 내용
분석을 실시해 보았다.
그 결과 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치에 있음
을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 경우에
있어서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체
제 구축이 되어야 효율적인 국가통계운용이 된다고 할 수 있겠다.
텍스트로 구성된 자료를 계량적으로 분석하여 시각적으로 확인해 본 점, 그리고
통계법을 법리적인 측면에서가 아닌 기술통계적인 측면에서 분석해 본 점 등에서 본
연구는 차별화 되었다고 할 수 있다. 법체계가 달라 충분한 비교를 해 보진 못했으나
중국통계법과의 비교를 통하여 의미 있는 차이점을 발견한 점 등에 비추어 볼 때, 향
후 다른 국가의 통계법 등과의 비교연구 시 기초자료로 활용될 수 있을 것으로 사료
된다. 다만 본 연구에서 객관적이고 계량적인 분석방법을 통한 연구를 진행하기 위하
여 언어네트워크분석을 활용한 실증적이고 계량적인 연구방법을 이용하였으나, 연구
분석 결과에 대한 해석에서 일부 본 연구자의 주관적인 판단이 작용했을 수 있는 점,
그리고 단순히 통계법을 언어네트워크분석 한 결과로부터 도출된 결론이라는 점은 분
명 본 연구의 한계이다.
(2012년 7월 9일 접수, 2012년 7월 23일 수정, 2012년 9월 19일 채택)
언어네트워크분석을 이용한 통계법 내용분석 65
참고문헌
국가통계인프라 강화 추진단. (2005). <통계법 개정작업 현황>, 통계청.
김용학. (2003). <사회 연결망 분석>, 박영사, 서울.
김재신. (1996). 통계법 해설, <1996 한국통계학회 춘계학술대회 발표논문집>, 1-6.
김지수 (2011). <갈등 당사자의 프레임 변화에 관한 연구>, 중앙대학교 대학원 석사학
위논문.
류상일, 남궁승태 (2011). 재난안전 관련 법제 분석, <한국위기관리논집>, 7(6), 29-46.
박한우, Leydesdorff, L. (2004). 한국어의 내용분석을 위한 KrKwic 프로그램의 이해와
적용: Daum.net에서 제공된 지역혁신에 관한 뉴스를 대상으로, <한국자료분
석학회지>, 6(5), 1377-1387.
윤수재, 김지수. (2011). 중앙정부 정책만족도 개선방안에 대한 내부고객과 외부전문가의
인식분석: 언어네트워크분석을 중심으로, <한국정책학회보>, 20(3), 133-161.
이창길 (2010). 정권초기의 가치지향과 정책우선순위: 참여정부와 이명박정부의 언어네
트워크 비교분석, <한국행정학보>, 44(3), 165-189.
통계청 (2001). <주요 국가의 통계법령>, 통계기획국.
허명회 (2010). <R활용한 사회네트워크분석 입문>, 자유아카데미, 서울.
66 장정우 ․ 최경호
Statistics Act Content Analysis using
Semantic Network Analysis
Jeong-Woo Jang1) ∙ Kyoung-Ho Choi2)
Abstract
Semantic network analysis is a research method which is being done in some studies,
especially in the mass media study, and the study on the Disaster Safety Management Basic
Act by Ryu Sang-il et al.(2011) and the study on the President's speech by Lee
Chang-gil(2010) are the studies conducted by Semantic network analysis. But there have so
far been few studies which make a quantitative approach to Statistics Act. So this study deals
with the content analysis on the Statistics Act through Semantic network analysis. The present
Statistics Act (Enforcement Date 1. Jul, 2010. Act No.10196. 31. Mar, 2010, Partial Amendment)
is consist of 7 chapters and 41 articles and addenda. Consequently, it was found that the
director of the Statistical Information Service holds a key position in Chapter 1, 2 and 4
analyzed here. So the role of the director of the Statistical Information Service is the most
important in such country as Korea that adopts decentralized statistical system, and the
cooperation with the director of the Statistical Information Service at the center is needed for
the National Statistics to work effectively. This study is characterized by the visualization of
the text material through quantitative analysis, and the analysis of Statistics Act in
technical-statistical aspect rather than in legal aspect will provide the basis for the comparative
study on Statistics Acts between the countries.
Key words : Quantitative approach, Content analysis, Semantic network matrix,
Statistics Act.
1) Graduate school of Department of Law, Seoul National University. E-mail: lomah@hanmail.net
2) (corresponding author) Professor of Basic Medical Science(Statistics Major), Jeonju University.
E-mail: ckh414@jj.ac.kr

Contenu connexe

Plus de Yubyeol Kim

2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소
2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소
2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소Yubyeol Kim
 
페이스북 동영상 광고 업데이트
페이스북 동영상 광고 업데이트페이스북 동영상 광고 업데이트
페이스북 동영상 광고 업데이트Yubyeol Kim
 
페이스북 유사타겟 2015
페이스북 유사타겟 2015페이스북 유사타겟 2015
페이스북 유사타겟 2015Yubyeol Kim
 
온라인 환경변화에 따른 소통방안 최종본 2014 문체부
온라인 환경변화에 따른 소통방안 최종본 2014 문체부온라인 환경변화에 따른 소통방안 최종본 2014 문체부
온라인 환경변화에 따른 소통방안 최종본 2014 문체부Yubyeol Kim
 
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트Yubyeol Kim
 
The definitive guide to engaging content marketing 141111
The definitive guide to engaging content marketing 141111The definitive guide to engaging content marketing 141111
The definitive guide to engaging content marketing 141111Yubyeol Kim
 
Instagram study2014q3 simplymeasured
Instagram study2014q3 simplymeasuredInstagram study2014q3 simplymeasured
Instagram study2014q3 simplymeasuredYubyeol Kim
 
Brandreport icebucket 140829
Brandreport icebucket 140829Brandreport icebucket 140829
Brandreport icebucket 140829Yubyeol Kim
 
2014 sns 이용행태 보고서
2014 sns 이용행태 보고서2014 sns 이용행태 보고서
2014 sns 이용행태 보고서Yubyeol Kim
 
언론홍보 성과의 평가 기준 개발 Kais tmba
언론홍보 성과의 평가 기준 개발 Kais tmba언론홍보 성과의 평가 기준 개발 Kais tmba
언론홍보 성과의 평가 기준 개발 Kais tmbaYubyeol Kim
 
홍보와Pr의단어의의미차이 한국언론학회 박종민
홍보와Pr의단어의의미차이 한국언론학회 박종민홍보와Pr의단어의의미차이 한국언론학회 박종민
홍보와Pr의단어의의미차이 한국언론학회 박종민Yubyeol Kim
 

Plus de Yubyeol Kim (13)

2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소
2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소
2015 국내 기업 및 기관 소셜미디어 운영현황 및 트렌드 kpr소셜커뮤니케이션연구소
 
페이스북 동영상 광고 업데이트
페이스북 동영상 광고 업데이트페이스북 동영상 광고 업데이트
페이스북 동영상 광고 업데이트
 
페이스북 유사타겟 2015
페이스북 유사타겟 2015페이스북 유사타겟 2015
페이스북 유사타겟 2015
 
온라인 환경변화에 따른 소통방안 최종본 2014 문체부
온라인 환경변화에 따른 소통방안 최종본 2014 문체부온라인 환경변화에 따른 소통방안 최종본 2014 문체부
온라인 환경변화에 따른 소통방안 최종본 2014 문체부
 
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트
소셜관점에서 바라본 2014년 인터넷 마케팅 트렌드 및 인사이트
 
읨Krkwic
읨Krkwic읨Krkwic
읨Krkwic
 
읨Krkwic.intro
읨Krkwic.intro읨Krkwic.intro
읨Krkwic.intro
 
The definitive guide to engaging content marketing 141111
The definitive guide to engaging content marketing 141111The definitive guide to engaging content marketing 141111
The definitive guide to engaging content marketing 141111
 
Instagram study2014q3 simplymeasured
Instagram study2014q3 simplymeasuredInstagram study2014q3 simplymeasured
Instagram study2014q3 simplymeasured
 
Brandreport icebucket 140829
Brandreport icebucket 140829Brandreport icebucket 140829
Brandreport icebucket 140829
 
2014 sns 이용행태 보고서
2014 sns 이용행태 보고서2014 sns 이용행태 보고서
2014 sns 이용행태 보고서
 
언론홍보 성과의 평가 기준 개발 Kais tmba
언론홍보 성과의 평가 기준 개발 Kais tmba언론홍보 성과의 평가 기준 개발 Kais tmba
언론홍보 성과의 평가 기준 개발 Kais tmba
 
홍보와Pr의단어의의미차이 한국언론학회 박종민
홍보와Pr의단어의의미차이 한국언론학회 박종민홍보와Pr의단어의의미차이 한국언론학회 박종민
홍보와Pr의단어의의미차이 한국언론학회 박종민
 

의미분석망 분석 통계청 논문

  • 1. 통계연구(2012), 제17권 제2호, 53-66 언어네트워크분석을 이용한 통계법 내용분석 장정우1) ∙ 최경호2) 요약 언어네트워크분석은 최근 국내 언론매체 연구를 중심으로 소수연구들에서 실시되고 있는 연구방 법론으로, 재난안전관리기본법을 대상으로 한 류상일 등(2011)과 대통령의 연설문을 대상으로 한 이창길(2010)의 연구 등이 언어네트워크분석을 사용한 연구에 해당된다. 그러나 아직까지 통계법 에 대하여 계량적인 접근을 시도한 연구는 드물다. 이에 본 연구에서는 언어네트워크분석을 이 용하여 통계법에 대한 내용분석을 수행해 보았다. 현재 통계법은 법률 제10196호로 2010년 3월 31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성되어 있다. 그 결과 분석대상으로 삼은 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치 에 있음을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 국가에 있어 서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체제 구축이 되어 야 효율적인 국가통계운용이 된다고 할 수 있겠다. 텍스트로 구성된 자료를 계량적으로 분석하 여 시각적으로 확인해 보았다는 점에서 본 연구는 차별화 되었다고 할 수 있으며, 통계법을 법리 적인 측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법 등과의 비교연구 시 기초자료로 활용될 수 있을 것이다. 주요용어 : 계량적 접근, 내용분석, 언어네트워크분석, 통계법 1. 서론 통계제도는 한 나라에서 필요로 하는 통계정보를 어떤 체계로 생산하느냐에 따라 집중형 통계제도와 분산형 통계제도로 대별할 수 있다. 집중형 통계제도는 모든 통계 활동이 하나의 전문화된 통계작성기관에 집중되어 각 기관에서 필요로 하는 통계를 모두 작성․공급토록 되어 있는 통계제도이며, 분산형 통계제도는 통계활동이 각 기 관에 분산되어 각 기관의 고유 업무수행에 필요한 통계를 자체적으로 작성․이용하는 통계제도로서 우리나라 통계제도는 기본적으로 분산형 통계제도에 가깝다고 할 수 있 다(김재신, 1996). 그런데 분산형 통계제도 하에서는 통계중복 생산으로 인한 자원의 낭비, 응답자의 응답부담 가중, 질 낮은 통계의 생산 등 적지 않은 문제가 발생될 소 지가 있다. 이에 분산형 통계제도를 채택하는 국가에서는 발생할 수 있는 문제점을 종합조정하고 통계작성 체계를 정비함으로써 통계의 신뢰성과 통계제도 운용의 효율 1) 서울대학교 대학원 법학과, 석사과정. E-mail: lomah@hanmail.net 2) 교신저자. 전주대학교 기초의과학과(통계학), 교수. E-mail: ckh414@jj.ac.kr
  • 2. 54 장정우 ․ 최경호 성 확보를 위하여 통계법을 두고 있다. 우리나라도 예외는 아니어서, 법률 제10196호 로 2010년 3월 31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부 칙으로 구성된 통계법이 있다. 통계에 관한 사항을 종합적으로 조정하고 체계를 정비함으로써 통계의 진실성과 통계제도의 효율성 확립을 도모하기 위한 통계법이 제정․운용되고 있음에도 불구하 고, 아직까지 통계법 자체에 대한 연구는 드문 실정이다. 특히 통계법이 효율적으로 운용되기 위해서는 누가(또는 무엇이) 중심이 되어야 하며, 어떤 기관(또는 조직)들이 유기적인 협조체제를 구축해야 하는지 등에 대한 객관적이고 계량적인 분석이 필요하 다. 이를 위한 연구방법으로 최근에 각광을 받고 있는 연구방법으로 언어네트워크분 석(semantic network analysis)이 있다. 언어네트워크분석은 사회네트워크분석(social network analysis)을 응용한 내용분석의 한 방법으로, 단어가 특정형태로 다른 언어들 과 조합되어 특별한 의미체계를 만드는 경향이 있기 때문에, 단어들 사이의 의미 네 트워크 행렬(semantic network matrix)을 만들어서 사회네트워크분석의 관점에서 시 각화한 분석방법이다. 본 연구에서는 언어네트워크분석을 통하여 통계법을 내용분석함으로서 특징과 그 구조적 모습에 대해 계량적 측면에서 살펴보고자 한다. 본 연구는 통계법을 법리적인 측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법 등과의 비교연구 시 기초자료로 활용될 수 있을 것으로 사료된다. 2. 통계법 개정현황 현행 통계법(시행 2010.7.1, 법률 제10196호, 2010.3.31, 일부개정)은 7개의 장과 41 개의 조문, 그리고 부칙으로 구성되어 있다. 이 법의 근간이 되는 2005년도 통계법 개 정작업 현황(국가통계인프라 강화 추진단, 2005)을 중심으로, 개정의 필요성, 주요 검 토사항 등에 대하여 살펴보면 다음과 같다. 급변하는 통계환경 변화에 능동적으로 대 처하고 다양한 통계수요에 적절히 부응하며, 국내 통계의 종합적 조정강화 및 통계위 원회 등 기구․제도 개선을 통한 통계의 품질개선과 업무의 효율성을 증대시킬 필요 가 발생되었다. 이에 ‘국가통계인프라 강화방안’을 근거로 통계법 개정(안)이 작성되었 는데, 주요 검토사항으로는 국가통계위원회신설(개편), 통계품질관리강화, 행정자료 통 계목적 활용화, 통계연구기관 등 통계기반 강화 내용 등이 선정되었다. 이에 더하여 세부 작업 과정에는, 법 개정관련 규정검토, 주요 개정사항의 주제별 정리, 국내 및 외국의 통계법 및 제도 검토, 통계작성기관(정부, 민간 등)회의, 개정 통계법(안) 작성 등이 포함되었다. 2005년도 통계법 개정작업의 주요내용을 정리해 보면 다음과 같다. 첫째, 통계발전계획 수립. 새로운 통계수요를 반영한 통계발전 방향을 제시할 필요 에 따라, ‘통계청장은 통계의 발전을 위하여 통계발전계획을 3~5년 단위로 수립․시행
  • 3. 언어네트워크분석을 이용한 통계법 내용분석 55 할 수 있다’는 조항을 신설하였다. 둘째, 국가통계위원회 설립. 자문위원회 성격의 심의․의결 기능을 담당하는 조직 의 필요성에 따라, ‘정부는 통계정책 및 통계작성․보급에 관한 주요사항을 심의․의 결하기 위하여 국가통계위원회를 둔다’는 조항을 신설하였다. 셋째, 통계품질진단. 통계품질 진단을 위한 명문규정을 신설하고자, ‘국가통계위원 회 위원장은 통계작성 제반 과정을 진단할 수 있다’는 조항을 신설하였다. 넷째, 행정자료의 제공. 부처간 행정자료 공유를 위한 명문규정 신설의 필요에 따 라, ‘통계작성기관의 장이 통계작성을 위하여 행정자료를 청구한때는 행정기관 및 공 공기관 등은 특별한 사유가 없는 한 응하여야 한다’는 조항을 신설하였다. 다섯째, 공표협의 사전신고제 폐지, 공표중지 명령제 도입. 통계작성기관 책임 공 표 및 자율성 보장을 위하여, ‘공표협의 의무 폐지 및 공표중지 명령제 도입’에 관한 조항을 부분 개정하였다. 3. 연구방법 3.1 언어 연결망 분석 언어네트워크 혹은 언어 연결망 분석은 구성요소들 간의 관계를 찾아내 시스템의 구조를 파악하는 사회네트워크분석을 의사소통메시지에 적용한 방법론으로, 공유된 의미를 통해 의사소통 구조를 파악하는데 유용한 방법이다. 언어네트워크분석에서 도 출된 네트워크 구조 간의 차이를 비교함에 있어 활용되는 지표에는 개별적 노드 (node)의 국소적(local) 특성을 나타내는 연결선 수(degree), 네트워크의 전역적 (global) 특성을 나타내는 밀도(density) 그리고 중심성(centrality) 등이 있다. 연결선 수와 관련하여, 연결정도는 한 노드가 맺고 있는 결점의 숫자로서 정의된다. 사람 간 의 네트워크에서 친구가 많은 사람이나 혹은 마당발이라고 불리는 사람은 연결정도가 많은 사람이다. 이러한 사람들은 동원할 수 있는 자원이 많고, 정보의 흐름에서도 핵 심적인 역할을 한다. 만일 이런 사람을 연결망에서 제거한다면 연결망은 와해되다시 피 할 정도로 연결망 결속에 중요한 역할을 담당한다. 을 노드의 수라 할 때, 밀도 란 가능한 총 관계 수 중에서 실제로 맺어진 관계 수의 비율로    로 정의된 다(김용학, 2003). 중심성은 각 노드가 중심에 근접한 정도를 평가하는 지표로 집중도 (centralization)와는 다른 개념이다. 집중도는 네트워크 전체가 한가지의 중심으로 집 중된 정도를 의미한다. 이에 반하여 중심성은 각각의 노드가 네트워크 구조 내에서 얼마나 중심에 위치하고 있는가를 나타내는 지표이다(손동원, 2010). 중심성에는 근접 중심성(closeness)과 중개중심성(betweenness) 등이 있는데 각각 다음과 같다(허명회, 2010).
  • 4. 56 장정우 ․ 최경호 근접중심성 :    ≠       ⋯ 단, 는 노드 에서 에 이르는 ‘거리’ 즉 비근접도이므로 는 노드  에서 에 이르는 근접도의 개념이다. 중개중심성 :    ≠   ≠ ≠      ⋯ 단, 는 노드 에서 ≠ 로 가는 최단경로의 수이고, 는 노드 에서 ≠ ≠ 로 가는 최단경로 가운데 노드 ≠ 를 거치는 경로의 수이다. 3.2 분석자료 본 연구에서 분석대상으로 활용한 통계법은 법률 제10196호로 2010년 3월 31일 일 부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성된 법률이 다. 전체 7장 중에서 내용분석으로 의미가 있다고 판단된 네 개의 장을 선택하였다. 내용어 뿐만 아니라 기능어를 포함한 단어를 분석단위로 하였는데, 이 과정에서 “제1 조(목적)” 등과 같이 조문의 의미를 나타내는 용어는 분석대상에서 제외하였다. 단어 를 코딩하는 과정에서 조사(~는, ~은, ~이, ~가 등)와 기능어(~되어야 한다, ~말한다 등)는 가급적 생략하였다. 또한 ‘통계의 작성․보급’과 같은 표현은 ‘통계작성’과 ‘통계 보급’으로 분리하여 그 뜻이 정확하게 되도록 분류 및 입력하였다. 다만 중복성을 방 지하고 연결망의 단순화를 위하여 ‘용어정의’나 ‘호’는 제외하였다. 이 과정에서 주관성 의 개입을 최소화하기 위하여 윤수재 등(2011)에서와 같이 기준표를 작성하고 각자 코딩하여 차이가 있는 경우 논의를 통해 이를 통일하는 방식으로 더 이상 차이가 생 기지 않을 때까지 계속 반복하였다. <표 3.1> 분석대상 법조문 장 제목 구성 1장 총칙 5개 조항 2장 통계의 작성․보급 및 이용 기반 구축 10개 조항 4장 통계의 작성․보급 및 이용 14개 조항 5장 통계응답자의 의무 및 보호 등 3개 조항
  • 5. 언어네트워크분석을 이용한 통계법 내용분석 57 3.3 분석도구 통계법에 대한 언어네트워크분석을 위해서는 먼저 행렬을 만들어야 한다. 이를 위 해서 박한우 등(2004)이 만들고 공개한 KwKic을 활용하였다. KwKic 프로그램은 KrKwic, KrTitle, KrText 등 3개의 하위 프로그램으로 구성되어 있는데, 먼저 KrKwic을 이용하여 핵심어를 파악한다. 핵심어는 선택된 메시지에서 자주 출현하는 단어로 조작적 정의된 다. 다음 KrTitle을 이용하여 공출현빈도(co-occurrence) 대칭행렬을 도출한다. 공출현 빈도 행렬이 만들어지면 R의 sna 패키지 내의 다양한 함수를 이용하여 밀도, 연결선 의 수, 중앙성 지표 등을 구하고, 나아가 연결망 그래프 등을 그리게 된다. 한편 지표 의 표현에 있어 연결선의 수는 김지수(2011)에서와 같이 상대적 크기로 환산하여 비 교하였다. KwKic 프로그램은 http://www.hanpark.net/에 공개된 소프트웨어로 내려 받아 설 치하면 된다. 도스버전이라 처음 사용하는데 야간 어려움이 있으나, 텍스트자료에 대 한 네트워크분석을 위한 전 단계처리로는 매우 유용한 소프트웨어이다. 하위 3개의 프로그램 중 단어빈도분석이 주목적인 KwKic의 경우 입력파일은 ASCII 인코딩의 텍 스트 파일형태로, 각 줄은 1,000개의 문자를 초과하면 안 된다. 디폴트는 text.txt이다. 프로그램을 실행하면, 텍스트 파일형태의 wrdfrq.txt 파일이 결과로서 생성된다. 다음 으로 하위 프로그램 중 KrTitle은 논문, 웹페이지, 기사, 특허, 법조문 등의 제목 및 요약문과 같이 비교적 짧은 메시지를 분석하기 위한 것이다. 이를 이용한 분석도 ASCII 인코딩의 텍스트 파일형태여야 하며, 문자수가 공백을 포함하여 999개를 초과 하면 안 된다. 분석결과 도출되는 coocc.dbf 파일은 단어(words)x단어(words)의 1모드 공출현빈도 대칭형 행렬인데, 이는 SPSS나 Excel 등에서 이용가능하다(박한우 등, 2004). 4. 언어네트워크분석 KwKic 프로그램과 R의 sna 패키지 내의 다양한 함수를 이용하여 수행한 언어네 트워크분석 결과를 살펴보자. 먼저 전역적 특성을 나타내는 밀도와 빈도수가 2이상인 단어의 목록은 <표 4.1>과 같다. 네트워크 내의 노드가 서로 얼마나 많은 관계를 맺 고 있는지를 표현하기 위한 지표인 밀도에 대해서는 제1장 총칙이 가장 크게 나타났 다. 각 장의 크기가 크게 달라 큰 의미를 부여하기는 어렵지만 제4장의 경우 빈도수 가 2이상인 단어가 다른 장에 비하여 많게 나타났다. 각 장마다 그 장에서 추구하고 자 하는 목적을 나타내는 단어들이 중심이 된 가운데, 제1장의 경우 통계보급, 통계이 용, 통계작성 등이 빈도수가 높은 것으로 나타났다. 이는 제1장이 통계법의 목적과 기 본이념 그리고 국가의 책무 등을 정하고 있는 부분인 바, 통계의 보급과 이용 및 작 성에 관한 필요사항이 많이 언급된 때문인 것으로 사료된다.
  • 6. 58 장정우 ․ 최경호 <표 4.1> 밀도와 빈도수가 2이상인 단어 장 밀도 빈도수가 2이상인 단어 1장 1.156 통계보급, 통계이용, 통계작성, 통계, 통계법, 국가, 비밀보장, 자료제출, 통계작성기관장, 통계청장 2장 0.519 통계청장, 통계작성기관장, 정기통계품질진단, 대통령령, 수시통계품질 진단, 통계작성, 자체통계품질진단, 통계보급, 통계, 통계교육, 통계작성 기관, 국가통계위원회, 방법, 예산, 인력, 절차, 기술지원, 기획재정부장 관, 통계이용, 통계종사자, 통계책임관 4장 0.321 통계작성기관장, 통계청장, 통계작성, 통계자료, 제공, 대통령령, 행정자 료, 협의, 개인, 단체, 법인, 통계, 승인, 승인취소, 통계작성기관, 표준분 류, 고시, 요청, 통계간행물, 통계공표, 통계데이터베이스구축, 공표, 요 청기관장, 자료제출, 제공기관장, 제공방법, 지정통계작성, 협조요청, 공 공기관장, 관계인, 권고, 발간, 발간내역, 변경, 분류코드, 새로운, 소요 경비, 요구, 자료, 작성, 작성중지, 정보보호조치, 제한, 조사, 조사대상, 조사방법, 지방자치단체장, 지정통계, 질문, 통계데이터베이스, 통계데이 터베이스연계, 통계데이터베이스통합, 통계이용자, 표준화, 확인 5장 0.220 통계작성, 개인, 단체, 법인 4.1 제1장 총칙에 대한 분석 제1장 총칙은 모두 5개의 조항으로 구성되어 있는데, 주요 단어에 대한 연결선의 수와 근접중심성을 살펴보면 <표 4.2>와 같다. 연결선의 수는 ‘통계작성’이 가장 큰 가운데 ‘통계보급’과 ‘통계이용’이 그 다음 큰 것으로 나타났다. 이는 연결망 그래프로 부터도 확인할 수 있다. <그림 4.1>에서 볼 수 있듯이 관계망의 중심에 이들 3 단어 가 있음을 알 수 있다. 결국 제1장 총칙은 통계의 작성과 보급과 이용에 필요한 제반 사항을 정하는 부분임을 알 수 있다. <표 4.2> 제1장의 연결선의 수와 근접중심성 단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성 통계보급 0.192 2.91 국가 0.019 0.71 통계이용 0.163 2.46 비밀보장 0.067 1.23 통계작성 0.269 3.20 자료제출 0.077 1.83 통계 0.000 0.00 통계작성기관장 0.087 1.98 통계법 0.067 1.31 통계청장 0.058 1.27
  • 7. 언어네트워크분석을 이용한 통계법 내용분석 59 <그림 4.1> 제1장에 대한 연결망 그래프 비교를 위하여 중국통계법에 대한 언어네트워크분석 결과를 간략하게 살펴보자. 본 연구에서 활용한 중국통계법은 1983년 12월 8일 제6차 국민의회 상임위원회의 3차 모임에서 채택되고, 1996년 5월 15일 채택된 중국통계법 개정에 관한 국민의회 상임 위원회의 결정에 다라 개정된 법률이다(통계청, 2001). 법체계가 다르기 때문에 우리 나라 통계법과 대응비교는 어렵기에, 일단 우리나라 통계법의 총칙과 유사한 제1장 일반적 조항에 대한 연결망 그래프를 그려보면 <그림 4.2>와 같다. 전체 8조로 되어 있어 내용이 우리나라 제1장 총칙보다 많음을 감안하더라도 법률에서 사용된 단어가 우리나라 보다 훨씬 다양한 것으로 나타났다. 그러함에도 불구하고 연결망의 밀도가 0.94로 나타나 단어들 간의 연결 관계 정도가 높음을 알 수 있다. 한편 근접중심성에 대해서는 ‘국가’가 2.92로 가장 높고, 다음으로 통계작업(2.84), 통계자료(2.41), 통계법 (2.35), 통계기구(2.17)의 순으로 나타나, 국가가 중심이 된다는 점에서 통계의 작성과 이용․보급이 중심이 되는 우리나라와는 많은 차이가 있음을 알 수 있다. 중국통계행 정시스템에 대한 면밀한 분석이 있어야 하나, 일단 이러한 차이는 중국이 사회주의국 가이기 때문에 기인한 것으로 여겨진다.
  • 8. 60 장정우 ․ 최경호 <그림 4.2> 중국통계법 제1장 연결망 그래프 4.2 제2장 통계의 작성 ∙ 보급 및 이용 기반 구축에 대한 분석 모두 10개의 조항으로 구성된 제2장에 대한 주요 단어의 연결선의 수와 근접중심 성을 살펴보면 <표 4.3>와 같다. 각각의 노드가 네트워크 구조 내에서 얼마나 중심에 위치하고 있는가를 나타내는 중심성지표 중의 하나인 근접중심성에 대해서는 ‘통계청 장’이 가장 큰 값을 보이고 있다. 이는 연결망 그래프로 부터도 확인 가능하다. 이로 부터 제2장의 법령이 시행되는데 있어서는 통계청장이 가장 중용한 역할을 담당함을 알 수 있다. 참고로 통계청장은 정부조직법 제23조(기획재정부) ⑩항(통계청에 청장 1 명과 차장 1명을 두되, 청장은 정무직으로 하고, 차장은 고위공무원단에 속하는 별정 직국가공무원으로 보한다)에 그 근거를 두고 있다. <표 4.3> 제2장의 연결선의 수와 근접중심성 단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성 통계청장 0.174 2.17 국가통계위원회 0.041 0.66 통계작성기관장 0.000 0.00 방법 0.046 1.07 정기통계품질진단 0.096 1.78 예산 0.055 1.23 대통령령 0.110 1.56 인력 0.041 1.40 수시통계품질진단 0.000 1.62 절차 0.018 1.01 통계작성 0.073 0.00 기술지원 0.018 0.89 자체통계품질진단 0.106 1.45 기획재정부장관 0.028 0.63 통계보급 0.000 1.61 통계이용 0.023 0.87 통계 0.041 0.00 통계종사자 0.018 0.92 통계교육 0.000 1.45 통계책임관 0.000 0.63 통계작성기관 0.023 0.00 1
  • 9. 언어네트워크분석을 이용한 통계법 내용분석 61 <그림 4.3> 제2장에 대한 연결망 그래프 4.3 제4장 통계의 작성∙보급 및 이용에 대한 분석 모두 14개 조항으로 구성된 제4장에서는 통계작성의 승인, 통계작성 승인의 취소, 표준분류, 행정자료의 제공, 자료제출명령, 실지조사 등에 대한 내용을 규정하고 있다. 제4장의 주요 단어에 대한 연결선의 수와 근접중심성은 <표 4.4>와 같다. <표 4.4>와 <그림 4.4>로부터 제4장의 핵심이 되는 단어는 통계작성, 통계자료, 통계청장 등임을 알 수 있다. 제4장의 목적인 통계의 작성과 보급 및 이용에 있어서도 역시 통계청장 의 역할이 매우 중요함을 알 수 있다. 즉, 법령으로 규정된 통계법의 효율적 운용을 위해서는, 무엇보다도 통계청장의 역할이 중요함을 계량적으로 확인할 수 있다. <표 4.4> 제4장의 연결선의 수와 근접중심성 단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성 통계작성기관장 0.000 0.00 공공기관장 0.011 0.67 통계청장 0.078 2.83 관계인 0.006 0.79 통계작성 0.192 3.59 권고 0.006 1.03 통계자료 0.065 2.93 발간 0.000 0.00 제공 0.000 0.00 발간내역 0.000 0.00 대통령령 0.029 1.57 변경 0.015 1.23 행정자료 0.051 1.58 분류코드 0.008 0.86 협의 0.048 2.32 새로운 0.008 1.03 개인 0.058 2.31 소요경비 0.013 0.89 단체 0.067 2.45 요구 0.012 1.05 법인 0.055 2.26 자료 0.000 0.00
  • 10. 62 장정우 ․ 최경호 단어 연결선의 수 근접중심성 단어 연결선의 수 근접중심성 통계 0.000 0.00 작성 0.000 0.00 승인 0.000 0.00 작성중지 0.000 0.00 승인취소 0.000 0.00 정보보호조치 0.018 1.00 통계작성기관 0.000 0.00 제한 0.018 1.00 표준분류 0.027 1.85 조사 0.000 0.00 고시 0.019 1.57 조사대상 0.000 0.00 요청 0.000 0.00 조사방법 0.000 0.00 통계간행물 0.016 1.44 지방자치단체장 0.015 0.98 통계공표 0.013 1.27 지정통계 0.017 1.25 통계DB구축 0.000 0.00 질문 0.012 1.05 공표 0.023 1.92 통계DB 0.000 0.00 요청기관장 0.028 1.20 통계DB연계 0.000 0.00 자료제출 0.000 0.00 통계DB통합 0.000 0.00 제공기관장 0.028 1.20 통계이용자 0.006 0.70 제공방법 0.000 0.00 표준화 0.008 0.86 지정통계작성 0.017 1.25 확인 0.012 1.05 협조요청 0.000 0.00 1 <그림 4.4> 제4장에 대한 연결망 그래프
  • 11. 언어네트워크분석을 이용한 통계법 내용분석 63 4.4 제5장 통계응답자의 의무 및 보호 등에 대한 분석 제5장은 단3개의 조항으로 이루어지는 등 전체적인 내용이 많지 않을 뿐 아니라, <표 4.1>에서 보듯이 빈도수가 2이상인 단어도 많지 않다. 따라서 각종 지표를 보는 것은 별 의미가 없기에 모든 단어를 대상으로 연결망 그래프만 그려 보았다. <그림 4.5>에서 보듯이 비밀보호와 관련된 사항, 조사 및 응답에 관한 사항 등 3개 정도의 그룹으로 분할됨을 알 수 있다. 전체적인 연결정도가 작아 연결망의 밀도도 가장 낮 은 0.220으로 나타났다. 언어네트워크 측면에서 볼 때 제5장은 조항 간의 연결정도가 낮은 장이라고 하겠다. <그림 4.5> 제5장에 대한 연결망 그래프 5. 결론 통계법을 해설한 김재신(1996)에 따르면, 통계법은 통계의 작성․보급 및 이용과 그 기반구축 등에 관하여 필요한 사항을 정함으로써 통계의 신뢰성과 통계제도 운용 의 효율성을 확보함을 목적으로 한다. 이와 같은 목적을 달성하기 위하여 통계법은 통계청장에게 많은 권한과 의무를 부여하고 있는 바, 지정기관 및 지정통계의 지정, 통계작성승인․공포협의․발간승인 등 일련의 통계작성활동에 대한 조정 등의 권한과
  • 12. 64 장정우 ․ 최경호 함께 통계자료를 널리 활용할 의무 및 통계작성과정에서 수집된 통계자료의 비밀을 보호할 의무 등을 부여하여 정확한 통계가 시의성 있게 널리 활용될 수 있도록 도모 하고 있다. 그런데 현재까지 통계법이 실제로 목적달성을 위하여 통계청장에게 많은 권한과 의무가 부여된 형태로 제정되었는지 여부를 계량적으로 확인할 수는 없었다. 그 이유 는 텍스트위주의 언어적 자료를 계량적으로 분석하는 방법론이 많지 않았기 때문이 다. 그러나 최근 들어 이러한 문제에 대한 해결방안의 일환으로 언어네트워크분석이 개발되었다. 이에 본 연구에서는 언어네트워크분석을 이용하여 통계법에 대하여 내용 분석을 실시해 보았다. 그 결과 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치에 있음 을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 경우에 있어서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체 제 구축이 되어야 효율적인 국가통계운용이 된다고 할 수 있겠다. 텍스트로 구성된 자료를 계량적으로 분석하여 시각적으로 확인해 본 점, 그리고 통계법을 법리적인 측면에서가 아닌 기술통계적인 측면에서 분석해 본 점 등에서 본 연구는 차별화 되었다고 할 수 있다. 법체계가 달라 충분한 비교를 해 보진 못했으나 중국통계법과의 비교를 통하여 의미 있는 차이점을 발견한 점 등에 비추어 볼 때, 향 후 다른 국가의 통계법 등과의 비교연구 시 기초자료로 활용될 수 있을 것으로 사료 된다. 다만 본 연구에서 객관적이고 계량적인 분석방법을 통한 연구를 진행하기 위하 여 언어네트워크분석을 활용한 실증적이고 계량적인 연구방법을 이용하였으나, 연구 분석 결과에 대한 해석에서 일부 본 연구자의 주관적인 판단이 작용했을 수 있는 점, 그리고 단순히 통계법을 언어네트워크분석 한 결과로부터 도출된 결론이라는 점은 분 명 본 연구의 한계이다. (2012년 7월 9일 접수, 2012년 7월 23일 수정, 2012년 9월 19일 채택)
  • 13. 언어네트워크분석을 이용한 통계법 내용분석 65 참고문헌 국가통계인프라 강화 추진단. (2005). <통계법 개정작업 현황>, 통계청. 김용학. (2003). <사회 연결망 분석>, 박영사, 서울. 김재신. (1996). 통계법 해설, <1996 한국통계학회 춘계학술대회 발표논문집>, 1-6. 김지수 (2011). <갈등 당사자의 프레임 변화에 관한 연구>, 중앙대학교 대학원 석사학 위논문. 류상일, 남궁승태 (2011). 재난안전 관련 법제 분석, <한국위기관리논집>, 7(6), 29-46. 박한우, Leydesdorff, L. (2004). 한국어의 내용분석을 위한 KrKwic 프로그램의 이해와 적용: Daum.net에서 제공된 지역혁신에 관한 뉴스를 대상으로, <한국자료분 석학회지>, 6(5), 1377-1387. 윤수재, 김지수. (2011). 중앙정부 정책만족도 개선방안에 대한 내부고객과 외부전문가의 인식분석: 언어네트워크분석을 중심으로, <한국정책학회보>, 20(3), 133-161. 이창길 (2010). 정권초기의 가치지향과 정책우선순위: 참여정부와 이명박정부의 언어네 트워크 비교분석, <한국행정학보>, 44(3), 165-189. 통계청 (2001). <주요 국가의 통계법령>, 통계기획국. 허명회 (2010). <R활용한 사회네트워크분석 입문>, 자유아카데미, 서울.
  • 14. 66 장정우 ․ 최경호 Statistics Act Content Analysis using Semantic Network Analysis Jeong-Woo Jang1) ∙ Kyoung-Ho Choi2) Abstract Semantic network analysis is a research method which is being done in some studies, especially in the mass media study, and the study on the Disaster Safety Management Basic Act by Ryu Sang-il et al.(2011) and the study on the President's speech by Lee Chang-gil(2010) are the studies conducted by Semantic network analysis. But there have so far been few studies which make a quantitative approach to Statistics Act. So this study deals with the content analysis on the Statistics Act through Semantic network analysis. The present Statistics Act (Enforcement Date 1. Jul, 2010. Act No.10196. 31. Mar, 2010, Partial Amendment) is consist of 7 chapters and 41 articles and addenda. Consequently, it was found that the director of the Statistical Information Service holds a key position in Chapter 1, 2 and 4 analyzed here. So the role of the director of the Statistical Information Service is the most important in such country as Korea that adopts decentralized statistical system, and the cooperation with the director of the Statistical Information Service at the center is needed for the National Statistics to work effectively. This study is characterized by the visualization of the text material through quantitative analysis, and the analysis of Statistics Act in technical-statistical aspect rather than in legal aspect will provide the basis for the comparative study on Statistics Acts between the countries. Key words : Quantitative approach, Content analysis, Semantic network matrix, Statistics Act. 1) Graduate school of Department of Law, Seoul National University. E-mail: lomah@hanmail.net 2) (corresponding author) Professor of Basic Medical Science(Statistics Major), Jeonju University. E-mail: ckh414@jj.ac.kr