SlideShare a Scribd company logo
1 of 4
1
POPONG meeting (2011-07-02)
작성자: 박은정, 박주성
1. Raw data
A. 국회 의안 정보 시스템1
- 제 18대 국회 의안 중 처리 의안
2. Data preprocessing (박주성)
A. 의원별 참여 의안에 대한 binary matrix
Ex:
B. 중복 제거
Data 의원수 (n) 의안수 (m)
1 All 329 3300
2 중복 의안 제거2
329 2235
3 중복 발의자 set 제거 329 951
- Spotfire ‘BillMemberAnalysis.dxp’ 파일 참고
1
http://likms.assembly.go.kr/bill/jsp/main.jsp
2
중복 의안 중 첫 레코드만 사용 (?)
의안 1 의안 2 의안 3 … 의안 m
의원 1 1 0 0 … 1
의원 2 1 0 1 … 0
… … … … … …
의원 n 0 1 0 … 1
2
3. Data Analysis (박은정)
A. Similarity calculation: 세 가지 set similarity measure 사용
(엑셀파일 sim_2_member.xlsx 참고)
B. Similarity Based Hierarchical Clustering
- 의원 간의 상관계수를 계산하여 그들간의비유사성(dissimilarity) 계산
Dissimilarity = 1 - Abs(Similarity)
- 위에서 계산된 비유사성을 이용하여 계층군집 알고리즘 적용3
※ 계층군집 알고리즘
• 각 개체 간의 비유사도를 기반으로 가장 가까운 것 두 개를 묶는다.
• 묶은 개체 둘은 다시 하나의 개체로 간주하여 다시 앞 과정을 반복한다.
• 앞 두 과정을 전체가 하나로 묶일 때까지 반복한다.
3
Single linkage(minimum distance) 사용
3
4
4. Comment: 성능이 좋고, 구체적이고, 좀 더 의미 있는 결과를 얻기 위해서는 의원들의
demographic 데이터가 필요!

More Related Content

Viewers also liked

2011-07-23 popong politician network analysis
2011-07-23 popong politician network analysis2011-07-23 popong politician network analysis
2011-07-23 popong politician network analysisTeam POPONG
 
2011-06-25 long term concept
2011-06-25 long term concept2011-06-25 long term concept
2011-06-25 long term conceptTeam POPONG
 
공공데이터 맛있게 요리하기
공공데이터 맛있게 요리하기공공데이터 맛있게 요리하기
공공데이터 맛있게 요리하기영제 임
 
2011 media issue report 06
2011 media issue report 062011 media issue report 06
2011 media issue report 06Heather Park
 
20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realizationTeam POPONG
 
2011-09-24-UI기획안
2011-09-24-UI기획안2011-09-24-UI기획안
2011-09-24-UI기획안Team POPONG
 
2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현Team POPONG
 
2010-11-20 kick off meeting
2010-11-20 kick off meeting2010-11-20 kick off meeting
2010-11-20 kick off meetingTeam POPONG
 
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기Joongi Kim
 
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)HONGJOO LEE
 
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기Cheol Kang
 
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것Team POPONG
 
2011-01-20 popong webpage
2011-01-20 popong webpage2011-01-20 popong webpage
2011-01-20 popong webpageTeam POPONG
 
Django개발은 PyCharm에서
Django개발은 PyCharm에서Django개발은 PyCharm에서
Django개발은 PyCharm에서Kyoung Up Jung
 
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한nevereska
 

Viewers also liked (15)

2011-07-23 popong politician network analysis
2011-07-23 popong politician network analysis2011-07-23 popong politician network analysis
2011-07-23 popong politician network analysis
 
2011-06-25 long term concept
2011-06-25 long term concept2011-06-25 long term concept
2011-06-25 long term concept
 
공공데이터 맛있게 요리하기
공공데이터 맛있게 요리하기공공데이터 맛있게 요리하기
공공데이터 맛있게 요리하기
 
2011 media issue report 06
2011 media issue report 062011 media issue report 06
2011 media issue report 06
 
20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization20110-10-08-Popong intimacy realization
20110-10-08-Popong intimacy realization
 
2011-09-24-UI기획안
2011-09-24-UI기획안2011-09-24-UI기획안
2011-09-24-UI기획안
 
2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현2011-06-18 정치인 Network 구현
2011-06-18 정치인 Network 구현
 
2010-11-20 kick off meeting
2010-11-20 kick off meeting2010-11-20 kick off meeting
2010-11-20 kick off meeting
 
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기
Python Korea 2014년 6월 세미나 - Windows 환경에서 Python 개발환경 세팅하기
 
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)
Python 으로 19대 국회 뽀개기 (PyCon APAC 2016)
 
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기
공공데이터 활용을 위한 "Tech 워크숍" 2회 - 공공데이터 수집, 가공하고 활용하기
 
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
[삼성 투모로우솔루션 공모전 2013] 대한민국 정치의 모든 것
 
2011-01-20 popong webpage
2011-01-20 popong webpage2011-01-20 popong webpage
2011-01-20 popong webpage
 
Django개발은 PyCharm에서
Django개발은 PyCharm에서Django개발은 PyCharm에서
Django개발은 PyCharm에서
 
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한
피지워터 PR기획안 (2011년 KPR 공모전) - 윤서한
 

More from Team POPONG

2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안Team POPONG
 
2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 Team POPONG
 
2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 Team POPONG
 
2011-07-09 데이터 탐색
2011-07-09 데이터 탐색2011-07-09 데이터 탐색
2011-07-09 데이터 탐색Team POPONG
 
2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONGTeam POPONG
 
2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddangTeam POPONG
 
2011-01-01 workshop agenda
2011-01-01 workshop agenda2011-01-01 workshop agenda
2011-01-01 workshop agendaTeam POPONG
 
2010-12-04 weekly meeting
2010-12-04 weekly meeting2010-12-04 weekly meeting
2010-12-04 weekly meetingTeam POPONG
 
2010-11-27 weekly meeting
2010-11-27 weekly meeting2010-11-27 weekly meeting
2010-11-27 weekly meetingTeam POPONG
 
2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****Team POPONG
 
g0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Koreag0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South KoreaTeam POPONG
 
2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료Team POPONG
 

More from Team POPONG (13)

2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안2012-02-27-팀포퐁 프로덕트 변경안
2012-02-27-팀포퐁 프로덕트 변경안
 
2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안 2012-02-27-팀포퐁 시스템 변경안
2012-02-27-팀포퐁 시스템 변경안
 
2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰 2011-10-22 나시장 리뷰
2011-10-22 나시장 리뷰
 
2011-07-09 데이터 탐색
2011-07-09 데이터 탐색2011-07-09 데이터 탐색
2011-07-09 데이터 탐색
 
2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG2011-02-26 More ideas for POPONG
2011-02-26 More ideas for POPONG
 
2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang2011-01-01 workshop - jooddang
2011-01-01 workshop - jooddang
 
2011-01-01 workshop agenda
2011-01-01 workshop agenda2011-01-01 workshop agenda
2011-01-01 workshop agenda
 
2010-12-04 weekly meeting
2010-12-04 weekly meeting2010-12-04 weekly meeting
2010-12-04 weekly meeting
 
2010-11-27 weekly meeting
2010-11-27 weekly meeting2010-11-27 weekly meeting
2010-11-27 weekly meeting
 
2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****2010-11-20 kick off meeting - j*****
2010-11-20 kick off meeting - j*****
 
POPONG CCW talk
POPONG CCW talkPOPONG CCW talk
POPONG CCW talk
 
g0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Koreag0v summit 2014 - How we open the National Assembly in South Korea
g0v summit 2014 - How we open the National Assembly in South Korea
 
2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료2013-10-14 투모로우 솔루션 인기투표 자료
2013-10-14 투모로우 솔루션 인기투표 자료
 

2011-07-02 데이터 탐색

  • 1. 1 POPONG meeting (2011-07-02) 작성자: 박은정, 박주성 1. Raw data A. 국회 의안 정보 시스템1 - 제 18대 국회 의안 중 처리 의안 2. Data preprocessing (박주성) A. 의원별 참여 의안에 대한 binary matrix Ex: B. 중복 제거 Data 의원수 (n) 의안수 (m) 1 All 329 3300 2 중복 의안 제거2 329 2235 3 중복 발의자 set 제거 329 951 - Spotfire ‘BillMemberAnalysis.dxp’ 파일 참고 1 http://likms.assembly.go.kr/bill/jsp/main.jsp 2 중복 의안 중 첫 레코드만 사용 (?) 의안 1 의안 2 의안 3 … 의안 m 의원 1 1 0 0 … 1 의원 2 1 0 1 … 0 … … … … … … 의원 n 0 1 0 … 1
  • 2. 2 3. Data Analysis (박은정) A. Similarity calculation: 세 가지 set similarity measure 사용 (엑셀파일 sim_2_member.xlsx 참고) B. Similarity Based Hierarchical Clustering - 의원 간의 상관계수를 계산하여 그들간의비유사성(dissimilarity) 계산 Dissimilarity = 1 - Abs(Similarity) - 위에서 계산된 비유사성을 이용하여 계층군집 알고리즘 적용3 ※ 계층군집 알고리즘 • 각 개체 간의 비유사도를 기반으로 가장 가까운 것 두 개를 묶는다. • 묶은 개체 둘은 다시 하나의 개체로 간주하여 다시 앞 과정을 반복한다. • 앞 두 과정을 전체가 하나로 묶일 때까지 반복한다. 3 Single linkage(minimum distance) 사용
  • 3. 3
  • 4. 4 4. Comment: 성능이 좋고, 구체적이고, 좀 더 의미 있는 결과를 얻기 위해서는 의원들의 demographic 데이터가 필요!