SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
1
(LibreOffice)
리브레오피스 우리말 모듬
XML 파일 구조 및 리브레오피스
(LibreOffice) 의 자동 교정 기능 소개 등
리브레오피스 (LibreOffice) 우리말 모듬
성대현 (DaeHyun Sung, 成大鉉 , ソン・デヒョン )
2021 년 09 월 10 일 금요일
XML 은 무엇인가 ?
eXtensible Markup Language
W3C 에서 개발됨 . 다목적 마크업 언어
W3C XML 표준 문서 https://www.w3.org/TR/xml/
HTML 과 매우 비슷한 문자기반의 마크업 언어 (Text-based Markup
Language), 사람과 기계가 동시에 읽기 편한 구조
다른 시스템 끼리 다양한 종류의 데이터를 손쉽게 교환할 수 있음
확장성 좋음 , 데이터 전달 및 저장 용도로 적합
XML 기반 언어
XHTML, SVG, RDF, RSS, Atom, MathXML
참고 : https://developer.mozilla.org/ko/docs/Web/XML
XML 의 구조
참고 : 초보자를 위한 XML 설명
https://support.microsoft.com/ko-kr/office/%EC%B4%88%EB%B3%B
4%EC%9E%90%EB%A5%BC-%EC%9C%84%ED%95%9C-xml-%EC%8
4%A4%EB%AA%85-a87d234d-4c2e-4409-9cbc-45e4eb857d44
<?xml version="1.0"?>
<CAT>
<NAME>Izzy</NAME>
<BREED>Siamese</BREED>
<AGE>6</AGE>
<ALTERED>yes</ALTERED>
<DECLAWED>no</DECLAWED>
<LICENSE>Izz138bod</LICENSE>
<OWNER>Colin Wilcox</OWNER>
</CAT>
ODF 구조
ODF 구조 (zip 파일 안에 xml 파일이 존재 )
OOXML 구조
OOXML 구조 (zip 파일 안에 xml 파일이 존재 )
자동 교정 (Auto correct)
입력한 내용이 오타가 났을때 , 자동으로 교정을 해주는 기능
한글 (HWP), MS 워드에도 기능 있음
한글 (HWP): “ 빠른 교정”
MS 워드 : “ 자동 고침”
7
(LibreOffice)
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
리브레오피스 (LibreOffice) 의 예시
8
(LibreOffice)
리브레오피스 우리말 모듬
9
(LibreOffice)
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
데이터
국립국어원
한국어 어문 규범 - 표준어 규정
http://kornorms.korean.go.kr/regltn/regltnView.do?regltn_code=
0002
NLP 라이브러리인 “ open-korean-text”
https://github.com/open-korean-text/open-korean-text
인터넷상 오타체나 실수등을 정리한 typo.txt
https://github.com/open-korean-text/open-korean-text/blob/master/s
rc/main/resources/org/openkoreantext/processor/util/typos/typos.txt
10
(LibreOffice)
리브레오피스 우리말 모듬
먼저 해야할 일
우선 다음의 저장소를 clone -
https://github.com/libreoffice-kr/autocorr_kr
자동 교정을 할 데이터 수집 !
한국어 어문 규정 – 표준어 규정
http://kornorms.korean.go.kr/regltn/regltnView.do?regltn_code=0002
여기서 “손구루마”를 입력시 “손수레”로 바꿔야 함을 인지
clone 한 저장소에 수정할 Document.xml 파일을 열어보기
XML 파일에 바꿔야할 대상 및 바꾼 말을 만들어보기
block-list:abbreviated-name 속성에 수정해야할 낱말을 작성하고 ,
block-list:name 에 수정된 낱말을 적으면 됩니다 .
<block-list:block block-list:abbreviated-name=" 손구루마 " block-list:name=" 손수레 "/>
11
(LibreOffice)
리브레오피스 우리말 모듬
주의 사항
자동 교정 내용을 작성 및 제출 시 block-list:abbreviated-name
속성 기준으로 가나다 오름차순으로 작성하여 제출하시기 바랍니
다 . 가나다 순으로 작성하지 않으면 풀리퀘스트 (Pull Request)
가 거절 될 수 있습니다 .
자동 교정 내용을 추가 하실때 , 국립국어원의 사전과 네이버
국어사전을 참고로 하여 검색후 , 기존 낱말이 있는 경우는
추가하지 말아주십시요
예를 들어 , “ 금세”의 경우 “금새”의 틀린 말이라고 생각하여
추가하는 경우가 있는데 , “ 금세”라는 뜻과 다른 “금새”라는
낱말이 있습니다 .
12
(LibreOffice)
리브레오피스 우리말 모듬
Github PR 전달하기
커밋 후 저장소에 PR 전달하기
https://github.com/libreoffice-kr/autocorr_kr
13
(LibreOffice)
리브레오피스 우리말 모듬
다음주의 활동
미리 리브레오피스 (LibreOffice) 를 빌드해봅시다 .
리브레오피스 (LibreOffice) core 저장소 (Repository) 의
extras/source/autocorr/lang/ko/DocumentList.xml 파일에
추가한 한국어의 자동교정 대상 낱말을 커밋 및 제출 해보기 실습
Gerrit 을 이용하여 제출
14
(LibreOffice)
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
Bugzilla
[ko] Extend Autocorrect list for Korean language
https://bugs.documentfoundation.org/show_bug.cgi?id=
135727
Gerrit 코드 리뷰 시스템
[ko] add new autocorrect words for Korean
https://gerrit.libreoffice.org/c/core/+/100682
빌드 (Build)
Gerrit 소스코드 리뷰시스템에서 다운로드 받음
권장 : Linux & MacOS
Windows → VM  위에서 작업하는 것이 좋음
빌드 하는 방법 (Wiki)
Linux https://wiki.documentfoundation.org/Development/BuildingOnLinux
MacOShttps://wiki.documentfoundation.org/Development/BuildingOnMac
Windows https://wiki.documentfoundation.org/Development/BuildingOnWindows
Onlinehttps://wiki.documentfoundation.org/Development/LibreOffice_Online
Androidhttps://wiki.documentfoundation.org/Development/BuildingForAndroid
16
(LibreOffice)
리브레오피스 우리말 모듬
빌드 (Build) 설정
일반적인 빌드 설정
Wiki 에서 안내하는 빌드 설정에 몇몇 부분 추가 해야 빌드 됨
한국어 설정 추가
디버깅 옵션 추가
$ git clone https://gerrit.libreoffice.org/core libreoffice
$ cd libreoffice
$ ./autogen.sh --disable-breakpad --disable-online-update
$ git clone https://gerrit.libreoffice.org/core libreoffice
$ cd libreoffice
$ ./autogen.sh --with-locales="ko" -–with-lang="ko" --disable-breakpad --disable-online-update
$ git clone https://gerrit.libreoffice.org/core libreoffice
$ cd libreoffice
$ ./autogen.sh --with-locales="ko" --with-lang="ko" –enable-dbgutil --disable-breakpad --disable-online-update
17
(LibreOffice)
리브레오피스 우리말 모듬
빌드 설정 선택사항 , 빌드 및 실행
빌드 선택사항 조회
빌드하기
실행하기
일반적인 실행
선택 실행 (ex. Writer, calc 등 )
$ ./autogen.sh --help
$ make
$ instdir/program/soffice # Linux
$ open instdir/LibreOfficeDev.app # MacOSX
$ instdir/program/soffice –writer
$ instdir/program/soffice --calc
18
(LibreOffice)
리브레오피스 우리말 모듬
빌드 및 디버깅 영상
LibreOffice Build Demo
https://youtu.be/2gIqOOajdYQ
How to build LibreOffice on your desktop (openSUSE.Asia
summit 2017) https://youtu.be/gFIA0Ml5V84
Developing LibreOffice in Visual Studio
https://youtu.be/Xn3CtIrMpIA
LibreOffice Conference 2019 – Reducing LibreOffice build
time with include-what-you-use https://youtu.be/WhEG64OMu5A
LibreOffice Conference 2016: Connect, Embed, Integrate -
LibreOffice as a building block https://youtu.be/g3ya-za_2cU
19
(LibreOffice)
리브레오피스 우리말 모듬
개발 기여하기 전에 해야할 사항
위키 내용 https://wiki.documentfoundation.org/Development/Developers
LibreOffice 의 라이선스 (License)
MPLv2
https://www.olis.or.kr/license/Detailselect.do?lId=1088&mapCode=010092
&lType=osi
LGPLv3
https://www.olis.or.kr/license/Detailselect.do?lId=1073&mapCode=010073
&lType=osi
전달 내용 libreoffice@lists.freedesktop.org
All of my past & future contributions to LibreOffice may be
licensed under the MPLv2/LGPLv3+ dual license.
20
(LibreOffice)
리브레오피스 우리말 모듬
개발 기여하기 전에 해야할 사항
예시 libreoffice@lists.freedesktop.org
제목 : ‘ 본인 이름’ license statement
내용
예제
http://document-foundation-mail-archive.969070.n3.nabble.c
om/DaeHyun-Sung-license-statement-td4240049.html
All of my past & future contributions to LibreOffice may be
licensed under the MPLv2/LGPLv3+ dual license.
21
(LibreOffice)
리브레오피스 우리말 모듬
Gerrit 리뷰시스템 가입 및 ssh 키 등록
리브레오피스 Gerrit 리뷰시스템 가입
https://gerrit.libreoffice.org/
설정 :
https://wiki.documentfoundation.org/Development/gerrit/setup
SSH 키 설정
https://docs.github.com/en/github/authenticating-to-github/generating-a
-new-ssh-key-and-adding-it-to-the-ssh-agent
Github 에 SSH 키 등록
https://docs.github.com/en/github/authenticating-to-github/adding-
a-new-ssh-key-to-your-github-account
LibreOffice 의 Gerrit 에 SSH 키 등록
22
(LibreOffice)
리브레오피스 우리말 모듬
Logerrit 설정
다음의 명령어로 입력 후 확인
상세 내용
https://wiki.documentfoundation.org/Development/gerrit/setup
$ ./logerrit setup
Note that you need to register additional email addresses, if you want to
commit from them. Each additional email address must be confirmed by
following the verification link sent to it.
Which user name did you choose? “본인 이름이나 닉네임”
Please now add the following to your ~/.ssh/config, creating the file if needed:
Host logerrit gerrit.libreoffice.org
IdentityFile ~/.ssh/id_rsa
User “본인 이름이나 닉네임”
Port 29418
HostName gerrit.libreoffice.org
To see if your setup was successful, run './logerrit test'
$ ./logerrit test
Enter passphrase for key '/***/.ssh/id_rsa':
Your gerrit setup was successful!
23
(LibreOffice)
리브레오피스 우리말 모듬
읽어봐야할 문서 및 잡지
마이크로소프트웨어 396 호 ,
2019 년 출간
리터러시 아드레날린 (Literacy
Adrenaline)
네이버 책의 소개
https://book.naver.com/boo
kdb/book_detail.nhn?bid=14
820577
판매처
리디북스
https://ridibooks.com/books
/2979000018
24
(LibreOffice)
리브레오피스 우리말 모듬
번외 (huspell-ko)
자유오픈소스로 구현된 맞춤법 검사기능
관련 슬라이드
Hunspell 한국어 맞춤법 검사의 원리
https://www.slideshare.net/changwoo/hunspell-works
국립국어원 오픈소스 어휘 정보 활용 사례
https://www.slideshare.net/changwoo/ss-82447112
25
(LibreOffice)
리브레오피스 우리말 모듬
번외 (NLP)
Natural Language Processing
라이브러리
Open-korean-text https://github.com/open-korean-text/
KoNLPy https://konlpy.org/en/latest/
꼬꼬마 프로젝트 http://kkma.snu.ac.kr/
정리
https://github.com/datanada/Awesome-Korean-NLP
26
(LibreOffice)
리브레오피스 우리말 모듬
All text and image content in this document is licensed under the Creative Commons Attribution-Share Alike 3.0 License
(unless otherwise specified). "LibreOffice" and "The Document Foundation" are registered trademarks. Their respective logos
and icons are subject to international copyright laws. The use of these therefore is subject to the trademark policy.
고맙습니다

Contenu connexe

Tendances

Tendances (12)

[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
 
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션 [2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
 
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기 [2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
 
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
 
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
 
[2021 오픈소스 컨트리뷰션 아카데미] Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
[2021 오픈소스 컨트리뷰션 아카데미]  Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)[2021 오픈소스 컨트리뷰션 아카데미]  Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
[2021 오픈소스 컨트리뷰션 아카데미] Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
 
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
 
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
 
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
 
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기 [Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
 
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
 
201017 한주현 생물정보학 github 강의
201017 한주현 생물정보학 github 강의201017 한주현 생물정보학 github 강의
201017 한주현 생물정보학 github 강의
 

Similaire à [2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등

레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드
Sukjoon Kim
 
3.web의역사와browser
3.web의역사와browser3.web의역사와browser
3.web의역사와browser
cheonsu park
 
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
Amazon Web Services Korea
 
[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)
태욱 김
 
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개
Toby Yun
 

Similaire à [2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등 (20)

2-2. html5
2-2. html52-2. html5
2-2. html5
 
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
 
System+os study 4
System+os study 4System+os study 4
System+os study 4
 
강분도 - 공개SW개발과 우분투 (2010Y10M05D)
강분도 - 공개SW개발과 우분투 (2010Y10M05D)강분도 - 공개SW개발과 우분투 (2010Y10M05D)
강분도 - 공개SW개발과 우분투 (2010Y10M05D)
 
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
 
XECon + PHPFest 2014 XE 프로젝트 이야기
XECon + PHPFest 2014 XE 프로젝트 이야기XECon + PHPFest 2014 XE 프로젝트 이야기
XECon + PHPFest 2014 XE 프로젝트 이야기
 
build a linux webhosting server
build a linux webhosting serverbuild a linux webhosting server
build a linux webhosting server
 
Laravel로 스타트업 기술 스택 구성하기
Laravel로 스타트업 기술 스택 구성하기Laravel로 스타트업 기술 스택 구성하기
Laravel로 스타트업 기술 스택 구성하기
 
레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드
 
토픽기반 컨텐츠관리와 실시간 개발 지원방안
토픽기반 컨텐츠관리와 실시간 개발 지원방안토픽기반 컨텐츠관리와 실시간 개발 지원방안
토픽기반 컨텐츠관리와 실시간 개발 지원방안
 
3.web의역사와browser
3.web의역사와browser3.web의역사와browser
3.web의역사와browser
 
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
 
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
 
[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)
 
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개
 
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
 
깃허브 시작하기
깃허브 시작하기깃허브 시작하기
깃허브 시작하기
 
Web 2.0과 도서관 활용사례
Web 2.0과 도서관 활용사례Web 2.0과 도서관 활용사례
Web 2.0과 도서관 활용사례
 
CloudFront 활용하기
CloudFront 활용하기CloudFront 활용하기
CloudFront 활용하기
 
웹기술 이해 (프론트엔드 기초)
웹기술 이해 (프론트엔드 기초)웹기술 이해 (프론트엔드 기초)
웹기술 이해 (프론트엔드 기초)
 

Plus de DaeHyun Sung

[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea
DaeHyun Sung
 
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in KoreanLibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
DaeHyun Sung
 
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
DaeHyun Sung
 

Plus de DaeHyun Sung (11)

[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea
 
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in KoreanLibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
 
[LibreOffice Conference 2022] State of Korea in Libreoffice and promote futu...
[LibreOffice Conference 2022]  State of Korea in Libreoffice and promote futu...[LibreOffice Conference 2022]  State of Korea in Libreoffice and promote futu...
[LibreOffice Conference 2022] State of Korea in Libreoffice and promote futu...
 
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
 
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
 
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
 
Building LibreOffice Korean Community and CJK common & different issues
Building LibreOffice Korean Community and CJK common & different issuesBuilding LibreOffice Korean Community and CJK common & different issues
Building LibreOffice Korean Community and CJK common & different issues
 
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
 
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
 
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
 
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME CJ...
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME  CJ...[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME  CJ...
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME CJ...
 

[2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등

  • 1. 1 (LibreOffice) 리브레오피스 우리말 모듬 XML 파일 구조 및 리브레오피스 (LibreOffice) 의 자동 교정 기능 소개 등 리브레오피스 (LibreOffice) 우리말 모듬 성대현 (DaeHyun Sung, 成大鉉 , ソン・デヒョン ) 2021 년 09 월 10 일 금요일
  • 2. XML 은 무엇인가 ? eXtensible Markup Language W3C 에서 개발됨 . 다목적 마크업 언어 W3C XML 표준 문서 https://www.w3.org/TR/xml/ HTML 과 매우 비슷한 문자기반의 마크업 언어 (Text-based Markup Language), 사람과 기계가 동시에 읽기 편한 구조 다른 시스템 끼리 다양한 종류의 데이터를 손쉽게 교환할 수 있음 확장성 좋음 , 데이터 전달 및 저장 용도로 적합 XML 기반 언어 XHTML, SVG, RDF, RSS, Atom, MathXML 참고 : https://developer.mozilla.org/ko/docs/Web/XML
  • 3. XML 의 구조 참고 : 초보자를 위한 XML 설명 https://support.microsoft.com/ko-kr/office/%EC%B4%88%EB%B3%B 4%EC%9E%90%EB%A5%BC-%EC%9C%84%ED%95%9C-xml-%EC%8 4%A4%EB%AA%85-a87d234d-4c2e-4409-9cbc-45e4eb857d44 <?xml version="1.0"?> <CAT> <NAME>Izzy</NAME> <BREED>Siamese</BREED> <AGE>6</AGE> <ALTERED>yes</ALTERED> <DECLAWED>no</DECLAWED> <LICENSE>Izz138bod</LICENSE> <OWNER>Colin Wilcox</OWNER> </CAT>
  • 4. ODF 구조 ODF 구조 (zip 파일 안에 xml 파일이 존재 )
  • 5. OOXML 구조 OOXML 구조 (zip 파일 안에 xml 파일이 존재 )
  • 6. 자동 교정 (Auto correct) 입력한 내용이 오타가 났을때 , 자동으로 교정을 해주는 기능 한글 (HWP), MS 워드에도 기능 있음 한글 (HWP): “ 빠른 교정” MS 워드 : “ 자동 고침”
  • 7. 7 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) 리브레오피스 (LibreOffice) 의 예시
  • 9. 9 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) 데이터 국립국어원 한국어 어문 규범 - 표준어 규정 http://kornorms.korean.go.kr/regltn/regltnView.do?regltn_code= 0002 NLP 라이브러리인 “ open-korean-text” https://github.com/open-korean-text/open-korean-text 인터넷상 오타체나 실수등을 정리한 typo.txt https://github.com/open-korean-text/open-korean-text/blob/master/s rc/main/resources/org/openkoreantext/processor/util/typos/typos.txt
  • 10. 10 (LibreOffice) 리브레오피스 우리말 모듬 먼저 해야할 일 우선 다음의 저장소를 clone - https://github.com/libreoffice-kr/autocorr_kr 자동 교정을 할 데이터 수집 ! 한국어 어문 규정 – 표준어 규정 http://kornorms.korean.go.kr/regltn/regltnView.do?regltn_code=0002 여기서 “손구루마”를 입력시 “손수레”로 바꿔야 함을 인지 clone 한 저장소에 수정할 Document.xml 파일을 열어보기 XML 파일에 바꿔야할 대상 및 바꾼 말을 만들어보기 block-list:abbreviated-name 속성에 수정해야할 낱말을 작성하고 , block-list:name 에 수정된 낱말을 적으면 됩니다 . <block-list:block block-list:abbreviated-name=" 손구루마 " block-list:name=" 손수레 "/>
  • 11. 11 (LibreOffice) 리브레오피스 우리말 모듬 주의 사항 자동 교정 내용을 작성 및 제출 시 block-list:abbreviated-name 속성 기준으로 가나다 오름차순으로 작성하여 제출하시기 바랍니 다 . 가나다 순으로 작성하지 않으면 풀리퀘스트 (Pull Request) 가 거절 될 수 있습니다 . 자동 교정 내용을 추가 하실때 , 국립국어원의 사전과 네이버 국어사전을 참고로 하여 검색후 , 기존 낱말이 있는 경우는 추가하지 말아주십시요 예를 들어 , “ 금세”의 경우 “금새”의 틀린 말이라고 생각하여 추가하는 경우가 있는데 , “ 금세”라는 뜻과 다른 “금새”라는 낱말이 있습니다 .
  • 12. 12 (LibreOffice) 리브레오피스 우리말 모듬 Github PR 전달하기 커밋 후 저장소에 PR 전달하기 https://github.com/libreoffice-kr/autocorr_kr
  • 13. 13 (LibreOffice) 리브레오피스 우리말 모듬 다음주의 활동 미리 리브레오피스 (LibreOffice) 를 빌드해봅시다 . 리브레오피스 (LibreOffice) core 저장소 (Repository) 의 extras/source/autocorr/lang/ko/DocumentList.xml 파일에 추가한 한국어의 자동교정 대상 낱말을 커밋 및 제출 해보기 실습 Gerrit 을 이용하여 제출
  • 14. 14 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) Bugzilla [ko] Extend Autocorrect list for Korean language https://bugs.documentfoundation.org/show_bug.cgi?id= 135727 Gerrit 코드 리뷰 시스템 [ko] add new autocorrect words for Korean https://gerrit.libreoffice.org/c/core/+/100682
  • 15. 빌드 (Build) Gerrit 소스코드 리뷰시스템에서 다운로드 받음 권장 : Linux & MacOS Windows → VM  위에서 작업하는 것이 좋음 빌드 하는 방법 (Wiki) Linux https://wiki.documentfoundation.org/Development/BuildingOnLinux MacOShttps://wiki.documentfoundation.org/Development/BuildingOnMac Windows https://wiki.documentfoundation.org/Development/BuildingOnWindows Onlinehttps://wiki.documentfoundation.org/Development/LibreOffice_Online Androidhttps://wiki.documentfoundation.org/Development/BuildingForAndroid
  • 16. 16 (LibreOffice) 리브레오피스 우리말 모듬 빌드 (Build) 설정 일반적인 빌드 설정 Wiki 에서 안내하는 빌드 설정에 몇몇 부분 추가 해야 빌드 됨 한국어 설정 추가 디버깅 옵션 추가 $ git clone https://gerrit.libreoffice.org/core libreoffice $ cd libreoffice $ ./autogen.sh --disable-breakpad --disable-online-update $ git clone https://gerrit.libreoffice.org/core libreoffice $ cd libreoffice $ ./autogen.sh --with-locales="ko" -–with-lang="ko" --disable-breakpad --disable-online-update $ git clone https://gerrit.libreoffice.org/core libreoffice $ cd libreoffice $ ./autogen.sh --with-locales="ko" --with-lang="ko" –enable-dbgutil --disable-breakpad --disable-online-update
  • 17. 17 (LibreOffice) 리브레오피스 우리말 모듬 빌드 설정 선택사항 , 빌드 및 실행 빌드 선택사항 조회 빌드하기 실행하기 일반적인 실행 선택 실행 (ex. Writer, calc 등 ) $ ./autogen.sh --help $ make $ instdir/program/soffice # Linux $ open instdir/LibreOfficeDev.app # MacOSX $ instdir/program/soffice –writer $ instdir/program/soffice --calc
  • 18. 18 (LibreOffice) 리브레오피스 우리말 모듬 빌드 및 디버깅 영상 LibreOffice Build Demo https://youtu.be/2gIqOOajdYQ How to build LibreOffice on your desktop (openSUSE.Asia summit 2017) https://youtu.be/gFIA0Ml5V84 Developing LibreOffice in Visual Studio https://youtu.be/Xn3CtIrMpIA LibreOffice Conference 2019 – Reducing LibreOffice build time with include-what-you-use https://youtu.be/WhEG64OMu5A LibreOffice Conference 2016: Connect, Embed, Integrate - LibreOffice as a building block https://youtu.be/g3ya-za_2cU
  • 19. 19 (LibreOffice) 리브레오피스 우리말 모듬 개발 기여하기 전에 해야할 사항 위키 내용 https://wiki.documentfoundation.org/Development/Developers LibreOffice 의 라이선스 (License) MPLv2 https://www.olis.or.kr/license/Detailselect.do?lId=1088&mapCode=010092 &lType=osi LGPLv3 https://www.olis.or.kr/license/Detailselect.do?lId=1073&mapCode=010073 &lType=osi 전달 내용 libreoffice@lists.freedesktop.org All of my past & future contributions to LibreOffice may be licensed under the MPLv2/LGPLv3+ dual license.
  • 20. 20 (LibreOffice) 리브레오피스 우리말 모듬 개발 기여하기 전에 해야할 사항 예시 libreoffice@lists.freedesktop.org 제목 : ‘ 본인 이름’ license statement 내용 예제 http://document-foundation-mail-archive.969070.n3.nabble.c om/DaeHyun-Sung-license-statement-td4240049.html All of my past & future contributions to LibreOffice may be licensed under the MPLv2/LGPLv3+ dual license.
  • 21. 21 (LibreOffice) 리브레오피스 우리말 모듬 Gerrit 리뷰시스템 가입 및 ssh 키 등록 리브레오피스 Gerrit 리뷰시스템 가입 https://gerrit.libreoffice.org/ 설정 : https://wiki.documentfoundation.org/Development/gerrit/setup SSH 키 설정 https://docs.github.com/en/github/authenticating-to-github/generating-a -new-ssh-key-and-adding-it-to-the-ssh-agent Github 에 SSH 키 등록 https://docs.github.com/en/github/authenticating-to-github/adding- a-new-ssh-key-to-your-github-account LibreOffice 의 Gerrit 에 SSH 키 등록
  • 22. 22 (LibreOffice) 리브레오피스 우리말 모듬 Logerrit 설정 다음의 명령어로 입력 후 확인 상세 내용 https://wiki.documentfoundation.org/Development/gerrit/setup $ ./logerrit setup Note that you need to register additional email addresses, if you want to commit from them. Each additional email address must be confirmed by following the verification link sent to it. Which user name did you choose? “본인 이름이나 닉네임” Please now add the following to your ~/.ssh/config, creating the file if needed: Host logerrit gerrit.libreoffice.org IdentityFile ~/.ssh/id_rsa User “본인 이름이나 닉네임” Port 29418 HostName gerrit.libreoffice.org To see if your setup was successful, run './logerrit test' $ ./logerrit test Enter passphrase for key '/***/.ssh/id_rsa': Your gerrit setup was successful!
  • 23. 23 (LibreOffice) 리브레오피스 우리말 모듬 읽어봐야할 문서 및 잡지 마이크로소프트웨어 396 호 , 2019 년 출간 리터러시 아드레날린 (Literacy Adrenaline) 네이버 책의 소개 https://book.naver.com/boo kdb/book_detail.nhn?bid=14 820577 판매처 리디북스 https://ridibooks.com/books /2979000018
  • 24. 24 (LibreOffice) 리브레오피스 우리말 모듬 번외 (huspell-ko) 자유오픈소스로 구현된 맞춤법 검사기능 관련 슬라이드 Hunspell 한국어 맞춤법 검사의 원리 https://www.slideshare.net/changwoo/hunspell-works 국립국어원 오픈소스 어휘 정보 활용 사례 https://www.slideshare.net/changwoo/ss-82447112
  • 25. 25 (LibreOffice) 리브레오피스 우리말 모듬 번외 (NLP) Natural Language Processing 라이브러리 Open-korean-text https://github.com/open-korean-text/ KoNLPy https://konlpy.org/en/latest/ 꼬꼬마 프로젝트 http://kkma.snu.ac.kr/ 정리 https://github.com/datanada/Awesome-Korean-NLP
  • 26. 26 (LibreOffice) 리브레오피스 우리말 모듬 All text and image content in this document is licensed under the Creative Commons Attribution-Share Alike 3.0 License (unless otherwise specified). "LibreOffice" and "The Document Foundation" are registered trademarks. Their respective logos and icons are subject to international copyright laws. The use of these therefore is subject to the trademark policy. 고맙습니다