SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
리브레오피스 우리말 모듬
XML 파일 구조 및 리브레오피스
(LibreOffice) 의 자동 교정 기능 소개 등
리브레오피스 (LibreOffice) 우리말 모듬
성대현 (DaeHyun Sung, 成大鉉 , ソン・デヒョン )
2021 년 09 월 10 일 금요일
XML 은 무엇인가 ?
eXtensible Markup Language
W3C 에서 개발됨 . 다목적 마크업 언어
W3C XML 표준 문서
HTML 과 매우 비슷한 문자기반의 마크업 언어 (Text-based Markup
Language), 사람과 기계가 동시에 읽기 편한 구조
다른 시스템 끼리 다양한 종류의 데이터를 손쉽게 교환할 수 있음
확장성 좋음 , 데이터 전달 및 저장 용도로 적합
XML 기반 언어
참고 :
XML 의 구조
참고 : 초보자를 위한 XML 설명
<?xml version="1.0"?>
<OWNER>Colin Wilcox</OWNER>
ODF 구조
ODF 구조 (zip 파일 안에 xml 파일이 존재 )
OOXML 구조 (zip 파일 안에 xml 파일이 존재 )
자동 교정 (Auto correct)
입력한 내용이 오타가 났을때 , 자동으로 교정을 해주는 기능
한글 (HWP), MS 워드에도 기능 있음
한글 (HWP): “ 빠른 교정”
MS 워드 : “ 자동 고침”
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
리브레오피스 (LibreOffice) 의 예시
리브레오피스 우리말 모듬
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
한국어 어문 규범 - 표준어 규정
NLP 라이브러리인 “ open-korean-text”
인터넷상 오타체나 실수등을 정리한 typo.txt
리브레오피스 우리말 모듬
먼저 해야할 일
우선 다음의 저장소를 clone -
자동 교정을 할 데이터 수집 !
한국어 어문 규정 – 표준어 규정
여기서 “손구루마”를 입력시 “손수레”로 바꿔야 함을 인지
clone 한 저장소에 수정할 Document.xml 파일을 열어보기
XML 파일에 바꿔야할 대상 및 바꾼 말을 만들어보기
block-list:abbreviated-name 속성에 수정해야할 낱말을 작성하고 ,
block-list:name 에 수정된 낱말을 적으면 됩니다 .
<block-list:block block-list:abbreviated-name=" 손구루마 " block-list:name=" 손수레 "/>
리브레오피스 우리말 모듬
주의 사항
자동 교정 내용을 작성 및 제출 시 block-list:abbreviated-name
속성 기준으로 가나다 오름차순으로 작성하여 제출하시기 바랍니
다 . 가나다 순으로 작성하지 않으면 풀리퀘스트 (Pull Request)
가 거절 될 수 있습니다 .
자동 교정 내용을 추가 하실때 , 국립국어원의 사전과 네이버
국어사전을 참고로 하여 검색후 , 기존 낱말이 있는 경우는
추가하지 말아주십시요
예를 들어 , “ 금세”의 경우 “금새”의 틀린 말이라고 생각하여
추가하는 경우가 있는데 , “ 금세”라는 뜻과 다른 “금새”라는
낱말이 있습니다 .
리브레오피스 우리말 모듬
Github PR 전달하기
커밋 후 저장소에 PR 전달하기
리브레오피스 우리말 모듬
다음주의 활동
미리 리브레오피스 (LibreOffice) 를 빌드해봅시다 .
리브레오피스 (LibreOffice) core 저장소 (Repository) 의
extras/source/autocorr/lang/ko/DocumentList.xml 파일에
추가한 한국어의 자동교정 대상 낱말을 커밋 및 제출 해보기 실습
Gerrit 을 이용하여 제출
리브레오피스 우리말 모듬
자동 교정 (Auto correct)
[ko] Extend Autocorrect list for Korean language
Gerrit 코드 리뷰 시스템
[ko] add new autocorrect words for Korean
빌드 (Build)
Gerrit 소스코드 리뷰시스템에서 다운로드 받음
권장 : Linux & MacOS
Windows → VM  위에서 작업하는 것이 좋음
빌드 하는 방법 (Wiki)
리브레오피스 우리말 모듬
빌드 (Build) 설정
일반적인 빌드 설정
Wiki 에서 안내하는 빌드 설정에 몇몇 부분 추가 해야 빌드 됨
한국어 설정 추가
디버깅 옵션 추가
$ git clone libreoffice
$ cd libreoffice
$ ./ --disable-breakpad --disable-online-update
$ git clone libreoffice
$ cd libreoffice
$ ./ --with-locales="ko" -–with-lang="ko" --disable-breakpad --disable-online-update
$ git clone libreoffice
$ cd libreoffice
$ ./ --with-locales="ko" --with-lang="ko" –enable-dbgutil --disable-breakpad --disable-online-update
리브레오피스 우리말 모듬
빌드 설정 선택사항 , 빌드 및 실행
빌드 선택사항 조회
일반적인 실행
선택 실행 (ex. Writer, calc 등 )
$ ./ --help
$ make
$ instdir/program/soffice # Linux
$ open instdir/ # MacOSX
$ instdir/program/soffice –writer
$ instdir/program/soffice --calc
리브레오피스 우리말 모듬
빌드 및 디버깅 영상
LibreOffice Build Demo
How to build LibreOffice on your desktop (openSUSE.Asia
summit 2017)
Developing LibreOffice in Visual Studio
LibreOffice Conference 2019 – Reducing LibreOffice build
time with include-what-you-use
LibreOffice Conference 2016: Connect, Embed, Integrate -
LibreOffice as a building block
리브레오피스 우리말 모듬
개발 기여하기 전에 해야할 사항
위키 내용
LibreOffice 의 라이선스 (License)
전달 내용
All of my past & future contributions to LibreOffice may be
licensed under the MPLv2/LGPLv3+ dual license.
리브레오피스 우리말 모듬
개발 기여하기 전에 해야할 사항
제목 : ‘ 본인 이름’ license statement
All of my past & future contributions to LibreOffice may be
licensed under the MPLv2/LGPLv3+ dual license.
리브레오피스 우리말 모듬
Gerrit 리뷰시스템 가입 및 ssh 키 등록
리브레오피스 Gerrit 리뷰시스템 가입
설정 :
SSH 키 설정
Github 에 SSH 키 등록
LibreOffice 의 Gerrit 에 SSH 키 등록
리브레오피스 우리말 모듬
Logerrit 설정
다음의 명령어로 입력 후 확인
상세 내용
$ ./logerrit setup
Note that you need to register additional email addresses, if you want to
commit from them. Each additional email address must be confirmed by
following the verification link sent to it.
Which user name did you choose? “본인 이름이나 닉네임”
Please now add the following to your ~/.ssh/config, creating the file if needed:
Host logerrit
IdentityFile ~/.ssh/id_rsa
User “본인 이름이나 닉네임”
Port 29418
To see if your setup was successful, run './logerrit test'
$ ./logerrit test
Enter passphrase for key '/***/.ssh/id_rsa':
Your gerrit setup was successful!
리브레오피스 우리말 모듬
읽어봐야할 문서 및 잡지
마이크로소프트웨어 396 호 ,
2019 년 출간
리터러시 아드레날린 (Literacy
네이버 책의 소개
리브레오피스 우리말 모듬
번외 (huspell-ko)
자유오픈소스로 구현된 맞춤법 검사기능
관련 슬라이드
Hunspell 한국어 맞춤법 검사의 원리
국립국어원 오픈소스 어휘 정보 활용 사례
리브레오피스 우리말 모듬
번외 (NLP)
Natural Language Processing
꼬꼬마 프로젝트
리브레오피스 우리말 모듬
All text and image content in this document is licensed under the Creative Commons Attribution-Share Alike 3.0 License
(unless otherwise specified). "LibreOffice" and "The Document Foundation" are registered trademarks. Their respective logos
and icons are subject to international copyright laws. The use of these therefore is subject to the trademark policy.

Contenu connexe


Tendances (12)

[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
[2021 오픈소스 컨트리뷰션 아카데미] #5 컨트리뷰션 정리 및 gerrit리뷰시스템 소개 등
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션 [2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
[2020 컨트리뷰톤] 리브레오피스의 버그질라 소개 및 사용법, 버그 헌팅 세션
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기 [2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
[2020 컨트리뷰톤] 리브레오피스 (LibreOffice) 번역, 번역 도구관련 이야기
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 문서화 및 번역, 빌드등
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
[2019.02.01] 리브레오피스 우리말 모듬 첫 모임
[2021 오픈소스 컨트리뷰션 아카데미] Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
[2021 오픈소스 컨트리뷰션 아카데미]  Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)[2021 오픈소스 컨트리뷰션 아카데미]  Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
[2021 오픈소스 컨트리뷰션 아카데미] Libreoffice 한국어 번역 및 사용성 기능 향상 프로젝트 킥오프 미팅 (2021.08.07.)
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
[2020 컨트리뷰톤] 리브레오피스(LibreOffice)의 소스코드 개발, 빌드, 제출, 검토(리뷰)하기 등을 소개
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
[2021 오픈소스 컨트리뷰션 아카데미] #8 Hacktoberfest 소개 및 리브레오피스(LibreOffice) 소스코드 제출해보기
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
[GDG Seoul] 2019.01.22. 나의 해외 컨퍼런스 참석 및 발표기
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기 [Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
[Emocon 2017 S/S] 20170414 유니코드(Unicode)로 오픈소스에 기여하기
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
파이썬을 활용한 금융 분석 Ch 9. Input Output Operation
201017 한주현 생물정보학 github 강의
201017 한주현 생물정보학 github 강의201017 한주현 생물정보학 github 강의
201017 한주현 생물정보학 github 강의

Similaire à [2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등

레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드
Sukjoon Kim
cheonsu park
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
Amazon Web Services Korea
[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)
태욱 김
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개
Toby Yun

Similaire à [2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등 (20)

2-2. html5
2-2. html52-2. html5
2-2. html5
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
[Ubucon Asia 2022] 리브레오피스의 현재와 앞으로 나아갈길
System+os study 4
System+os study 4System+os study 4
System+os study 4
강분도 - 공개SW개발과 우분투 (2010Y10M05D)
강분도 - 공개SW개발과 우분투 (2010Y10M05D)강분도 - 공개SW개발과 우분투 (2010Y10M05D)
강분도 - 공개SW개발과 우분투 (2010Y10M05D)
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
[UbuCon Korea 2023] 한국의 문서 표준과 LibreOffice 한국어 커뮤니티 활동 소개
XECon + PHPFest 2014 XE 프로젝트 이야기
XECon + PHPFest 2014 XE 프로젝트 이야기XECon + PHPFest 2014 XE 프로젝트 이야기
XECon + PHPFest 2014 XE 프로젝트 이야기
build a linux webhosting server
build a linux webhosting serverbuild a linux webhosting server
build a linux webhosting server
Laravel로 스타트업 기술 스택 구성하기
Laravel로 스타트업 기술 스택 구성하기Laravel로 스타트업 기술 스택 구성하기
Laravel로 스타트업 기술 스택 구성하기
레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드레일스를 이용한 애자일 웹 개발 가이드
레일스를 이용한 애자일 웹 개발 가이드
토픽기반 컨텐츠관리와 실시간 개발 지원방안
토픽기반 컨텐츠관리와 실시간 개발 지원방안토픽기반 컨텐츠관리와 실시간 개발 지원방안
토픽기반 컨텐츠관리와 실시간 개발 지원방안
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
[Devil's camp 2019] 혹시 Elixir 아십니까? 정.말.갓.언.어.입.니.다
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
클라우드 세상에서 IT 관리자로 살아남기 - AWS Summit Seoul 2017
[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)[M] 프레임워크와 라이브러리(Framework and Library)
[M] 프레임워크와 라이브러리(Framework and Library)
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
오픈소스 개발참여한 이야기 (NIPA 오픈프론티어 3기 송태웅)
깃허브 시작하기
깃허브 시작하기깃허브 시작하기
깃허브 시작하기
Web 2.0과 도서관 활용사례
Web 2.0과 도서관 활용사례Web 2.0과 도서관 활용사례
Web 2.0과 도서관 활용사례
CloudFront 활용하기
CloudFront 활용하기CloudFront 활용하기
CloudFront 활용하기
웹기술 이해 (프론트엔드 기초)
웹기술 이해 (프론트엔드 기초)웹기술 이해 (프론트엔드 기초)
웹기술 이해 (프론트엔드 기초)

Plus de DaeHyun Sung

[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea
DaeHyun Sung
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in KoreanLibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
DaeHyun Sung
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
DaeHyun Sung

Plus de DaeHyun Sung (11)

[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea[LiboCon 2023] LibreOffice's current status and community in South Korea
[LiboCon 2023] LibreOffice's current status and community in South Korea
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in KoreanLibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
LibreOffice Kaigi 2023 Keynote: my FLOSS contribution activities in Korean
[LibreOffice Conference 2022] State of Korea in Libreoffice and promote futu...
[LibreOffice Conference 2022]  State of Korea in Libreoffice and promote futu...[LibreOffice Conference 2022]  State of Korea in Libreoffice and promote futu...
[LibreOffice Conference 2022] State of Korea in Libreoffice and promote futu...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[Ubucon Asia 2021] The challenge of Using LibreOffice & Building Local Commun...
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
[LibreOffice conference 2021] The challenge of Using LibreOffice & Building L...
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
[LibreOffice Korea-Japan online Seminar] Introduce to LibreOffice & Korean Is...
Building LibreOffice Korean Community and CJK common & different issues
Building LibreOffice Korean Community and CJK common & different issuesBuilding LibreOffice Korean Community and CJK common & different issues
Building LibreOffice Korean Community and CJK common & different issues
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[LibreOffice Asia Conference 2019] CJK Issues on LibreOffice(based on Korean ...
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
[2018.12.09.] 第8回 九州LibreOffice勉強会 - HWP
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME CJ...
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME  CJ...[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME  CJ...
[COSCUP x GNOME.Asia x openSUSE 2018] Support to Korean language on GNOME CJ...

[2021 오픈소스 컨트리뷰션 아카데미] #6 XML파일구조 및 리브레오피스의 자동교정 기능 소개 등

  • 1. 1 (LibreOffice) 리브레오피스 우리말 모듬 XML 파일 구조 및 리브레오피스 (LibreOffice) 의 자동 교정 기능 소개 등 리브레오피스 (LibreOffice) 우리말 모듬 성대현 (DaeHyun Sung, 成大鉉 , ソン・デヒョン ) 2021 년 09 월 10 일 금요일
  • 2. XML 은 무엇인가 ? eXtensible Markup Language W3C 에서 개발됨 . 다목적 마크업 언어 W3C XML 표준 문서 HTML 과 매우 비슷한 문자기반의 마크업 언어 (Text-based Markup Language), 사람과 기계가 동시에 읽기 편한 구조 다른 시스템 끼리 다양한 종류의 데이터를 손쉽게 교환할 수 있음 확장성 좋음 , 데이터 전달 및 저장 용도로 적합 XML 기반 언어 XHTML, SVG, RDF, RSS, Atom, MathXML 참고 :
  • 3. XML 의 구조 참고 : 초보자를 위한 XML 설명 4%EC%9E%90%EB%A5%BC-%EC%9C%84%ED%95%9C-xml-%EC%8 4%A4%EB%AA%85-a87d234d-4c2e-4409-9cbc-45e4eb857d44 <?xml version="1.0"?> <CAT> <NAME>Izzy</NAME> <BREED>Siamese</BREED> <AGE>6</AGE> <ALTERED>yes</ALTERED> <DECLAWED>no</DECLAWED> <LICENSE>Izz138bod</LICENSE> <OWNER>Colin Wilcox</OWNER> </CAT>
  • 4. ODF 구조 ODF 구조 (zip 파일 안에 xml 파일이 존재 )
  • 5. OOXML 구조 OOXML 구조 (zip 파일 안에 xml 파일이 존재 )
  • 6. 자동 교정 (Auto correct) 입력한 내용이 오타가 났을때 , 자동으로 교정을 해주는 기능 한글 (HWP), MS 워드에도 기능 있음 한글 (HWP): “ 빠른 교정” MS 워드 : “ 자동 고침”
  • 7. 7 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) 리브레오피스 (LibreOffice) 의 예시
  • 9. 9 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) 데이터 국립국어원 한국어 어문 규범 - 표준어 규정 0002 NLP 라이브러리인 “ open-korean-text” 인터넷상 오타체나 실수등을 정리한 typo.txt rc/main/resources/org/openkoreantext/processor/util/typos/typos.txt
  • 10. 10 (LibreOffice) 리브레오피스 우리말 모듬 먼저 해야할 일 우선 다음의 저장소를 clone - 자동 교정을 할 데이터 수집 ! 한국어 어문 규정 – 표준어 규정 여기서 “손구루마”를 입력시 “손수레”로 바꿔야 함을 인지 clone 한 저장소에 수정할 Document.xml 파일을 열어보기 XML 파일에 바꿔야할 대상 및 바꾼 말을 만들어보기 block-list:abbreviated-name 속성에 수정해야할 낱말을 작성하고 , block-list:name 에 수정된 낱말을 적으면 됩니다 . <block-list:block block-list:abbreviated-name=" 손구루마 " block-list:name=" 손수레 "/>
  • 11. 11 (LibreOffice) 리브레오피스 우리말 모듬 주의 사항 자동 교정 내용을 작성 및 제출 시 block-list:abbreviated-name 속성 기준으로 가나다 오름차순으로 작성하여 제출하시기 바랍니 다 . 가나다 순으로 작성하지 않으면 풀리퀘스트 (Pull Request) 가 거절 될 수 있습니다 . 자동 교정 내용을 추가 하실때 , 국립국어원의 사전과 네이버 국어사전을 참고로 하여 검색후 , 기존 낱말이 있는 경우는 추가하지 말아주십시요 예를 들어 , “ 금세”의 경우 “금새”의 틀린 말이라고 생각하여 추가하는 경우가 있는데 , “ 금세”라는 뜻과 다른 “금새”라는 낱말이 있습니다 .
  • 12. 12 (LibreOffice) 리브레오피스 우리말 모듬 Github PR 전달하기 커밋 후 저장소에 PR 전달하기
  • 13. 13 (LibreOffice) 리브레오피스 우리말 모듬 다음주의 활동 미리 리브레오피스 (LibreOffice) 를 빌드해봅시다 . 리브레오피스 (LibreOffice) core 저장소 (Repository) 의 extras/source/autocorr/lang/ko/DocumentList.xml 파일에 추가한 한국어의 자동교정 대상 낱말을 커밋 및 제출 해보기 실습 Gerrit 을 이용하여 제출
  • 14. 14 (LibreOffice) 리브레오피스 우리말 모듬 자동 교정 (Auto correct) Bugzilla [ko] Extend Autocorrect list for Korean language 135727 Gerrit 코드 리뷰 시스템 [ko] add new autocorrect words for Korean
  • 15. 빌드 (Build) Gerrit 소스코드 리뷰시스템에서 다운로드 받음 권장 : Linux & MacOS Windows → VM  위에서 작업하는 것이 좋음 빌드 하는 방법 (Wiki) Linux MacOS Windows Online Android
  • 16. 16 (LibreOffice) 리브레오피스 우리말 모듬 빌드 (Build) 설정 일반적인 빌드 설정 Wiki 에서 안내하는 빌드 설정에 몇몇 부분 추가 해야 빌드 됨 한국어 설정 추가 디버깅 옵션 추가 $ git clone libreoffice $ cd libreoffice $ ./ --disable-breakpad --disable-online-update $ git clone libreoffice $ cd libreoffice $ ./ --with-locales="ko" -–with-lang="ko" --disable-breakpad --disable-online-update $ git clone libreoffice $ cd libreoffice $ ./ --with-locales="ko" --with-lang="ko" –enable-dbgutil --disable-breakpad --disable-online-update
  • 17. 17 (LibreOffice) 리브레오피스 우리말 모듬 빌드 설정 선택사항 , 빌드 및 실행 빌드 선택사항 조회 빌드하기 실행하기 일반적인 실행 선택 실행 (ex. Writer, calc 등 ) $ ./ --help $ make $ instdir/program/soffice # Linux $ open instdir/ # MacOSX $ instdir/program/soffice –writer $ instdir/program/soffice --calc
  • 18. 18 (LibreOffice) 리브레오피스 우리말 모듬 빌드 및 디버깅 영상 LibreOffice Build Demo How to build LibreOffice on your desktop (openSUSE.Asia summit 2017) Developing LibreOffice in Visual Studio LibreOffice Conference 2019 – Reducing LibreOffice build time with include-what-you-use LibreOffice Conference 2016: Connect, Embed, Integrate - LibreOffice as a building block
  • 19. 19 (LibreOffice) 리브레오피스 우리말 모듬 개발 기여하기 전에 해야할 사항 위키 내용 LibreOffice 의 라이선스 (License) MPLv2 &lType=osi LGPLv3 &lType=osi 전달 내용 All of my past & future contributions to LibreOffice may be licensed under the MPLv2/LGPLv3+ dual license.
  • 20. 20 (LibreOffice) 리브레오피스 우리말 모듬 개발 기여하기 전에 해야할 사항 예시 제목 : ‘ 본인 이름’ license statement 내용 예제 http://document-foundation-mail-archive.969070.n3.nabble.c om/DaeHyun-Sung-license-statement-td4240049.html All of my past & future contributions to LibreOffice may be licensed under the MPLv2/LGPLv3+ dual license.
  • 21. 21 (LibreOffice) 리브레오피스 우리말 모듬 Gerrit 리뷰시스템 가입 및 ssh 키 등록 리브레오피스 Gerrit 리뷰시스템 가입 설정 : SSH 키 설정 -new-ssh-key-and-adding-it-to-the-ssh-agent Github 에 SSH 키 등록 a-new-ssh-key-to-your-github-account LibreOffice 의 Gerrit 에 SSH 키 등록
  • 22. 22 (LibreOffice) 리브레오피스 우리말 모듬 Logerrit 설정 다음의 명령어로 입력 후 확인 상세 내용 $ ./logerrit setup Note that you need to register additional email addresses, if you want to commit from them. Each additional email address must be confirmed by following the verification link sent to it. Which user name did you choose? “본인 이름이나 닉네임” Please now add the following to your ~/.ssh/config, creating the file if needed: Host logerrit IdentityFile ~/.ssh/id_rsa User “본인 이름이나 닉네임” Port 29418 HostName To see if your setup was successful, run './logerrit test' $ ./logerrit test Enter passphrase for key '/***/.ssh/id_rsa': Your gerrit setup was successful!
  • 23. 23 (LibreOffice) 리브레오피스 우리말 모듬 읽어봐야할 문서 및 잡지 마이크로소프트웨어 396 호 , 2019 년 출간 리터러시 아드레날린 (Literacy Adrenaline) 네이버 책의 소개 kdb/book_detail.nhn?bid=14 820577 판매처 리디북스 /2979000018
  • 24. 24 (LibreOffice) 리브레오피스 우리말 모듬 번외 (huspell-ko) 자유오픈소스로 구현된 맞춤법 검사기능 관련 슬라이드 Hunspell 한국어 맞춤법 검사의 원리 국립국어원 오픈소스 어휘 정보 활용 사례
  • 25. 25 (LibreOffice) 리브레오피스 우리말 모듬 번외 (NLP) Natural Language Processing 라이브러리 Open-korean-text KoNLPy 꼬꼬마 프로젝트 정리
  • 26. 26 (LibreOffice) 리브레오피스 우리말 모듬 All text and image content in this document is licensed under the Creative Commons Attribution-Share Alike 3.0 License (unless otherwise specified). "LibreOffice" and "The Document Foundation" are registered trademarks. Their respective logos and icons are subject to international copyright laws. The use of these therefore is subject to the trademark policy. 고맙습니다