SlideShare une entreprise Scribd logo
1  sur  17
Télécharger pour lire hors ligne
書籍の電子化に関する体験談
    2013/4/8 金子弘樹
話すこと

•   ある本のPDFを元にEPUBブックを作成した体
    験談

•   はじめて自炊代行サービスを利用した感想

•   EPUB作成ツールの未成熟に驚く

•   右綴じ、縦書きEPUBの設定方法
「自炊」のはじまり
•   書籍をスキャナーで読み込み電子化する方法
    を、通称「自炊」という

•   両面を一度に読めるドキュメントスキャナー
    の普及などが後押し

•   裁断機で本を裁断し、1枚ずつ読み込む

    •   個人が書籍を裁断、1枚ずつスキャン?面倒
        だ!そこで業者に頼むことにした
「自炊」代行サービスの勃興


• 印刷所?などが自社の機器を活かし、
 書籍のスキャニングサービスを始める

• 1冊100円から、業者も多数あり
• しかしスキャンした本は捨ててしまう
 →著作権への配慮と思われる
自炊と著作権
•   テレビ番組の録画と同じく、書籍電子化は
    「個人の私的複製」となる筈

•   自炊代行業者は「個人」ではないので「個人
    の私的複製」に当てはまらない?

•   法律が時代について行けていない

•   「「自炊」代行、著作権使用料徴収で許諾検
    討」(2013年3月26日06時19分 読売新聞)
本を返却する業者

•   スキャンした本を返してくれる業者もある

•   ポリシーを持って営業しているようだが著作
    権的にはグレーゾーンの部分もある

•   260ページ、400dpi、OCR付き、裁断済み本の
    糊付け込みで3500円だった

•   基本250P 800円+オプション
PDFからEPUBへ
•   自炊代行業者はスキャンした本をPDF形式に変換後、
    OCRで検索可能なPDFにもできる

•   日本語、特に縦書き、更に二段組の本はOCRの精度が低
    い

•   OCRで9割ほど認識した後に手動で修正するのがよい

•   PDFから抽出したテキストを元にEPUB化できれば電子本
    ストアで販売できる
EPUBとは
•   EPUB(イーパブ)は、電子書籍の規格の1つであ
    る。米国の電子書籍の標準化団体の1つである国際
    電子出版フォーラム (International Digital Publishing
    Forum, IDPF) が普及促進している公開された仕様の
    電子書籍用ファイル・フォーマット規格である。

•   Wikipediaより。
    http://ja.wikipedia.org/wiki/EPUB
EPUBの仕組み
•   各章を構成するxhtmlと見た目を定義するcssをzipで
    固めただけ

•   Apple iBooksは著作権保護機能などを独自に追加
    (EPUB非標準)

•   まるで黎明期のHTMLを勉強しているようだ

•   タグ手打ちで本の作成は面倒。優秀なツールの登場
    が望まれる
EPUB作成ツール(1)
•   Mac OS X

    •   Apple Pages(1700円)

        •   現状EPUB 2.0のみ対応

    •   Apple iBooks Author(無料)

        •   電子教科書作りに特化。長文には向かず

    •   Adobe InDesign(料金まちまち)

        •   プロ用ツール。業者さんはどうぞ
EPUB作成ツール(2)
•   Windows

    •   ジャストシステム 一太郎 2013 玄(16800円∼)

        •   EPUB 3.0の縦書きにも対応

•   マルチプラットフォーム(Mac, Linux, Windows)

    •   Sigil(無料。寄付歓迎)

    •   上記いづれかのアプリで作成した後にタグを修
        正する場合、有効
EPUB 日本語独自の問題

•   縦書き

    •   EPUB3.0で縦書きに対応するも、Pagesで非対応

•   ルビ

    •   HTMLと同じく<ruby>タグで対応しているらしい
        が今回は使わず

•   右綴じ

    •   content.opfファイルの設定で対応可能(後述)
今回のワークフロー
1. 紙の本をテキスト付きPDFにしてもらう(業
 者に頼む)

2. PDFからテキスト、画像を抽出

3. Apple Pagesで編集、EPUB出力

4. Sigilで開き直しタグを修正する(縦書き化)
縦書き、右綴じに修正する場合(1)


・Style0001.cssを修正
body {

    epub-writing-mode:vertical-rl;

    -webkit-writing-mode:vertical-rl;

}

 →縦書き、右綴じの意
縦書き、右綴じに修正する場合(2)


・各章を構成するxhtmlにcssを読み込む
旨、明示的に指定
<head>

  <link href="../Styles/book.css" rel="stylesheet"
type="text/css" />

</head>
縦書き、右綴じに修正する場合(3)


・content.opf

<package xmlns="http://www.idpf.org/2007/opf"
unique-identifier="BookId" version="3.0" xml:lang="ja">

 →version属性値を3.0に変更、xml:lang="ja"属性追加

<spine page-progression-direction="rtl" toc="ncx">

 →page-progression-direction属性追加

  ページ開きは右から左(Right To Left)の意
まとめ
•   自炊は面倒なので代行サービスを利用していきたい

•   「自炊代行」を著作権法違反とするのは時代遅れ(著作権
    料二重取りしたいだけ)

•   自炊は過渡期の技術。原稿自体がが電子データなら自炊も
    要らない

•   EPUB、特に日本語特有の問題に関してはツールが未成熟

•   これから大手電子本ストアに公開するところまで体験して
    みたい

Contenu connexe

En vedette

Searching trusted info
Searching trusted infoSearching trusted info
Searching trusted infoHiroki Kaneko
 
Connecting ti cc2541 with i os
Connecting ti cc2541 with i osConnecting ti cc2541 with i os
Connecting ti cc2541 with i osHiroki Kaneko
 
Make physical game with Unity
Make physical game with UnityMake physical game with Unity
Make physical game with UnityHiroki Kaneko
 
Cloud storage services
Cloud storage servicesCloud storage services
Cloud storage servicesHiroki Kaneko
 

En vedette (8)

Couchsurfing&AirBnB
Couchsurfing&AirBnBCouchsurfing&AirBnB
Couchsurfing&AirBnB
 
Password management
Password managementPassword management
Password management
 
Searching trusted info
Searching trusted infoSearching trusted info
Searching trusted info
 
Using MVNO at Japan
Using MVNO at JapanUsing MVNO at Japan
Using MVNO at Japan
 
Connecting ti cc2541 with i os
Connecting ti cc2541 with i osConnecting ti cc2541 with i os
Connecting ti cc2541 with i os
 
Make physical game with Unity
Make physical game with UnityMake physical game with Unity
Make physical game with Unity
 
Cloud storage services
Cloud storage servicesCloud storage services
Cloud storage services
 
Air bnb host_diary
Air bnb host_diaryAir bnb host_diary
Air bnb host_diary
 

Similaire à Making EPUB in Japanese

セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸
セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸
セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸schoowebcampus
 
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸schoowebcampus
 
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸schoowebcampus
 
いいパブッ!! はじめてのEPUB 3
いいパブッ!! はじめてのEPUB 3いいパブッ!! はじめてのEPUB 3
いいパブッ!! はじめてのEPUB 3Hiroshi Takase
 
同人誌作家のための電子書籍ガイド
同人誌作家のための電子書籍ガイド同人誌作家のための電子書籍ガイド
同人誌作家のための電子書籍ガイドKatsuhiro OGATA
 

Similaire à Making EPUB in Japanese (7)

セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸
セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸
セルフパブリッシング完全ガイド〜電子書籍の作り方 先生:大西 隆幸
 
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
 
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
15分で誰でもできる、はじめての電子書籍出版 先生:大西隆幸
 
2014.06.11「NextPublishingメソッド最新バージョンお披露目
2014.06.11「NextPublishingメソッド最新バージョンお披露目2014.06.11「NextPublishingメソッド最新バージョンお披露目
2014.06.11「NextPublishingメソッド最新バージョンお披露目
 
いいパブッ!! はじめてのEPUB 3
いいパブッ!! はじめてのEPUB 3いいパブッ!! はじめてのEPUB 3
いいパブッ!! はじめてのEPUB 3
 
同人誌作家のための電子書籍ガイド
同人誌作家のための電子書籍ガイド同人誌作家のための電子書籍ガイド
同人誌作家のための電子書籍ガイド
 
第一回勉強会
第一回勉強会第一回勉強会
第一回勉強会
 

Dernier

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 

Dernier (8)

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

Making EPUB in Japanese

  • 2. 話すこと • ある本のPDFを元にEPUBブックを作成した体 験談 • はじめて自炊代行サービスを利用した感想 • EPUB作成ツールの未成熟に驚く • 右綴じ、縦書きEPUBの設定方法
  • 3. 「自炊」のはじまり • 書籍をスキャナーで読み込み電子化する方法 を、通称「自炊」という • 両面を一度に読めるドキュメントスキャナー の普及などが後押し • 裁断機で本を裁断し、1枚ずつ読み込む • 個人が書籍を裁断、1枚ずつスキャン?面倒 だ!そこで業者に頼むことにした
  • 4. 「自炊」代行サービスの勃興 • 印刷所?などが自社の機器を活かし、 書籍のスキャニングサービスを始める • 1冊100円から、業者も多数あり • しかしスキャンした本は捨ててしまう →著作権への配慮と思われる
  • 5. 自炊と著作権 • テレビ番組の録画と同じく、書籍電子化は 「個人の私的複製」となる筈 • 自炊代行業者は「個人」ではないので「個人 の私的複製」に当てはまらない? • 法律が時代について行けていない • 「「自炊」代行、著作権使用料徴収で許諾検 討」(2013年3月26日06時19分 読売新聞)
  • 6. 本を返却する業者 • スキャンした本を返してくれる業者もある • ポリシーを持って営業しているようだが著作 権的にはグレーゾーンの部分もある • 260ページ、400dpi、OCR付き、裁断済み本の 糊付け込みで3500円だった • 基本250P 800円+オプション
  • 7. PDFからEPUBへ • 自炊代行業者はスキャンした本をPDF形式に変換後、 OCRで検索可能なPDFにもできる • 日本語、特に縦書き、更に二段組の本はOCRの精度が低 い • OCRで9割ほど認識した後に手動で修正するのがよい • PDFから抽出したテキストを元にEPUB化できれば電子本 ストアで販売できる
  • 8. EPUBとは • EPUB(イーパブ)は、電子書籍の規格の1つであ る。米国の電子書籍の標準化団体の1つである国際 電子出版フォーラム (International Digital Publishing Forum, IDPF) が普及促進している公開された仕様の 電子書籍用ファイル・フォーマット規格である。 • Wikipediaより。 http://ja.wikipedia.org/wiki/EPUB
  • 9. EPUBの仕組み • 各章を構成するxhtmlと見た目を定義するcssをzipで 固めただけ • Apple iBooksは著作権保護機能などを独自に追加 (EPUB非標準) • まるで黎明期のHTMLを勉強しているようだ • タグ手打ちで本の作成は面倒。優秀なツールの登場 が望まれる
  • 10. EPUB作成ツール(1) • Mac OS X • Apple Pages(1700円) • 現状EPUB 2.0のみ対応 • Apple iBooks Author(無料) • 電子教科書作りに特化。長文には向かず • Adobe InDesign(料金まちまち) • プロ用ツール。業者さんはどうぞ
  • 11. EPUB作成ツール(2) • Windows • ジャストシステム 一太郎 2013 玄(16800円∼) • EPUB 3.0の縦書きにも対応 • マルチプラットフォーム(Mac, Linux, Windows) • Sigil(無料。寄付歓迎) • 上記いづれかのアプリで作成した後にタグを修 正する場合、有効
  • 12. EPUB 日本語独自の問題 • 縦書き • EPUB3.0で縦書きに対応するも、Pagesで非対応 • ルビ • HTMLと同じく<ruby>タグで対応しているらしい が今回は使わず • 右綴じ • content.opfファイルの設定で対応可能(後述)
  • 13. 今回のワークフロー 1. 紙の本をテキスト付きPDFにしてもらう(業 者に頼む) 2. PDFからテキスト、画像を抽出 3. Apple Pagesで編集、EPUB出力 4. Sigilで開き直しタグを修正する(縦書き化)
  • 14. 縦書き、右綴じに修正する場合(1) ・Style0001.cssを修正 body { epub-writing-mode:vertical-rl; -webkit-writing-mode:vertical-rl; }  →縦書き、右綴じの意
  • 16. 縦書き、右綴じに修正する場合(3) ・content.opf <package xmlns="http://www.idpf.org/2007/opf" unique-identifier="BookId" version="3.0" xml:lang="ja">  →version属性値を3.0に変更、xml:lang="ja"属性追加 <spine page-progression-direction="rtl" toc="ncx">  →page-progression-direction属性追加   ページ開きは右から左(Right To Left)の意
  • 17. まとめ • 自炊は面倒なので代行サービスを利用していきたい • 「自炊代行」を著作権法違反とするのは時代遅れ(著作権 料二重取りしたいだけ) • 自炊は過渡期の技術。原稿自体がが電子データなら自炊も 要らない • EPUB、特に日本語特有の問題に関してはツールが未成熟 • これから大手電子本ストアに公開するところまで体験して みたい