SlideShare une entreprise Scribd logo
1  sur  44
Is EDINET 5 star? N. Shimizu chikoski@gmail.com / @chikoski 2011.1.27 1 N. Shimizu <chikoski@gmail.com>
自己紹介 清水智公 / @chikoski 嘉悦大学情報メディアセンター / 慶應義塾大学政策・メディア研究科 http://chikoski.info/ 2011.1.27 2 N. Shimizu <chikoski@gmail.com>
http://xbrl.tom.sfc.keio.ac.jp/ 2011.1.27 3 N. Shimizu <chikoski@gmail.com>
http://edinet.chikoski.info/ 2011.1.27 4 N. Shimizu <chikoski@gmail.com>
概要 EDINET Web APIの概要 作成の背景 リストの取得方法 レポートの取得方法 作成しているときに思ったこと 今後の方向性 2011.1.27 5 N. Shimizu <chikoski@gmail.com>
EDINET Web APIの概要 2011.1.27 6 N. Shimizu <chikoski@gmail.com>
作成の背景 EDINETを機械に優しいサイトに 機械:プログラム 今のEDINETは機械に対してつめたい 他のシステムに対してオープンに 簡単な検索インタフェースの提供 XBRLファイルへのアクセス手段の提供 2011.1.27 7 N. Shimizu <chikoski@gmail.com>
設計の方針:リンク可能にする 報告書に固定のURLを与えること GETで取得できること トークン等はつかわないこと URLが検索文を兼ねること 2011.1.27 8 N. Shimizu <chikoski@gmail.com>
EDINET Web API 提出されたレポートの検索 日付、期間 EDINETコード 業種 レポートのダウンロード ZIP, xbrlファイル単体 書類管理番号がキー 2011.1.27 9 N. Shimizu <chikoski@gmail.com>
デモ 2011.1.27 10 N. Shimizu <chikoski@gmail.com>
検索:/list/{条件}[.形式] 条件 recent, today, yesterday YYYYMMDD YYYYMMDD-YYYYMMDD EDINETコード 業種 形式:JSON 2011.1.27 11 N. Shimizu <chikoski@gmail.com>
検索結果 2011.1.27 12 N. Shimizu <chikoski@gmail.com>
検索結果 報告書のURL 2011.1.27 13 N. Shimizu <chikoski@gmail.com>
報告書の取得:/report/{管理番号} EDINETの管理番号を指定する /report/S00070PB /report/S00071D9 取得できるレポート XBRLファイルのみ 全部入りのzipファイル 2011.1.27 14 N. Shimizu <chikoski@gmail.com>
システムの概要 2011.1.27 15 N. Shimizu <chikoski@gmail.com>
システムの構成 クローラー:ページなどをダウンロード スクレイパー:必要な情報を抽出 Webインタフェース:検索の受け口 2011.1.27 16 N. Shimizu <chikoski@gmail.com>
システムの構成 クローラー:ページなどをダウンロード スクレイパー:必要な情報を抽出 Webインタフェース:検索の受け口 一番面倒だった 2011.1.27 17 N. Shimizu <chikoski@gmail.com>
2011.1.27 18 N. Shimizu <chikoski@gmail.com>
機械に優しくないサイト 2011.1.27 19 N. Shimizu <chikoski@gmail.com>
クローラー作成の壁 ステータスコードを正しく返さない POSTパラメータの解析 セッションキーの取り扱い 2011.1.27 20 N. Shimizu <chikoski@gmail.com>
ステータスコードを正しく返さない 突然コネクションを切断する 処理に失敗しても200を返す 普通 400番台のコードを返して切断 500番台のコード+ページを返す 2011.1.27 21 N. Shimizu <chikoski@gmail.com>
ステータスコード アクセスの成否を示した数字 数字と意味 200番台:アクセス成功 300番台:転居届 400番台:アクセス失敗 500番台:エラー 2011.1.27 22 N. Shimizu <chikoski@gmail.com>
リクエストヘッダに不備->切断 Hostがinfo.edinet-fsa.go.jpではない User-Agentが対応ブラウザではない Firefox Chrome / Safari IE 2011.1.27 23 N. Shimizu <chikoski@gmail.com>
処理に失敗しても200を返す 処理に失敗するパターン POSTするパラメーターの組み合わせが不正 セッションタイムアウト ファイルが存在しない この全てで200が返ってくる ステータスコードからエラーが検知できない 原因は返ってくるページをみて初めてわかる 2011.1.27 24 N. Shimizu <chikoski@gmail.com>
POSTされる主なパラメーター uji.verb uji.bean TID PID pageUp / pageDown / be.page SESSIONKEY 2011.1.27 25 N. Shimizu <chikoski@gmail.com>
セッションがタイムアウトする原因 アクセス間隔が長い 30分くらい間を置くと切れている 正確な生存期間は不明… POSTするセッションキーとEDINET側のキーが異なる場合 2011.1.27 26 N. Shimizu <chikoski@gmail.com>
EDINETのセッション管理 クッキー セッションキー パラメータ名:SESSIONKEY 13桁の乱数 アクセスするごとに変わる 2011.1.27 27 N. Shimizu <chikoski@gmail.com>
EDINETのセッション管理 クッキー セッションキー パラメータ名:SESSIONKEY 13桁の乱数 アクセスするごとに変わる ポイント 2011.1.27 28 N. Shimizu <chikoski@gmail.com>
2011.1.27 29 N. Shimizu <chikoski@gmail.com>
機械に優しいサイトになるには ステータスコードをきちんと返すこと User-Agentを制限しないこと POSTではなくGETでページが取得できること 不必要なセッション管理をしないこと robots.txtを置くこと 2011.1.27 30 N. Shimizu <chikoski@gmail.com>
EDINETにはrobots.txtがない クローラーに対するポリシーがない キャッシュしてよいもの、悪いものの判断がつかない クローラーでアクセスしてよいの? 2011.1.27 31 N. Shimizu <chikoski@gmail.com>
APIの今後 2011.1.27 32 N. Shimizu <chikoski@gmail.com>
Web = Database 2011.1.27 33 N. Shimizu <chikoski@gmail.com>
よりオープンに 2011.1.27 34 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること 2011.1.27 35 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること 今ココ 2011.1.27 36 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること ココを目指す 2011.1.27 37 N. Shimizu <chikoski@gmail.com>
直近の目標:4つ星を目指す 出力するもの 検索結果 XBRL, XSD, ラベルなど XBRLファイルの変換 XML2RDFを利用する スキーマはXSD2OWLを利用 http://rhizomik.net/html/redefer/ 2011.1.27 38 N. Shimizu <chikoski@gmail.com>
XML2RDFで行われる変換 [1]より 2011.1.27 39 N. Shimizu <chikoski@gmail.com>
5つ星になるには 全てのものをURLで表現 例 会社 業種 dbpedia.jpを参照する予定 2011.1.27 40 N. Shimizu <chikoski@gmail.com>
Linked Data 2011.1.27 41 N. Shimizu <chikoski@gmail.com>
5つ星になった後 企業情報におけるLOD.ACに c.f LODAC Museumhttp://lod.ac/ 2011.1.27 42 N. Shimizu <chikoski@gmail.com>
ご静聴ありがとうございました 2011.1.27 43 N. Shimizu <chikoski@gmail.com>
Linked Dataに関する情報 Tim Berners-Lee, “Linked Data”, http://goo.gl/katw http://linkeddata.org/ http://linkeddata.jp/ “Linked Data in Japan”, http://goo.gl/8pvAI http://lod.ac/ http://scholex.com/ocdi/ 2011.1.27 44 N. Shimizu <chikoski@gmail.com>

Contenu connexe

Plus de Noritada Shimizu

2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.jsNoritada Shimizu
 
20151128 firefoxos-handson
20151128 firefoxos-handson20151128 firefoxos-handson
20151128 firefoxos-handsonNoritada Shimizu
 
Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Noritada Shimizu
 
20150829 firefox-os-handson
20150829 firefox-os-handson20150829 firefox-os-handson
20150829 firefox-os-handsonNoritada Shimizu
 
20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS appsNoritada Shimizu
 
Firefox OS でアプリを作るときに気をつけたい N 個のこと
Firefox OS  でアプリを作るときに気をつけたい N 個のことFirefox OS  でアプリを作るときに気をつけたい N 個のこと
Firefox OS でアプリを作るときに気をつけたい N 個のことNoritada Shimizu
 
Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Noritada Shimizu
 
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)Noritada Shimizu
 
Application submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceApplication submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceNoritada Shimizu
 
つくろう!Firefox OS アプリ
つくろう!Firefox OS アプリつくろう!Firefox OS アプリ
つくろう!Firefox OS アプリNoritada Shimizu
 
20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworldNoritada Shimizu
 
20141115 fx os-codereading
20141115 fx os-codereading20141115 fx os-codereading
20141115 fx os-codereadingNoritada Shimizu
 
20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapiNoritada Shimizu
 
20140830 firefox os-sampler
20140830 firefox os-sampler20140830 firefox os-sampler
20140830 firefox os-samplerNoritada Shimizu
 
20140801 webrtc on-firefox
20140801 webrtc on-firefox20140801 webrtc on-firefox
20140801 webrtc on-firefoxNoritada Shimizu
 

Plus de Noritada Shimizu (20)

2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js
 
20151224-games
20151224-games20151224-games
20151224-games
 
20151128 firefoxos-handson
20151128 firefoxos-handson20151128 firefoxos-handson
20151128 firefoxos-handson
 
20151117 devtools
20151117 devtools20151117 devtools
20151117 devtools
 
Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発
 
20150822 osc-shimane
20150822 osc-shimane20150822 osc-shimane
20150822 osc-shimane
 
20150829 firefox-os-handson
20150829 firefox-os-handson20150829 firefox-os-handson
20150829 firefox-os-handson
 
20150829 firefox-os
20150829 firefox-os20150829 firefox-os
20150829 firefox-os
 
20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps
 
Firefox OS でアプリを作るときに気をつけたい N 個のこと
Firefox OS  でアプリを作るときに気をつけたい N 個のことFirefox OS  でアプリを作るときに気をつけたい N 個のこと
Firefox OS でアプリを作るときに気をつけたい N 個のこと
 
Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)
 
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
 
Application submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceApplication submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox Marketplace
 
つくろう!Firefox OS アプリ
つくろう!Firefox OS アプリつくろう!Firefox OS アプリ
つくろう!Firefox OS アプリ
 
20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld
 
20141115 fx os-codereading
20141115 fx os-codereading20141115 fx os-codereading
20141115 fx os-codereading
 
20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi
 
20140830 firefox os-sampler
20140830 firefox os-sampler20140830 firefox os-sampler
20140830 firefox os-sampler
 
20140801 webrtc on-firefox
20140801 webrtc on-firefox20140801 webrtc on-firefox
20140801 webrtc on-firefox
 
20140702 webide
20140702 webide20140702 webide
20140702 webide
 

Dernier

Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 

Dernier (10)

Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 

Is EDINET 5 star?