SlideShare a Scribd company logo
1 of 5
Download to read offline
情報再利用推進PJ	
  
  ご紹介	
情報再利用、しましょうか	


  2011年7月30日 東京会場
現状の情報流通の問題点	
現状	
                  情報提供者(政府・企業など)の	
  
      CSV化の必要         Webサイト	
            ・情報がどこにあ
       性が分から                               るかわからない	
  
         ない	
            PDF	
            ・再利用できない	
                         など	




       情報提供者	
                             情報利用者	


          「IT技術を使って、こんなことがわかれば嬉しい」というアイデア	
  
           ↑ 実現のために「情報」(データ)が必要 ↑	
  
 •    情報がない場合もあるが、ある情報が使いにくいというケースも多い	
 •    使える情報を探すことに時間がかかるとHackも出来ない(ボランティアでは限界)	
 •    ※使いにくかった例:東京電力の電力使用量など
問題点解消のステップ	
                                                    ・再利用できる	
  
システム化	
                                                   ・みんなの役に立
               情報提供者(政府・企業など)のWebサイト	
  
 CSV化の必要性・                                          つHackができる	
 作り方が分かる	
  
 正しいかのチェッ                CSV	
  
    クも出来る	

                                   CSV公開チェッカ	
  
                                                     情報利用者	

    情報提供者	
                        DB化	
           ・情報のありかが
                                                      分かる	

3つの対応策	
•  (再利用可能な形式で公開するための)マニュアル整備	
 →ITに強くない担当者でも再利用可能な形式で情報公開できる	
•  (公開した情報の形式が適切か否かの)チェックツール作成	
•  チェックツールを利用した公開情報のデータベース化	
 →情報利用者が安心して再利用出来る、情報が見つけられる
情報流通プロセス・アプローチ	
情報流通のプロセス	




  オーナー	
          提供者	
          アプリ作る人	
             見る人	


 •  提供者・アプリ作る人(システムサイド)	
  
   –  情報提供者の手間を増やさず	
  
      アプリ作る人の手間を減らす仕組みの提供	
  
   –  必要な情報が探しやすく、アプリも作りやすく。	
  
 •  オーナー・見る人(促進)	
  
   –  情報提供者にも見る人にもメリットを持たせる	
  
   –  情報の可視化(グラフなど)、Hack	
  For	
  JapanのPJを事例に	
  

  情報再利用がしやすい環境を整える	
            情報再利用の有効性を知ってもらう
システムのイメージ	
Csv化を依頼	
                              次回ハッカソン計画	

                                          将来計画	


                  html	
      画像	
       PDF	
        twiFer	

   CSV	

     Csvチェッカー	
                      標準CSVに変換する	



                    標準CSV	

                                             json	



                                     アプリケーション	
  DBに保存	


                                     可視化を例示する

More Related Content

More from Takeshi Mikami

rdflintのvscode拡張の紹介とその実装方法
rdflintのvscode拡張の紹介とその実装方法rdflintのvscode拡張の紹介とその実装方法
rdflintのvscode拡張の紹介とその実装方法Takeshi Mikami
 
適切なクラスタ数を機械的に求める手法の紹介
適切なクラスタ数を機械的に求める手法の紹介適切なクラスタ数を機械的に求める手法の紹介
適切なクラスタ数を機械的に求める手法の紹介Takeshi Mikami
 
OAuth 2.0による認可の流れ
OAuth 2.0による認可の流れOAuth 2.0による認可の流れ
OAuth 2.0による認可の流れTakeshi Mikami
 
MapReduceによるConnected Components(連結成分)の見つけ方
MapReduceによるConnected Components(連結成分)の見つけ方MapReduceによるConnected Components(連結成分)の見つけ方
MapReduceによるConnected Components(連結成分)の見つけ方Takeshi Mikami
 
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)Takeshi Mikami
 
データサイエンスアイドル「小日向美穂」と考える「つながり」
データサイエンスアイドル「小日向美穂」と考える「つながり」データサイエンスアイドル「小日向美穂」と考える「つながり」
データサイエンスアイドル「小日向美穂」と考える「つながり」Takeshi Mikami
 
RDFのチェックツール「rdflint」と コミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」と コミュニティによるオープンデータの作成Takeshi Mikami
 
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウ
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウCircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウ
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウTakeshi Mikami
 
GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方Takeshi Mikami
 
HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題Takeshi Mikami
 
RDFチェックツール「rdflint」のご紹介
RDFチェックツール「rdflint」のご紹介RDFチェックツール「rdflint」のご紹介
RDFチェックツール「rdflint」のご紹介Takeshi Mikami
 
アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)Takeshi Mikami
 
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Takeshi Mikami
 
センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本Takeshi Mikami
 
Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Takeshi Mikami
 
Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Takeshi Mikami
 
IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介Takeshi Mikami
 
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介Takeshi Mikami
 
SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門Takeshi Mikami
 

More from Takeshi Mikami (20)

rdflintのvscode拡張の紹介とその実装方法
rdflintのvscode拡張の紹介とその実装方法rdflintのvscode拡張の紹介とその実装方法
rdflintのvscode拡張の紹介とその実装方法
 
適切なクラスタ数を機械的に求める手法の紹介
適切なクラスタ数を機械的に求める手法の紹介適切なクラスタ数を機械的に求める手法の紹介
適切なクラスタ数を機械的に求める手法の紹介
 
OAuth 2.0による認可の流れ
OAuth 2.0による認可の流れOAuth 2.0による認可の流れ
OAuth 2.0による認可の流れ
 
MapReduceによるConnected Components(連結成分)の見つけ方
MapReduceによるConnected Components(連結成分)の見つけ方MapReduceによるConnected Components(連結成分)の見つけ方
MapReduceによるConnected Components(連結成分)の見つけ方
 
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)
RDFチェックツール「rdflint」のご紹介 (LODチャレンジ2019受賞作品紹介 基盤技術部門優秀賞)
 
データサイエンスアイドル「小日向美穂」と考える「つながり」
データサイエンスアイドル「小日向美穂」と考える「つながり」データサイエンスアイドル「小日向美穂」と考える「つながり」
データサイエンスアイドル「小日向美穂」と考える「つながり」
 
RDFのチェックツール「rdflint」と コミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」と コミュニティによるオープンデータの作成
 
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウ
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウCircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウ
CircleCIを使ったSpringBoot/GAEアプリ開発の効率化ノウハウ
 
GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方
 
HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題
 
RDFチェックツール「rdflint」のご紹介
RDFチェックツール「rdflint」のご紹介RDFチェックツール「rdflint」のご紹介
RDFチェックツール「rdflint」のご紹介
 
アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)
 
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
 
SPARQL入門
SPARQL入門SPARQL入門
SPARQL入門
 
センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本
 
Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定
 
Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門
 
IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介
 
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
 
SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門
 

Hack for japan 情報再利用推進pjご紹介 (2011 07-30)

  • 1. 情報再利用推進PJ   ご紹介 情報再利用、しましょうか 2011年7月30日 東京会場
  • 2. 現状の情報流通の問題点 現状 情報提供者(政府・企業など)の   CSV化の必要 Webサイト   ・情報がどこにあ 性が分から るかわからない   ない PDF   ・再利用できない など 情報提供者 情報利用者 「IT技術を使って、こんなことがわかれば嬉しい」というアイデア   ↑ 実現のために「情報」(データ)が必要 ↑   •  情報がない場合もあるが、ある情報が使いにくいというケースも多い •  使える情報を探すことに時間がかかるとHackも出来ない(ボランティアでは限界) •  ※使いにくかった例:東京電力の電力使用量など
  • 3. 問題点解消のステップ ・再利用できる   システム化 ・みんなの役に立 情報提供者(政府・企業など)のWebサイト   CSV化の必要性・ つHackができる 作り方が分かる   正しいかのチェッ CSV   クも出来る CSV公開チェッカ   情報利用者 情報提供者 DB化 ・情報のありかが 分かる 3つの対応策 •  (再利用可能な形式で公開するための)マニュアル整備  →ITに強くない担当者でも再利用可能な形式で情報公開できる •  (公開した情報の形式が適切か否かの)チェックツール作成 •  チェックツールを利用した公開情報のデータベース化  →情報利用者が安心して再利用出来る、情報が見つけられる
  • 4. 情報流通プロセス・アプローチ 情報流通のプロセス オーナー 提供者 アプリ作る人 見る人 •  提供者・アプリ作る人(システムサイド)   –  情報提供者の手間を増やさず   アプリ作る人の手間を減らす仕組みの提供   –  必要な情報が探しやすく、アプリも作りやすく。   •  オーナー・見る人(促進)   –  情報提供者にも見る人にもメリットを持たせる   –  情報の可視化(グラフなど)、Hack  For  JapanのPJを事例に   情報再利用がしやすい環境を整える 情報再利用の有効性を知ってもらう
  • 5. システムのイメージ Csv化を依頼 次回ハッカソン計画 将来計画 html 画像 PDF twiFer CSV Csvチェッカー 標準CSVに変換する 標準CSV json アプリケーション DBに保存 可視化を例示する