SlideShare a Scribd company logo
1 of 9
新世代インテリジェントシティ
フォーラム
~パネル討論資料~
「ビッグデータに関する研究動向」
2014年9月8日@慶應義塾大学SFC
文教大学情報学部情報システム学科 専任講師
阿部 秀尚
hidenao@shonan.bunkyo.ac.jp
2014/9/8 新世代インテリジェントシティフォーラム@SFC 1
KDD2013 word cloud
2014/9/8 新世代インテリジェントシティフォーラム@SFC 2
http://www.kdnuggets.com/2013/08/mining-a-data-mining-conference-analytics-on-kdd-2013-conference.html
データマイニングに関する国際会議を
中心に注目されているキーワード
ソーシャルメディア
◦ TwitterやFacebook,Flickr,YouTubeをはじめとするソーシャルメ
ディア
◦ テキスト,画像,映像により市民から発信される情報
◦ 市民による情報集積と活用の実現(Civic Tech運動などに関連)
クラウド(CloudとCrowd双方)
◦ Cloud→ネット空間/処理能力の拡張
◦ Crowd→人々の活動や思考のネット空間への取り込み
◦ IoT(デバイス単位でのネット接続可能化)によるデータ収集の加速
プライバシー保護
◦ 匿名性×多様性による特定困難化
◦ 多様性の脆弱性の例:
9月5日18:50 文教大学発のバスに乗車したSuica利用者は?→たった1人
◦ プライバシーを保護したデータ分析手法の開発
2014/9/8 新世代インテリジェントシティフォーラム@SFC 3
ビッグデータとオープンデータ
2014/9/8 新世代インテリジェントシティフォーラム@SFC 4
オープンデータ
開かれた政府
データには
基づかない
市民協働事業
政府機関,
自治体など
から公開される
公共データ
ビジネスレポートや
そのほかのビジネスによって
生み出されたデータ
巨大な
公共データ
(気象,交通,
各種統計,
健康保健
など)
ビッグデータ
公開されず,
マーケティング,
ビジネス分析,
情報機関で
扱われるデータ
科学研究
やソーシャル
メディア,
非政府組織からの
巨大データ
Gurinのブログ記事より
(http://www.opendatanow.com/2013/11/new-big-data-vs-open-data-mapping-it-out/)
ビジネス/人材育成の注目点
→ビッグデータとオープンデータを
有効に結び付けた「価値」の創出
ビッグデータ利活用人材の育成
国内事例
◦ 経緯:情報洪水→情報爆発(情報大航海)
→ビッグデータ
◦ 文部科学省事業「ビッグデータ利活用によるイノ
ベーション人材育成ネットワークの形成」
◦ “データサイエンティスト育成ネットワークの形成”(統
計数理研究所 他)
→主に博士後期課程学生向け
◦ “スキルと実践を重視したビッグデータ・イノベーション
人材育成プログラム”(慶應義塾大学(理工学研究科・
SDM研究科)他)→修士学生向け
2014/9/8 新世代インテリジェントシティフォーラム@SFC 5
一データマイニング研究者が思う
ビッグデータ
Volume
◦ 数千万レコードや数GBというのはビッグデータではない
◦ 「ダウンロードできないほどの容量がビッグデータ」(情報学研究所
所長・喜連川先生)→納得
◦ 今まで容量を喰うので消去していたものを保存して,蓄積する
→「そこから何を得るのか」がより重要に!
Variety
◦ ソーシャルメディアの発達,デバイスの進化で飛躍的に向上
◦ データの多様さ,結果の解釈のために必要な背景知識を
十分に扱えているのか?←研究者としての問題意識
Velocity
◦ 計算機の速度向上,処理機構の発展で恩恵を受けている
◦ ストリームを扱うにしても時間枠の設定などはまだまだ困難では?
2014/9/8 新世代インテリジェントシティフォーラム@SFC 6
データ量と意味づけの関係
高次の意味がある情報
得られた生データ,
測定器の出力
低次の意味がある情報 個々のデータでの
パターン
(数値時系列,アイテム系列,
分類モデルなど)
目的推定
可能なモデル
データ量
数値データ,
ON/OFFなど意味に乏しいデータ
小
膨大
複合形式の
パターンマイニング
従来のパターン生成,
データマイニング
セマンティクス
時系列/系列パターンを利用した
属性構築とモデル生成
合
(例:オーダーエントリ-)
数値
(例:血液検査結果)
テキスト
→SNSでの発言内容など
アイテム集合
→行動履歴など
数値
→プローブデータなど
複合形式の時系列データ
複合的な時
系列/系列パ
ターンから成
る知識
目的行動
(教師ラベル)
テキストマ
イニング
テキストマ
イニング
時系列テキス
トマイニング
テキストマ
イニング
テキストマ
イニング
系列パターン
生成
テキストマ
イニング
テキストマ
イニング
数値時系列
パターン生成
目的の分類予
測モデル生成
系列パターン評価指標時点毎
のデータ
今後のデータ活用社会に向けて
2014/9/8 新世代インテリジェントシティフォーラム@SFC 9

More Related Content

Similar to フォーラムパネル討論 20140908 for_upload

知識が生まれる場の作り方
知識が生まれる場の作り方知識が生まれる場の作り方
知識が生まれる場の作り方
Masahiko Shoji
 
Arduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつArduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつ
Arduino3G
 
Arduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつArduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつ
Takayori Takamoto
 

Similar to フォーラムパネル討論 20140908 for_upload (20)

河野ゼミガイダンス資料2016
河野ゼミガイダンス資料2016河野ゼミガイダンス資料2016
河野ゼミガイダンス資料2016
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術
 
[Japan Tech summit 2017] MAI 001
[Japan Tech summit 2017]  MAI 001[Japan Tech summit 2017]  MAI 001
[Japan Tech summit 2017] MAI 001
 
知識が生まれる場の作り方
知識が生まれる場の作り方知識が生まれる場の作り方
知識が生まれる場の作り方
 
北海道地理空間フォーラムin札幌2018-07-18_第2分科会 「観光」講演1「データ駆動型社会における 観光ビックデータ利活用の可能性」深田秀実
北海道地理空間フォーラムin札幌2018-07-18_第2分科会 「観光」講演1「データ駆動型社会における 観光ビックデータ利活用の可能性」深田秀実北海道地理空間フォーラムin札幌2018-07-18_第2分科会 「観光」講演1「データ駆動型社会における 観光ビックデータ利活用の可能性」深田秀実
北海道地理空間フォーラムin札幌2018-07-18_第2分科会 「観光」講演1「データ駆動型社会における 観光ビックデータ利活用の可能性」深田秀実
 
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
 
サービス化に向けて進化する公共交通と沖縄のポテンシャル
サービス化に向けて進化する公共交通と沖縄のポテンシャルサービス化に向けて進化する公共交通と沖縄のポテンシャル
サービス化に向けて進化する公共交通と沖縄のポテンシャル
 
【16-D-1】UI のこれまでの10年とこれから
【16-D-1】UI のこれまでの10年とこれから【16-D-1】UI のこれまでの10年とこれから
【16-D-1】UI のこれまでの10年とこれから
 
110728 Trust Framework - Akiko Orita
110728 Trust Framework - Akiko Orita110728 Trust Framework - Akiko Orita
110728 Trust Framework - Akiko Orita
 
2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料
 
ビックデータ時代におけるIct成長戦略 ―関西復権を目指して―の部分
ビックデータ時代におけるIct成長戦略 ―関西復権を目指して―の部分ビックデータ時代におけるIct成長戦略 ―関西復権を目指して―の部分
ビックデータ時代におけるIct成長戦略 ―関西復権を目指して―の部分
 
Arduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつArduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつ
 
Arduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつArduino用3gシールド発表セミナーごあいさつ
Arduino用3gシールド発表セミナーごあいさつ
 
オープンデータ観光アプリ開発を題材とした発展的多学年PBL
オープンデータ観光アプリ開発を題材とした発展的多学年PBL オープンデータ観光アプリ開発を題材とした発展的多学年PBL
オープンデータ観光アプリ開発を題材とした発展的多学年PBL
 
20200220 od policy da
20200220 od policy da20200220 od policy da
20200220 od policy da
 
ICDE 2014参加報告資料
ICDE 2014参加報告資料ICDE 2014参加報告資料
ICDE 2014参加報告資料
 
20140918 センサ・アクチュエータ・マイクロナノ/ウィーク2014 次世代センサ総合シンポジウム
20140918 センサ・アクチュエータ・マイクロナノ/ウィーク2014 次世代センサ総合シンポジウム20140918 センサ・アクチュエータ・マイクロナノ/ウィーク2014 次世代センサ総合シンポジウム
20140918 センサ・アクチュエータ・マイクロナノ/ウィーク2014 次世代センサ総合シンポジウム
 
徳島県での取り組み(中間報告)140930
徳島県での取り組み(中間報告)140930徳島県での取り組み(中間報告)140930
徳島県での取り組み(中間報告)140930
 
DPFJ2
DPFJ2DPFJ2
DPFJ2
 
青木和人「地域情報拠点としての公共図書館へ市民参加型オープンデータイベントが果たす意義」,第62回日本図書館情報学会研究大会
青木和人「地域情報拠点としての公共図書館へ市民参加型オープンデータイベントが果たす意義」,第62回日本図書館情報学会研究大会青木和人「地域情報拠点としての公共図書館へ市民参加型オープンデータイベントが果たす意義」,第62回日本図書館情報学会研究大会
青木和人「地域情報拠点としての公共図書館へ市民参加型オープンデータイベントが果たす意義」,第62回日本図書館情報学会研究大会
 

Recently uploaded

Recently uploaded (7)

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

フォーラムパネル討論 20140908 for_upload