Contenu connexe
Similaire à 機械学習技術の紹介 (20)
Plus de Takahiro Kubo (20)
機械学習技術の紹介
- 1. Copyright © 2014 TIS Inc. All rights reserved.
機械学習技術の紹介
2015年4月13日
TIS株式会社
コーポレート本部 戦略技術センター
久保 隆宏
- 2. Copyright © 2014 TIS Inc. All rights reserved.
アジェンダ
1. 機械学習とは
2. 機械学習が求められる背景
3. 機械学習のメリット・デメリット
4. 機械学習を利用した事例
5. 機械学習を使うには
6. 参考資料
2
- 4. Copyright © 2014 TIS Inc. All rights reserved.
機械学習とは(1/3)
4
データを基にシステムに予測を行わせるための技術。
データ 予測
値の予測
気温・株価・売上
etc
分類の予測
画像/音声認識
異常検知etc
A
B
C
・人が逐一ルールを定義しなくてもよい。つまり、今まで定式化ができな
かった人が感覚や経験で行っていたような作業を任せられる可能性がある。
・予測する値は、気温などのような連続値と、カテゴリのような離散値の2
種類に大きく分けられる。
- 5. Copyright © 2014 TIS Inc. All rights reserved.
機械学習とは(2/3)
(似ているユーザーの評価値から商品
に対する評価値を予測し、高い順に
表示)
Amazon(レコメンド) Gmail(迷惑メールフィルタ)
Facebook(顔認識)
値の予測 分類の予測
音声・画像・ラベル付け
など、全体としては分類
に使われることが多い
- 6. Copyright © 2014 TIS Inc. All rights reserved.
機械学習とは(3/3)
機械学習の特性としては、以下のような点が挙げられる。
・定式化できない条件への対応
条件があいまい・感覚的で数値やルールで表現できない条件に対応できる
・素早く安定的な判断
システムで処理するため判断が素早く、何回行っても判断が偏ったりしない
・柔軟性
データを与えることで、その振る舞いを変えることができる。
- 7. Copyright © 2014 TIS Inc. All rights reserved.
機械学習とは
7
「機械」を「学習」させるとは?
データ 学習
・「機械」は実態としては数理・統計モデル
・「学習」は、実際のデータとモデルによる予測値の間の誤差が最小になる
よう、パラメーターを調整する作業。
このような、答えが与えられていてそれとの誤差を最小化することで学習す
る方法を教師有り学習と呼ぶ。
逆に、データのみを与えてその特徴(構造)を学習させる教師無し学習という
手法もある(クラスタリングなどがこれに該当する)。
機械:予測式・分布 学習:誤差の最小化
補足資料
- 8. Copyright © 2014 TIS Inc. All rights reserved.
機械学習とは
教師有り学習 教師無し学習
データ 答え
学習
予測
データ
学習
予測
白のボックスの位置で分けられそう、とい
うデータから見える構造を学習する
補足資料
- 10. Copyright © 2014 TIS Inc. All rights reserved.
機械学習が求められる背景(1/2)
10
売上の向上 コストの削減
収益の向上
根本的な企業目標
システム投資・効果
コスト削減はやり
つくされている
=投資対効果は出に
くくなっている
- 11. Copyright © 2014 TIS Inc. All rights reserved.
機械学習が求められる背景(2/2)
今後(今)求められる提案は、以下の何れか。
・よりドラスティックなコスト削減が期待できる提案
・売上の向上、付加価値の創出につながるような提案
これらは、プロセスのどこかに人が介在せざるを得ないシーンがある(データを
見て判断したりなど)ことが多い。
⇒システムに人のような判断をさせる必要がある。
11
企業が求めているのは、もはや単純なシステム化では解決できなくなった課
題の解決になってきている。
これにITで対応するには、人間的な仕事をシステムにさせる必要がある。
そのための手法の一つが「機械学習」である。
- 13. Copyright © 2014 TIS Inc. All rights reserved.
機械学習のメリット・デメリット(1/2)
13
「自動化」によるコスト削減と、「高精度な予測」による効率化
高精度な予測による効率化
良く学習された学習機は人間には不可能な速度・精度での予測を可能にす
る。これをマーケティングやサービスに活用することで、「最小限の労力
で最大限の効果」を上げることができる。
自動化によるコスト削減
機械学習は今まで人手に頼らざるを得なかった部分、つまり「定式化・
ルール化できない」部分をデータから学習する。
これにより、さらなる自動化とそれによるコスト削減が可能。
また、機械学習による予測は今までにないサービスや業務を可能にする可
能性があり(Amazonの”注文する前の発送”など)、新しいビジネスにもつな
がりうる。
コスト削減
売上の向上
新サービス創出
- 14. Copyright © 2014 TIS Inc. All rights reserved.
機械学習のメリット・デメリット(2/2)
費用対効果の測りにくさと、判断のブラックボックス化
費用対効果の測りにくさ
「よく学習」させるにはよく整備されたある程度のボリュームのデータが
必要になる。しかし、それを使って学習させても精度が出るかどうかは
やってみなければわからない。
機械学習を行うにはデータの収集を先行して行う必要があるが、それで役
立つ結果が出るかどうかは未知数なため、費用対効果が図りにくい。
判断のブラックボックス化
機械学習を使うということは、判断(予測)を機械にゆだねるということに
なる。この機械の中(数理・統計的なモデル)は、単純なモデルを除き人間
にはどのパラメーターが何の判断に影響しているかわからないため、精度
が悪化した場合に何が原因か突き止めることが困難。
機械学習はまだ導入が進んでいる段階であり、その運用方法(障害時のリカ
バリ・開発~本番反映までの開発プロセスなど)はまだ明確にベストプラク
ティスと言えるものがない。
- 16. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した(していると思われる)事例
16
売上の向上
Bill Guard
オンライン決済の不正利用
を検知
ダイキン工業
故障の予知によるサポート
サービス
東京海上日勤火災保険
顧客属性(攻め・守り)の自
動判定
Googleデータセンター
消費電力削減
日本郵船
エンジン制御による燃料費
削減
クックパッド
レシピデータの提供・分析
サービス
千葉県
データを活用したマーケッ
ト創出
コスト削減 新サービス創出
竹中工務店
設備管理者のノウハウを学
習して最適化を実現
KDDI/コロブラ
位置情報データの分析・レ
ポーティングサービス
- 17. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –売上の向上-
17
クレジットカードなどの不正利用を検
知するサービス。
サービスに対するユーザーの安心感が
付加価値となる。
⇒人間では行いきれないチェックを自
動化することで、新しい価値を生み出
した。
オンライン決済の不正利用を検知(Bill Guard)
- 18. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –売上の向上-
18
空調システムをリモート監視し、ログ
などから故障を予知。
⇒いわゆる「気の利く営業マン」の判
断の一部をシステム化したイメージ。
熟練度に関係なく、ある程度高いサー
ビスを提供できるようになるのもメ
リット。
エアネットⅡサービスシステム(ダイキン工業)
- 19. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –売上の向上-
19
⇒人間が判断を下していた切り口(こ
の例で言えば、「攻め」「守り」、他
には「買い時」「売り時」な
ど・・・)の判断を自動化した例。
判断が個々に依らないことで、指標の
統一基準化ができる。
東京海上日勤火災保険
「かんたんターゲット」と呼ぶ機能で、営業担当者が「攻め」と「守り」で
簡単に顧客データを絞り込めるようになっている。
例えば、攻めであれば、ある保険契約は交わしたが、他の種目を契約してい
ない顧客が1クリックで絞り込めるようになっている。守りであれば、満期
が近い顧客や、期間内に事故履歴があり慎重な対応が必要な顧客などのデー
タを絞り込むことができる。
・・・
- 20. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –コスト削減-
20
人間が把握しきれない(あるいは属人的
になっている高度な業務)に機械学習を
導入することで、効率化を実現。
⇒高度なスキルを持つスーパーマンで
ないと効率化が難しいと考えられてい
る領域で、高い効果を出す可能性があ
る。
- 21. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –コスト削減-
21
根本的にはデータセンターと同じ事例。
これからのサプライチェーン領域の効
率化は、予測に基づく事前察知と、判
断の高度・自動化がキーポイントにな
る。
- 22. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –コスト削減-
22
根本的にはデータセンターと同じ事例。
設備管理者のノウハウを学習させるこ
とで、最適な管理を習得させる。
これにより、建物機能のさらなる高度
化や、技能継承・人材不足といった社
会的な課題に対応する
- 23. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –新サービス創出-
23
健康診断のデータを元に生活習慣病の
リスクを予測し、リスクに応じた健康
管理サービスを提供する(※サービス自
体はまだ検討段階)。
⇒健康管理のデータを利用し健康サー
ビス事業者の仕事が増えるようにして
いる(モデル的には広告収入モデル)。
公共機関での事例:けんこうコンシェル(千葉県)
- 24. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –新サービス創出-
24
『たべみる』は日本最大のレ
シピサイト「クックパッド」
の検索データを活用した、食
品製造業・流通業・小売業向
けのデータサービス。
自社サービスのデータを元にデータ・
分析サービスを提供。同様のサービス
はナビタイムなどでも見られる。
⇒データとその解析ノウハウをサービ
スとして外部に提供する。
- 25. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を利用した事例 –新サービス創出-
25
Location Trendsは、位置情
報から人の流れを分析し、観
光者の動きや商圏の把握のた
めの知見・示唆を提供する
サービス(KDDI/コロブラ)
位置情報データを持つKDDIと、その
分析技術を持つコロプラとが協業して
提供するサービス。
⇒分析技術があればデータを持ってい
る所と、データがあればその分析技術
を持つ所と協業できる可能性がある
- 27. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を使うには
27
導入のスピード
拡張性ライブラリ型
パッケージ型
サービス型
scikit-learn(Python)
MLlib (Java等)
mahout (Java)
Jubatus
Azure Machine Learning
Google Prediction API
Prediction I/O
プログラムに組み込むライ
ブラリ型以外にも、選択肢
がある
- 28. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を使うには
前提
導入のスピードが速いほどあらかじめ提供されている機能を使う形になるので、基本的には導
入スピードが速いほど拡張性は低くなる。
ライブラリ型:プログラムに組み込むライブラリ形式で提供されているもの
△:高い自由度でプログラムに組み込むことができる
▼:利用にあたっては専門的な知識が必要
パッケージ型:よく利用するアルゴリズムをサーバー等にまとめたもの
△:目的 (推薦・異常検知など)に応じまとまった形で機能が提供されており、利用しやすい
▼:パッケージが提供するAPI・機能の範囲でのみカスタマイズが可能。
サービス型:クラウド経由で提供するもの
△:クラウド上でサービスが提供されており、導入の敷居が低い。
▼:手軽に導入できる分、機能・データ量等に制限がある場合がある。課金体系にも注意。
28
- 29. Copyright © 2014 TIS Inc. All rights reserved.
機械学習を使うには
各カテゴリでのお勧めは以下
ビジネスで使用する場合、ライブラリ型は難しくクラウド方はカスタマイズの面で難
有なので、パッケージ型をお勧めする。
29
Jubatusscikit-learn
Pythonの機械学習ラ
イブラリ
機械学習アルゴリズム
が利用できるサーバー
Azure Machine Learning
Drag&Dropで処理が
構築できるサービス
今すぐ試してみた
いあなたに
ビジネスへの応用
を考えるあなたに
カスタマイズもし
たいあなたに
- 30. Copyright © 2014 TIS Inc. All rights reserved.
参考資料(1/2)
オープンデータビジネスモデル(4) BillGuard、警告から紛争解決へビジネスモデル
を最適化
『エアネットⅡサービスシステム』の提供を開始
Better data centers through machine learning
日本郵船が燃料費を300億円削減、気象条件に合わせ運航を最適化
日本マイクロソフトと竹中工務店が IoT を活用した次世代建物管理システムで連携
千葉市が取り組む 千葉市が取り組むビッグデータ/オープンデータ施策群
たべみる
[Location Trends]位置情報ビッグデータ分析サービス【提供:KDDI・共同運営:
コロプラ】
scikit-learn-notebook
Azure Machine Learning を利用したアプリケーション開発
30
- 31. Copyright © 2014 TIS Inc. All rights reserved.
参考資料(2/2)
Anomaly Detection 異常検知 ~機械学習の有望なアプリケーション~
【翻訳】日常にある機械学習の応用例
機械学習は苦しい
Google機械学習の技術的負債
31