SlideShare une entreprise Scribd logo
1  sur  17
Télécharger pour lire hors ligne
機械学習キャンバス ver. 0.1
2016-11-08
サイボウズラボ 西尾泰和
目的
「機械学習や人工知能で解決できないか」という相談を
しばしば受ける。特にエンジニアではない人に経営学の言葉で
説明する時に、手持ちの道具では不足を感じる。
「ビジネスモデル」という漠然としたものの設計をわかりやすく
するために「リーンキャンバス」というフレームワークが生まれ
たみたいに「機械学習・人工知能」に対してもキャンバスがあれ
ばいいのではないか?そこでver. 0.1を作ってみた。
リーンキャンバスの肝は「方法に固執するな」だと思うので、
こちらも方法は最後に考える仕組みにした。
2
機械学習キャンバス ver. 0.1
3
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
(2) Solution by hand:人手でそれを実現する方法
(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
スパムフィルタを世界で初めて設計する人の立場に立って
このキャンバスを埋めていきながら考えてみよう。
4
スパムフィルタ
5
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
6
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
7
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
8
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
9
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
「スパムである
/ない」の情報(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
10
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面 (5) Output:得
たい出力データ
「スパムである
/ない」の情報
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
「スパムであ
る」と判定され
たメールを自動
でInboxから別
のフォルダに移
動する
スパムフィルタ
11
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面 (5) Output:得
たい出力データ
「スパムである
/ない」の情報
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
怪しいキーワードが含まれているメールをスパムと判定。キー
ワードは人間が追加する。
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
「スパムであ
る」と判定され
たメールを自動
でInboxから別
のフォルダに移
動する
素朴アルゴリズム
怪しいキーワードが含まれているメールをスパムと判定。キー
ワードは人間が追加する。
実現可能性:簡単に実装できそう
計算コスト:各メールをキーワードの個数だけ全文検索
必要なデータ:「怪しいキーワードのリスト」
これどうやって準備する?→サブタスク発生!
12
サブタスク
顧客が「スパムフィルタの利用者」ではなく
「スパムフィルタの設計者」である自分に変わる。
それによって得られるデータも変わる。
達成したい目標もかわる
13
スパムフィルタのサブタスク
14
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムっぽい怪しいキーワードのリストが欲しい
(2) Solution by hand:人手でそれを実現する方法
メールの内容を見て、スパムによく出て来て普通のメールに出
てこない単語をリストアップする
(3) Input:使え
る入力データ
メールの文面と
それがスパムで
あるかどうか
(5) Output:得
たい出力データ
スパムっぽい怪
しい単語(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
自分のメールを
使う
(6) 出力データ
をどう顧客価値
に結びつけるか
単にリストを作
るだけ
機械的に作る方法
スパムメールと普通のメールをそれぞれ単語分割して
各単語の「スパムメール中の出現頻度」と
「普通のメール中の出現頻度」をカウント。
スパムメール中での出現頻度が普通の出現頻度より
大きいほど「スパムっぽい度」が高いと考えて
適当な閾値以上のものを選択。
実現可能性:できそう。
15
作者の誤算
ナイーブベイズでのスパムフィルタを作る話になる予定だったが
ナイーブベイズを使わないまま解決してしまった。
実際にこのスパムフィルタを作って実験してみると
• 「キーワードが含まれていたら問答無用でスパム」という処理
のために誤判定が多い
• キーワードリストの更新やパーソナライズが行われないので、
新しいパターンのスパムや、特定の人だけが受け取るスパムに
対処ができない。
という問題が起きるはず。
16
ルールの確率化
>「キーワードが含まれていたら問答無用でスパム」という処理
のために誤判定が多い
こういう「TrueかFalseかで判断しているルールの誤判定が起きて
しまう問題」を緩和するために、真偽値の代わりに確率値を使う
ことはよく行われている。
ナイーブベイズでのスパムフィルタも「スパムである/ない」の真
偽値の代わりに「スパムである確率が高い/低い」の確率値を使う
17
see: 「ルールベースから機械学習への道 公開用」
http://www.slideshare.net/nishio/ss-53221829

Contenu connexe

Tendances

ノンパラメトリックベイズを用いた逆強化学習
ノンパラメトリックベイズを用いた逆強化学習ノンパラメトリックベイズを用いた逆強化学習
ノンパラメトリックベイズを用いた逆強化学習
Shota Ishikawa
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
Miyoshi Yuya
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
Shuyo Nakatani
 

Tendances (20)

最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
最新リリース:Optuna V3の全て - 2022/12/10 Optuna Meetup #2
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
 
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
画像処理応用
画像処理応用画像処理応用
画像処理応用
 
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
 
ノンパラメトリックベイズを用いた逆強化学習
ノンパラメトリックベイズを用いた逆強化学習ノンパラメトリックベイズを用いた逆強化学習
ノンパラメトリックベイズを用いた逆強化学習
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
 
ブースティング入門
ブースティング入門ブースティング入門
ブースティング入門
 
Crfと素性テンプレート
Crfと素性テンプレートCrfと素性テンプレート
Crfと素性テンプレート
 
1 データとデータ分析
1 データとデータ分析1 データとデータ分析
1 データとデータ分析
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
 
物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発
 
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
 
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けてSSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 

Similaire à 機械学習キャンバス0.1

おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフトおばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
atmarkit
 
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
満徳 関
 

Similaire à 機械学習キャンバス0.1 (10)

機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
 
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
 
おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフトおばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
 
カスタマーサクセスとプロダクトUX_uxjam#30_20190722
カスタマーサクセスとプロダクトUX_uxjam#30_20190722カスタマーサクセスとプロダクトUX_uxjam#30_20190722
カスタマーサクセスとプロダクトUX_uxjam#30_20190722
 
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
 
WO!|vol.49|AI×コールセンター
WO!|vol.49|AI×コールセンターWO!|vol.49|AI×コールセンター
WO!|vol.49|AI×コールセンター
 
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
 
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
 
Shitsumonprezentation#1 20180108
Shitsumonprezentation#1 20180108Shitsumonprezentation#1 20180108
Shitsumonprezentation#1 20180108
 
「人工知能」との正しい付き合い方
「人工知能」との正しい付き合い方「人工知能」との正しい付き合い方
「人工知能」との正しい付き合い方
 

Plus de nishio

Plus de nishio (20)

量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング
 
夏プロ報告
夏プロ報告夏プロ報告
夏プロ報告
 
ITと経営
ITと経営ITと経営
ITと経営
 
部分観測モンテカルロ計画法を用いたガイスターAI
部分観測モンテカルロ計画法を用いたガイスターAI部分観測モンテカルロ計画法を用いたガイスターAI
部分観測モンテカルロ計画法を用いたガイスターAI
 
交渉力について
交渉力について交渉力について
交渉力について
 
If文から機械学習への道
If文から機械学習への道If文から機械学習への道
If文から機械学習への道
 
組織横断型研究室構想
組織横断型研究室構想組織横断型研究室構想
組織横断型研究室構想
 
2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義
 
強化学習その5
強化学習その5強化学習その5
強化学習その5
 
良いアイデアを出すための方法
良いアイデアを出すための方法良いアイデアを出すための方法
良いアイデアを出すための方法
 
強化学習その4
強化学習その4強化学習その4
強化学習その4
 
強化学習その3
強化学習その3強化学習その3
強化学習その3
 
強化学習その2
強化学習その2強化学習その2
強化学習その2
 
強化学習その1
強化学習その1強化学習その1
強化学習その1
 
線形?非線形?
線形?非線形?線形?非線形?
線形?非線形?
 
首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズム
 
Wifiで位置推定
Wifiで位置推定Wifiで位置推定
Wifiで位置推定
 
ESP8266EXで位置推定
ESP8266EXで位置推定ESP8266EXで位置推定
ESP8266EXで位置推定
 
Raspberry Piで Wifiルータを作る
Raspberry PiでWifiルータを作るRaspberry PiでWifiルータを作る
Raspberry Piで Wifiルータを作る
 

Dernier

Dernier (6)

生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
 

機械学習キャンバス0.1