Contenu connexe
Similaire à 初心者歓迎 機械学習Chalk Talk (de:codeリバイバル) in Osaka - (20)
Plus de Daiyu Hatakeyama (20)
初心者歓迎 機械学習Chalk Talk (de:codeリバイバル) in Osaka -
- 2. Recent trends in Machine Learning
Olga Liakhovich
Senior Data & Applied Scientist
Microsoft
AI09
- 8. Spark
GPU インスタンス
コンテナー サービス
FPGA
Azure Machine
Learning Workbench /
AI Tools for VS
SQL Server
Machine Learning Server
On Premise
Edge
Azure IoT Edge
FPGA
実験および
モデル管理
Azure
柔軟なトレーニングとデプロイの選択肢
推論
デプロイメントモデル構築・学習
- 13. The Data Science Project Formula
Question + Data + Analysis = Answer
…につながる意思決定/アクション
答えを知った後で、何をするのか?
- 14. Question
• 特定可能
• 測定可能
• 次にアクションが取れる
• ベースライン
ビジネスのQuestionと、データサイエンスのQuestion:
製品が、壊れないようにするためには、いつ保守サービスします
か?
製品が、特定の時間に故障する確率は何ですか?
- 23. プログラミング と 機械学習
Program = Algorithm
人が書く
タスクの仕様の定義
アルゴリズムは固定
アルゴリズムは容易に説明できる
ソフトウェアが書く
目的: 汎化
アルゴリズムはデータに依存
アルゴリズムは時間とともに変わる
- 24. プログラミング と 機械学習
Program = Algorithm
人が書く
タスクの仕様の定義
アルゴリズムは固定
アルゴリズムは容易に説明できる
ソフトウェアが書く
目的: 汎化
アルゴリズムはデータに依存
アルゴリズムは時間とともに変わる
実世界の全てを想定して、
プログラミングするのは、難しい…
- 42. 分類モデルの評価 = Confusion Matrix
①True Positive(真陽性) : 100%に近いほど良好
⇒A/(A+C)
②False Positive(偽陽性) : 0%に近いほど良好
⇒B/(B+D)
③True Negative : 100%に近いほど良好
⇒D/(B+D)
④False Negative : 0%に近いほど良好
⇒C/(C+D)
⑤Accuracy(正解率) : 100%に近いほど良好
⇒「○」「×」を正しく予測できた割合
⇒(A+D)/(A+B+C+D) : 100%に近いほど良好
⑥Precision(適合率) : 100%に近いほど良好
⇒A/(A+B)
⑦Recall(再現率) : 100%に近いほど良好
⇒①に同じ
⑧F1 Score :1.0に近いほど良好
⇒⑥、⑦の複合指標
⇒2×(⑥×⑦)/(⑥+⑦)
検証用データ 予測で得たクラス
○ ×
正解の
クラス
○ A件 C件
× B件 D件
正解が「○」
のデータ
推測で「○」と
されたデータ
A件C件 B件
D件
予測結果例 主な評価指標
- 43. Confusion Matrix for カルガモ
カルガモ が写っているの
に、
モデルは推定できなかっ
た
▶モデルの見逃し
あり[実
際]
なし[実
際]
あり[予
測]
XX XX
なし[予
測]
XX XX
- 44. Confusion Matrix for カルガモ
あり[実
際]
なし[実
際]
あり[予
測]
XX XX
なし[予
測]
XX XX
カルガモ でないもの
に、
カルガモ と推定
▶モデルの過検知?