Microsoft Open Tech Night - .NET Developer のための ML.NET - 導入編

.NET Developer のための
ML.NET - 導入編
畠山大有 | Daiyu Hatakeyama | @dahatake
Architect && Software Engineer && Applied Data Scientist (目指している)
Microsoft Japan

Built for .NET
developers
.NET のエコシステムの中で
モデル作成
モデル開発生産性の向
上 - AutoML
Visual Studio Model Builder と
CLI で、モデル作成を迅速に
TensorFlow や ONNX
連携
使い慣れた Deep Learning の
Framework との連携
dot.net/ml

ML.NET 1.4
Image Classification
データソースとして RDBMS のサポート
Visual Studio Model Builder の released
aka.ms/mlnet41

• Transfer Learning
• TensorFlow と ONNX のモデルをサポート

https://docs.microsoft.com/ja-jp/dotnet/machine-learning/

二項分類多クラス分類回帰クラスタリング異常検出ランキングリコメンデーション
AveragedPerceptronTrai
ner
LightGbmMulticlassTrain
er
LbfgsPoissonRegressionT
rainer
KMeansTrainer RandomizedPcaTrainer LightGbmRankingTrainer MatrixFactorizationTrain
er
SdcaLogisticRegressionBi
naryTrainer
SdcaMaximumEntropyM
ulticlassTrainer
LightGbmRegressionTrai
ner
FastTreeRankingTrainer
SdcaNonCalibratedBinar
yTrainer
SdcaNonCalibratedMulti
classTrainer
SdcaRegressionTrainer
SymbolicSgdLogisticRegr
essionBinaryTrainer
LbfgsMaximumEntropyM
ulticlassTrainer
OlsTrainer
LbfgsLogisticRegressionB
inaryTrainer
NaiveBayesMulticlassTrai
ner
OnlineGradientDescentTr
ainer
LightGbmBinaryTrainer OneVersusAllTrainer FastTreeRegressionTrain
er
FastTreeBinaryTrainer PairwiseCouplingTrainer FastTreeTweedieTrainer
FastForestBinaryTrainer FastForestRegressionTrai
ner
GamBinaryTrainer GamRegressionTrainer
FieldAwareFactorization
MachineTrainer
PriorTrainer
LinearSvmTrainer
https://docs.microsoft.com/ja-jp/dotnet/machine-learning/resources/tasks
https://docs.microsoft.com/ja-jp/dotnet/machine-learning/how-to-choose-an-ml-net-algorithm

ctx.BinaryClassification.Trainers.
• ローカルで実行
• タスク
• 二項分類
• 多クラス分類
• 回帰
• 前処理
• 有用な情報が無い特徴(説明変数)の削除
• 欠損、全て同じ、カーディナリティが低い
• 欠損値の表示と補完
• 追加の特徴(説明変数)の生成
• 例: One-hot encoding やOne-hot hash encoding
• 変換とエンコード
• 終了処理
• 一定時間
• キャンセルトークン
Automated Machine Learning (AutoML)
https://docs.microsoft.com/ja-jp/dotnet/machine-learning/how-to-guides/how-to-use-the-automl-api

ランドマークパイプラインの数を固定
(例: 20)
タスクの種類 |プライマリメトリック
アルゴリズム利用の許可または拒否
データセットのサイズとスパーシティ。
サイズ > ~50k 行の場合、KNN/SVM 自動ブラッ
クリストに登録されるようないくつかのアルゴリ
ズムを自動検知
サブサンプリング: 異なるサンプルのデータを使
用した同じ
パイプライントレーニング (3%、5%、10%、
20%)
コスト予測: イテレーションタイムアウト内に完
了する可能性が高いパイプラインのみを含める
前回のイテレーションの
プライマリメトリックスコアに基づい
て
リコメンドされるパイプライン処理
シーケンシャルまたは並列実行(リモート)に応じ
て、
次のパイプラインに 1または"n“
(ユーザー指定の「同時実行」入力)を返す
新しいデータセットとアルゴリズムで
定期的に再トレーニング
現在のマトリックス: ~1000 データセット x 数百
万のパイプライン X #primary メトリック
ユーザーデータを内部リコメンデーションモデル
に使用しない:メタデータのみを使用 (完全に難読
化)

ML.NET Model Builder
(Visual Studio)
シンプルな UI ツール
AutoML
トレーニングと推論のコードを生成

http://dot.net/ml
http://aka.ms/mlnetsamples
http://aka.ms/mlnetdocs
http://aka.ms/mlnet

Microsoft Open Tech Night - .NET Developer のための ML.NET - 導入編

Recommandé

Recommandé

Contenu connexe

Similaire à Microsoft Open Tech Night - .NET Developer のための ML.NET - 導入編

Similaire à Microsoft Open Tech Night - .NET Developer のための ML.NET - 導入編 (20)

Plus de Daiyu Hatakeyama

Plus de Daiyu Hatakeyama (20)

Dernier

Dernier (10)

Microsoft Open Tech Night - .NET Developer のための ML.NET - 導入編

Notes de l'éditeur