1. Microsoft AI
- 道具としての AI を理解するために -
畠山 大有 | Daiyu Hatakeyama | dahatake
Architect && Software Engineer && Applied Data Scientist (目指している)
Microsoft Japan
13. United States
United States
Canada
Mexico
Venezuela
Colombia
Peru
Bolivia
Brazil
Argentina
Atlanta Ocean
Algeria
Mali
Niger
Nigeria
Chad
Libya Egypt
Sudan
Ethiopia
Dr Congo
Angola
Zambia
Nambia
South
Africa
Greenland
Svalbard
Sweden
Norway
United
Kingdom
France
Poland
Ukraine
Turkey
Saudi
Arabia
Iran
Kazakistan
India
Russia
China
Myanmar
(Burma)
Indian Ocean
Indonesia
Australia
Pacific Ocean
Pacific Ocean
Data centerOwned capacity
Future capacity
Leased capacity
Edge site
DCs and network sites not exhaustive
14. 50% 60%
100%
1 2 3
Microsoft Clean and Renewable Energy Targets
Series2 Series1
18. Cognitive Services 概要
視覚
この画像・動画
には何が写って
いる?
Computer Vision (画像認識)
Custom Vision
(独自の画像を追加学習)
Video Indexer
(動画話者認識、字幕生成・検索)
会話
一番近い
オフィスまでの
道順を教えて
Speech service
(音声をテキストに変換/
テキストを音声に変換/翻訳)
Custom Speech/Custom
Translator (独自の単語・名称を
カスタム学習)
音声をテキストに変換
テキストを音声に変換
ユーザーの意図を抽出
今日のお客様と
の打ち合わせの
録音を再生して
Language Understanding
(自然言語処理)
再生中
2018/10/09 お客様打ち合わせ
Intent: PlayCall
お客様用会議室を
予約したい
QnA Maker (既存 FAQ を
読み込んで Q&A Bot を作成)
検索
不正利用防止
を検索して
Cognitive Search / Azure Search
(文書や画像を自然言語検索)
以下が見つかりました:
It also investigates the top three expected
Fraud Detection and Prevention programs, in
terms of demand in key markets...
First, let’s point out that there is not one
absolute answer—there are “pros” and “cons”
to each. Those who favor in-house…
Michael heads fraud prevention tool. Online
and mobile shopping are expected to
continue growing apace…
ユーザーの意図を抽出
言語
19. 1. 課題の特定
2. データの取得と加工
3. モデルの設計
4. モデルの作
成
5. モデルの
テストと評価 a. 初期化
b. データセットからミニバッチ
データ取得
c. 損失(差分)を計算d. 最適化: 損失(差分)の最小
化
e. 重みづけの更新
y =Wx + b
loss = |desired – actual outcome|δ
6. 展開と推論
a. ログ収取
20. ドメイン特化の トレーニング 済みモデル
ソリューションへ迅に組み込む
Azure
Databricks
Machine
Learning VMs
Popular framework
拡張性の高い Deep Learning ソリューションの開発
TensorFlowPyTorch ONNX
Azure Machine
Learning
LanguageSpeech
…
SearchVision
生産性をあげる サービス
データサイエンティスト と エンジニアのチーム開発のコラボレーション
強力なクラウド インフラ
Deep Learning の処理を加速させる
Scikit-Learn
使い慣れた データサイエンティスト のための ツール
独自モデル開発を迅速かつシンプルに
CPU GPU FPGA
From the Intelligent Cloud to the Intelligent Edge
Azure Notebooks JupyterVisual Studio Code Command line
26. Mileage
Condition
Car brand
Year of make
Regulations
…
Parameter 1
Parameter 2
Parameter 3
Parameter 4
…
Gradient Boosted
Nearest Neighbors
SVM
Bayesian Regression
LGBM
…
Mileage Gradient Boosted Criterion
Loss
Min Samples Split
Min Samples Leaf
Others Model
Which algorithm? Which parameters?Which features?
Car brand
Year of make
試行錯誤
27. Criterion
Loss
Min Samples Split
Min Samples Leaf
Others
N Neighbors
Weights
Metric
P
Others
Which algorithm? Which parameters?Which features?
Mileage
Condition
Car brand
Year of make
Regulations
…
Gradient Boosted
Nearest Neighbors
SVM
Bayesian Regression
LGBM
…
Nearest Neighbors
Model
繰り返し
Gradient BoostedMileage
Car brand
Year of make
Car brand
Year of make
Condition
28. Mileage
Condition
Car brand
Year of make
Regulations
…
Gradient Boosted
Nearest Neighbors
SVM
Bayesian Regression
LGBM
…
Gradient Boosted
SVM
Bayesian Regression
LGBM
Nearest Neighbors
Which algorithm? Which parameters?Which features?
繰り返し
Regulations
Condition
Mileage
Car brand
Year of make
36. 定義:
Big data is a term for data sets that are so large or complex that traditional data
processing application software is inadequate to deal with them.
ビッグデータとは、従来のデータ処理アプリケーションソフトウェアが扱うには不十分
な、
非常に複雑なデータセットの用語です。
課題:
Big data challenges include capturing data, data storage, data analysis,
search, sharing, transfer, visualization, querying, updating and information privacy.
ビッグデータの課題として、データのキャプチャ、データストレージ、データ分析、検
索、共有、転送、
ビジュアライゼーション、クエリ、更新、情報のプライバシーが含まれます。https://en.wikipedia.org/wiki/Big_data
37. ServeStore Prep and trainIngest
Batch data
Streaming data
Azure Kubernetes
service
Power BI
Azure analysis
services
Azure SQL data
warehouse
Cosmos DB, SQL DB
Azure Data Lake Storage
Azure Data Factory
Azure Event
Hubs
Azure Databricks Azure Machine
Learning service
Apps
Model Serving
Ad-hoc Analysis
Operational
Databases