SlideShare une entreprise Scribd logo
1  sur  95
Télécharger pour lire hors ligne
A I / M L の 専 門 家 が オ ス ス メ す る
データレイクとパイプラインの定石
2 0 2 2 . 1 0 . 0 7 ハ イ ブ リ ッ ド 開 催 来 栖 川 電 算 山 口 陽 平
JAWS DAYS 2022 - Satellites #jawsdays2022_b #jawsdays2022 #jawsdays #jawsug
アジェンダ
1. 自己紹介 & 会社紹介
2. データレイクとパイプラインの定石
3. 付録
2
自己紹介 & 会社紹介
名古屋の AI ベンチャー
3
山口陽平 何でも学び何でもやる人
4
有限会社来栖川電算 創業者・取締役・最高技術責任者
職務 全体 ビジョン・ビジネス・資金・設備・人員・制
度・文化・パートナーシップの計画・遂行
個別 企画,調査,研究,開発,運用,指導,教育,
広報,採用,…
略歴 2001 名古屋工業大学 知能情報システム 卒業
2003 名古屋工業大学 電気情報工学 修士課程 修了
有限会社来栖川電算 設立
IPA 未踏ソフトウェア創造事業 採択
2012 名古屋工業大学 情報工学 博士課程 退学
2013 Mashup Awards 9 優秀賞 受賞
仕事 = 趣味 何にでも面白みを見出す人
5
休日も論文読み・プログラミング・コミュニティ活動・講演・執筆
興味 ロボット,AI,UI,UX
専門 機械学習,信号処理,記号処理,プログラミング言
語,コンパイラ,データベース,ソフトウェアアー
キテクチャ,ソフトウェアプロセス
得意 分析,抽象化,高速化,省資源化,並列化,分散化
@melleo1978
来栖川電算
• 様々な領域の顧客とともに彼らが抱える課題を解決
– AI・ML を応用した認識技術・自動化技術の研究開発
– ソフトウェア・アノテーションの製造・販売
– 研究開発を加速する基盤サービスの提供
6
設立 2003 年 名古屋工業大学発ベンチャー企業 従業員 97 人
急成長中
7
AR付箋
書籍の中身を検索するアプリ
Cellars
ワインラベルで情報検索するアプリ
画像認識API
商品パッケージで情報検索するAPI
生活情報調査
道路沿いの視覚情報を収集し、活用
交通情報調査
道路沿いの視覚情報を収集し、活用
研究開発支援
タンゴチュウ
写真に写る単語を抽出するサービス
走行データ解析
周辺環境を認識し、様々な解析に活用
地図生成
オルソ画像から地物・交通規則を抽出
動作推定API
加速度センサで人の行動を推定
毎朝体操
腕の動きで体操採点するアプリ ヒーローの動きでゲームを制御
なりきり2.0
ー
シ
ョ
ン
認
識
研究開発支援 研究開発支援
AHAB
大量の実験と計算資源を効率的に管理
ANNOFAB
高品質なアノテーションを大量に生産可能
DNN compiler
DNNの推論を10~1000倍も効率化
GameControllerizer
プログラマブル・ゲームコントローラ
研究開発支援
類似検索 類似検索 類似検索 文字認識
物体認識 物体認識 物体認識 物体認識
モーション認識 モーション認識 モーション認識
物体認識
瞳孔位置推定
眼球運動を監視し、眠気の推定に活用
顧客中心のワンストップ体制
8
AI・ML に関わる全工程を扱うため、適した工程で課題解決可能
AI・ML アプリ
SI 基盤サービス
AI・ML 基盤サービス
データ モデル
アノテータ
デザイナ
研究者
開発者
顧客
全体
把握
最適
戦略
ハイレベルな人材
• 最先端の AI・ML 技術
– 文字認識,物体認識,行動認識,空間復元
• 限界性能を引き出す優れた実装技術
– 機械学習・コンパイラ・データベースなどのアルゴリズムやバ
イナリハックを駆使した高精度化・高速化・省資源化・並列
化・分散化
• 高品質なソフトウェアを実現する技術
– アーキテクチャ・プロセスへの深い理解に基づく設計と計画
9
未踏採択者,コンテスト受賞者,MVP 受賞者,OSS 貢献者,…
PyCon JP
JuliaTokai FP in Scala
Nagoya
Frontend
User Group
若手 Web
名古屋
名古屋
合同懇親会
TFUG Tokyo
社会貢献:コミュニティ活動
10
勉強会の主催,スタッフ・会場の提供,スポンサー・寄付,…
機械学習名古屋
勉強会&研究会
JAWS-UG
HEROES
LEAGUE
OthloHack NUPSC
機械学習 名古屋
• 勉強会 開催:隔月 対象:初心者(非技術者も含む)
– アルゴリズム紹介・事例紹介・ハンズオン
• 研究会 開催:毎月 対象:研究者,技術者
– 機械学習関連の論文紹介・記事紹介
– 来栖川電算の研究者だけでなく日本各地の大学院生も参加
11
https://machine-learning.connpass.com/
宣伝
データレイクと
パイプラインの定石
AI/ML の専門家がお勧めする
12
AI/ML 開発の真実
• AI/ML コードの周辺に取り扱うべきものが山ほどある
13
ソフトウェアエンジニアリングが下手だとスグに立ち行かなくなる
Sculley et al., “Hidden Technical Debt in Machine Learning Systems”, NIPS 2015
データレイクとその上での
データ処理を見てみよう
典型的な AI × IoT システムを題材に、まずは
14
典型的な AI × IoT システム
• エッジ側で発生するセンサデータをエッジ側 or クラウ
ド側 or 両方の AI で分析し、結果をユーザへ提示する。
15
センサデータをデータレイクへ保存して AI 開発に活用する。
センサデータ
or 特徴量 分析結果
データレイク
典型的なデータ処理
1. データ収集
– AI の学習・評価に用いるデータを調達し、格納する。
2. データ変換
– 後の工程に都合がよいようにデータを変換・生成する。
3. サンプリング
– データ変換やデータ分析の対象を定める。
4. データ分析
– データ変換やサンプリングの結果を用いて AI を学習・評価する。
16
データレイク内のデータ処理(分析以外)は頻繁には発生しない。
1. 典型的なデータ収集
• データ収集アプリによる収集
– 模擬環境で発生するセンサデータを保存する。望むものを収集
しやすいが、本番環境とは異なる質や分布になる場合がある。
• データ収集クエリによる収集
– 本番環境で発生するセンサデータのうちクエリで選別されたも
のだけを保存する。容量や数量の上限を設けることも多い。
– 運用時に発生するデータが手に入るが、望むものを収集できる
とは限らない。偏りも非常に大きい。
17
収集目的ごとにラベル付けしてデータレイクへ保存する。
2. 典型的なデータ変換
• 形式変換
– mp4 ⇒ m3u8:ストリーミングできるようにすることで、手作
業によるアノテーションの効率を高める。
– csv ⇒ parquet:列指向形式にすることで IO の効率を高める。
– partitioning:値域ごとのファイル分割により IO の効率を高める。
• アノテーション(自動 or 手作業)
– データから推測できる情報を属性として付与する。具体的には
データセットからアノテーションツール用のジョブを生成する。
18
後工程にとって都合がよいようにデータを変換・変換する。
3. 典型的なサンプリング
• データセット = キーの集合
– センサデータは、収集目的・収集単位・時刻・センサ種類など
をキーとして特定できるファイルに格納されている。キーやそ
のファイルのパスを要素とする集合を csv ファイルなどで表す。
データ変換やデータ分析の対象や範囲を定めるのに役立つ。
• サンプリング = キーの部分集合の抽出
– SQL などを用いてキーの集合から部分集合を抽出する。ランダ
ムに抽出したり、時刻や位置に関して等間隔に抽出したりする。
19
データ変換やデータ分析の対象を定める。
4. 典型的な分析
• AI の学習・評価
– データセットを順に走査しながら、同じキーが割り当てられた
データ(センサデータやアノテーションなど)を組み合わせて
教師を生成し、モデルへ入力するだけなので、データアクセス
の複雑さは(主)キーによるものだけである(複雑な IO が発生
することはない)。
– 分析結果の可視化やレポート化も同時に行うが、出力の粒度が
細かすぎない限り、IO が問題になることはない。
20
データ変換やサンプリングの結果を用いて AI を学習・評価する。
まとめると
• センサデータに対する AI 開発なら次でおおよそ OK
– データレイク
• S3
– パイプライン
• Amazon Athena
• AWS Batch on EC2 / Fargate
21
単純な SQL か、プログラミング言語による処理が扱えればいい。
Amazon Athena
S3 にあるファイルに SQL で問い合わせできる
22
Amazon Athena
S3 にあるファイルに SQL で問い合わせできる
• 様々なファイル形式・圧縮形式に対応
– CSV, TSV, JSON, ORC, Parquet ※Prestoのおかげ
• パーティショニング・列指向に対応
– 不要な行・列をスキャンせずに済む
• 頻繁に問い合わせしないなら安い
– 5 $/TB + S3 費用
• クエリのスキャン量に比例する
• 10MB 以下のクエリは 10MB 扱いになる
– ※機械学習のデータレイクに適している
23
使い方は簡単
S3 条のデータをインポートし、SQL で問い合わせるだけ
1. ワークグループの作成
2. データのインポート
3. データへの問い合わせ
4. テーブルのパーティション
5. データへの問い合わせ(パーティション
版)
24
1. ワークグループの作成
事前準備
25
1. ワークグループの一覧
上段の「Workgroup : ~」でいつでもこの画面に来れる
26
2. ワークグループの作成
ワークグループの名称とクエリの結果の格納場所を決める
27
3. ワークグループの切替
作成したワークグループを選択して切り替える
28
2. データのインポート
分析対象のデータが増えるたびにやること
29
1. データの準備
分析対象のデータの格納場所を確認する
30
2. テーブルの作成
分析対象のデータをテーブルとして取り込む
31
3. 名称と格納場所の指定
データの格納場所(フォルダ)を指定する
32
4. データ形式の指定
データのファイル形式(今回は TSV)を指定する
33
5. カラムの指定
データに含まれる順にカラムの名称と型を指定する
34
6. パーティションの指定
カラム値に応じてデータの格納先が決まる(今回はなし)
35
7. スキーマの確認
テーブルのスキーマはクエリ(DDL)として確認できる
36
3. データへの問い合わせ
分析対象のデータのインポートが終わったらやること
37
1. データへの問い合わせ
問い合わせ(今回はフルスキャン)を SQL で記述実行する
38
2. 問い合わせ結果の確認
問い合わせ結果はコンソールからすぐに確認できる
39
4. テーブルのパーティション
フルスキャンだとお金がかかりすぎると感じたときにやること
40
1. 変換先テーブルの作成
年月日でパーティションする変換先テーブルを作成する
41
raw_reports のスキーマを修正すると簡単
2. データの変換
変換問い合わせ(insert-select)を記述実行する
42
パーティションに使うカラムを生成する
3. 変換後データの確認
スキーマで指定した格納場所を確認する(272 個に分割)
43
5. データへの問い合わせ
(パーティション版)
パーティションを絞り込めるクエリであれば速く安くなる
44
1. データへの問い合わせ
パーティションに使ったカラムで絞り込む必要がある
45
パーティション(272 分割)と列指向
(Parquet 形式)の適用でスキャン量
が 1/100 になった。スキャン量が下
限を下回ったため費用は 1/10 だった。
2. 問い合わせ結果の確認
当然だが、パーティションする前と同じ結果になっている
46
まとめ
初心者はだまって Amazon Athena
• とりあえず S3 に入れておけばいい
– 頻繁に問い合わせしないデータはとありあえず
S3 に入れて、Athena で処理すればいい。
• 例:機械学習のデータレイク
• コスト(スキャン量)を抑えるには
– パーティショニングと列指向を活用する。
– 問い合わせのデバッグ中は LIMIT 句を付ける。
– ワークグループにスキャン量の上限を設定する。
• 何気ない問い合わせによる膨大なスキャンへの対策
47
AWS Batch
コンテナでパイプライン(ジョブ)を記述できるスケジューラ
48
AI 開発者の仕事
手数が重要になる
49
AI 開発者の仕事
仮説検証を回し、どうやればいいかを明らかにすること
• たくさんの実験の実施 ⇒ 良い結果
• 絡み合う実験の管理 ⇒ 信頼性
50
AI 開発にまつわる課題
量が多いだけで厄介になる
51
AI 研究者の悩み
たくさんの絡み合うデカい実験を扱えるツールがない!
• こんな実験が “めっちゃ” たくさんある
– 複数の工程からなる微妙に設定が異なる実験
– デカくて時間がかかる実験
• こんなことが ”よく” 起きる
– 手作業が挟まると取り違える。
– 後で確認(やり直し)したくなる。
– たまに死ぬので途中から再開したくなる。
• ⇒ 実験パイプラインのコード化が重要
52
計算環境の制約
いろいろな環境の GPU を必要な時に必要なだけ使いたい
• 各人が占有するやり方はしたくない
– 費用・電源が足りない。調達運用したくない。
– そもそも GPU 1 枚/人程度じゃ全然足りない。
• お客様が貸してくれる環境も活用したい
– 大規模なオンプレ環境を用意してくれる。
• よく不足するのでクラウドも活用したい
– 突発的に百枚単位でいることがある。
• ⇒ 計算環境の抽象化・共有が重要
53
AWS Batch
コンテナベースのパイプライン記述に最適
54
計算環境の抽象化
計算環境を替えても同じコードで OK ハードの隠蔽
55
WebAPI・CLI WebAPI・CLI WebAPI・CLI
実験パイプライン
・実験コードの Docker 化
・実験の依存関係のコード化
※二段階のコード化
スケジューリング
実験の自動化と計算環境の隔離 計算資源の割当
56
AHAB (実験スケジューラ)
来栖川電算の研究者が使う研究基盤
57
まとめ
AHAB は AI 研究にまつわる課題を解決
• 実験の自動化と計算環境の隔離 ※Docker
– 他の実験の計算環境・コード・データとの干
渉による不正計算や異常停止が起きない。
• 計算環境の抽象化 ※Web API,CLI,Docker
– 計算環境(自社・お客様・クラウドなど)が
変わっても同じコード・データが使える。
• 効率的な計算資源の割当と伸縮
– 個人で計算資源を占有せず、全員で共有
58
全体のまとめ
要するに S3 & Amazon Athena & AWS Batch on EC2
59
全体のまとめ
• センサデータに対する AI 開発なら次でおおよそ OK
– データレイク
• S3
– パイプライン
• Amazon Athena
• AWS Batch on EC2 / Fargate
60
S3 & Amazon Athena & AWS Batch on EC2
事例・製品・サービス
付録①
61
環境認識
物体・背景の位置・向き・姿勢・種類を高速・高精度に捉える
62
走行データの解析
周辺環境を認識し、様々な解析に活用
膨大な走行データから歩行者・車両・白線・標識など
を検出・追跡し、索引化&シミュレータ学習。必要に
応じて、CAN や Lidar なども活用し、高品質化。
63
ニアミス DB
商品企画と仕様策定に活用
センサフュージョン&マルチタスクな深層学習手法と
Human-in-the-Loop を活用して大量のドラレコデー
タからニアミス(事故予備群)シーンを効率的に収集。
64
予算の範囲内で優先度が高いシーンから順に人が最終判断を下す。
序盤:学習効率優先(多様性順・苦手順)⇒ 終盤:生産効率優先(ニアミスらしさ順)
シーン優先度付けアルゴリズム
ニアミスアノテーション作業
ドラレコデータ 優先度
ニアミスアノテーション結果
学習
参照 推論
参照 参照
生産
安全運転支援
高齢ドライバを対象に実証実験を実施
マルチタスク深層学習手法を用いて信号無視を高精度
に検出。検出結果から算出した運転評価を高齢ドライ
バへフィードバック。名古屋大学様との共同研究。
65
地図エディタ
地物・交通規則の整備を効率化
自動運転に使える高精度地図をオルソ画像から抽出す
る深層学習手法を開発。整備作業の半自動化に応用。
トヨタマップマスター様との応用事例。
66
交通情報調査
道路沿いの視覚情報を収集し、活用
首都圏を走行する大量の車両のドラレコを解析し、視
覚情報(天候,路面状態,レーン別交通量,危険シー
ン,…)を DB 化。顧客との研究事例。
67
生活情報調査
道路沿いの視覚情報を収集し、活用
アスクル株式会社様の営業車のドラレコを解析し、視
覚情報(ガソリン価格,駐車場満空,渋滞,事故,行
列,…)を DB 化。ヤフー様との共同研究。
68
空港で働くロボット
カート回収・荷物運搬 ※セントレアで実証実験
LiDAR 点群から求めた物体の3次元姿勢(位置・方
向)をカメラ映像のみから高精度に推定。新明工業
様・オンクラウズ様との共同研究。
69
人流解析
人の動線改善・ロボットの経路計画
カメラ・LiDARに写る人を検出・追跡・統計して人流
マップを生成。トヨタスタジアムで実証実験。名古屋
大学様・オンクラウズ様との共同研究。
70
文字認識
様々な書体・外乱に対応した
71
タンゴチュウ
写真に写る単語を抽出するサービス
情景画像(スマホで撮影した写真など)に写る単語を
抽出。様々な書体・配置・劣悪な環境(歪み・隠れ・
擦れ・照明など)での利用を想定。
72
情報検索
膨大なデータの中から関連データを高速・高精度に抽出できる
73
画像認識 API
商品パッケージで情報検索する API
商品パッケージが写った画像を送信するだけで、膨大
な DB から瞬時に種類を特定。クロールした画像から
直接構築した DB を利用。
74
Cellars
ワインラベルで情報検索するアプリ
ワインラベルにスマホをかざすだけで、18 万件から
瞬時に種類を特定。国内外のコンテストで入賞。
Cellars 様による弊社技術の応用事例。
75
AR 付箋
書籍の中身を検索するアプリ
書籍を開いてスマホをかざすだけで、膨大な DB から
瞬時にページを特定し、貼られている付箋を表示。お
客様による弊社技術の応用事例。
76
モーション認識
身体の動き・姿勢を高速・高精度に捉える
77
眼球運動推定1
眼球運動を監視し、眠気の推定に活用
スマートグラスで撮影した映像から瞳孔位置・閉眼状
態を高精度に推定。個人差・外乱に頑健。エッジで
60 fps。知の拠点あいち重点研究プロジェクト。
78
眼球運動推定2
眼球運動を監視し、眠気の推定に活用
スマートグラスで撮影した映像から虹彩位置・瞳孔位
置・瞼間距離・開眼率を高精度に推定。個人差・外乱
に頑健。名古屋大学様との共同研究。
79
DZ Auth 顔追跡
隠れ・フレームアウトに対して頑健
スマートフォン上でリアルタイム動作&低消費電力。
バックグラウンド多要素認証のユーザ体験と消費電力
を改善。AnchorZ 様との共同研究。
80
生体情報推定
特別なセンサなしに生体情報を推定
スマホやウォッチに搭載されている標準的なセンサの
みを用いて生体情報を推定(センサエミュレーショ
ン)。NTT ドコモ様との共同研究。
81
動作推定 API
加速度センサで人の行動を推定
スマホやウォッチの動きから静止・歩行・走行・食
事・睡眠などを推定。同じ仕組みで撮影時の手振れ検
出も可能。NTT ドコモ様との共同研究。
82
毎朝体操
腕の動きで体操採点するアプリ
100 ヶ国 20 万人超のセンサデータを日々学習するこ
とで体操採点の正確さを自動改善。JFE スチール様,
トヨタシステムズ様,パナホーム様でご活用。
83
なりきり 2.0
ヒーローの動きでゲームを制御
腕や脚に装着したセンサで体の動きを捉え、家庭用
ゲーム機のコマンドを生成。格闘ゲームが遊べるほど
の速さと正確さをスマホ上で実現。
84
研究開発支援
日々使い改良される道具による
85
Annofab
高品質な教師データを大量に生産可能
品質と生産性のトレードオフ、誤り漏れの削減、きめ
細かく柔軟な仕様・課題・進捗の管理。AIの専門家の
“技”が詰まったAll-in-Oneアノテーションツール。
86
3次元アノテーション対応!
AHAB
大量の実験と計算資源を効率的に管理
計算資源をハイブリッドクラウド化する実験スケ
ジューラ。実験のスクリプト化、信頼性や再現性の向
上、資源割り当ての効率化などを促進。
87
DNN compiler
DNNの推論を 10 ~ 1000 倍も高速化
重みや活性の量子化・スパース化、計算の共有などの
様々な手法で DNN を近似し、高速化・省資源化され
た実行形式(Linux・Android・iOS)へ変換。
88
X-nizer
プライバシー情報匿名化サービス
ドライブレコーダや定点カメラなどの映像からプライ
バシー情報(顔,ナンバープレート,…)を除去。最
終検査を人力で実施するオプションあり。
89
X-nizer
X
GameControllerizer
プログラマブル・ゲームコントローラ
ゲーム機・PC・スマホなどに接続するだけでゲーム
操作をプログラミング可能にするデバイス。ビジュア
ル・プログラミング(Node-REDなど)にも対応。
90
体制・設備・働き方
付録②
91
役職 研究者 開発者 デザイナ アノテータ その他 合計
役員・正社員 11.3 % 11.7 % 0.5 % 3.5 % 1.6 % 28.6 %
アルバイト/即戦力枠 8.7 % 5.6 % 1.6 % 28.6 % 1.6 % 46.0 %
アルバイト/育成枠 0.8 % 0.8 % 0.0 % 0.0 % 0.0 % 1.6 %
アルバイト/試用枠 0.0 % 0.0 % 0.0 % 0.0 % 0.8 % 0.8 %
パートナー 0.4 % 2.8 % 0.0 % 19.0 % 0.8 % 23.0 %
合計 21.3 % 20.8 % 2.1 % 51.1 % 4.8 % 100.0 %
柔軟な体制
92
ワンストップ体制を支えるために様々な技術者がバランスよく在籍
豊富な資源
• 理想的な個人設備
– PC,椅子,モニタ,キーボード,マウス,…
• スグに使える計算資源とアノテータ
– AHAB:実験用ハイブリッドクラウド
– ANNOFAB:アノテーションサービス
• 世界中から集まるデータ
– ロボットサービス用データ,自動運転用データ,商品認識用
データ,文字認識用データ,体操採点用データ,…
93
研究開発を円滑にするためにあらゆる手を尽くす
創造的な働き方
• 様々な働き方
– 自由な時間帯・場所,エージェント・冒険者(実力のある学生向けの
時短勤務制度),JEDI(優秀な同僚によるメンタリング制度),…
• 優秀な同僚
– 未踏採択者,コンテスト入賞者,OSS 貢献者,MVP,…
• その他 ※全て会社負担
– 自己研鑽のための書籍・機材の購入,勉強会・懇親会の開催・
参加・移動・宿泊,会社の昼会・夕会・飲み会で出る飲食物
94
技術を磨きやすくするためにあらゆる手を尽くす
95
募集中
研究者
開発者
デザイナ

Contenu connexe

Similaire à JAWS DAYS 2022

わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料Shinichiro Isago
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料guest628c07
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようHideo Takagi
 
Spark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについてSpark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについてRecruit Technologies
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysKenta Suzuki
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysVOYAGE GROUP
 
AI Utilization Seminar 20190709
AI Utilization Seminar 20190709AI Utilization Seminar 20190709
AI Utilization Seminar 20190709陽平 山口
 
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]Hideo Takagi
 
OpenStack Object Storage; Usage
OpenStack Object Storage; UsageOpenStack Object Storage; Usage
OpenStack Object Storage; Usageirix_jp
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Institute Japan
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304Shinichiro Arai
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とToru Takahashi
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とToru Takahashi
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例terurou
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~The Japan DataScientist Society
 

Similaire à JAWS DAYS 2022 (20)

超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
Spark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについてSpark Summit 2014 の報告と最近の取り組みについて
Spark Summit 2014 の報告と最近の取り組みについて
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
 
組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング
 
Ocha_MLflow_MLOps.pdf
Ocha_MLflow_MLOps.pdfOcha_MLflow_MLOps.pdf
Ocha_MLflow_MLOps.pdf
 
AI Utilization Seminar 20190709
AI Utilization Seminar 20190709AI Utilization Seminar 20190709
AI Utilization Seminar 20190709
 
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
 
OpenStack Object Storage; Usage
OpenStack Object Storage; UsageOpenStack Object Storage; Usage
OpenStack Object Storage; Usage
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリング
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304OSSではじめるオープン・スタンダードのクラウド @201304
OSSではじめるオープン・スタンダードのクラウド @201304
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
 
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
 
Hadoopカンファレンス2013
Hadoopカンファレンス2013Hadoopカンファレンス2013
Hadoopカンファレンス2013
 

Plus de 陽平 山口

Plus de 陽平 山口 (20)

NGK2023S ChatGPT
NGK2023S ChatGPTNGK2023S ChatGPT
NGK2023S ChatGPT
 
NGK2022S
NGK2022SNGK2022S
NGK2022S
 
KCI PROFILE 2021-10-07
KCI PROFILE 2021-10-07KCI PROFILE 2021-10-07
KCI PROFILE 2021-10-07
 
JAWSUG 20210128
JAWSUG 20210128JAWSUG 20210128
JAWSUG 20210128
 
AWS Webinar 20201224
AWS Webinar 20201224AWS Webinar 20201224
AWS Webinar 20201224
 
SIAI2020
SIAI2020SIAI2020
SIAI2020
 
MISO20200530
MISO20200530MISO20200530
MISO20200530
 
ML@Loft 20200430
ML@Loft 20200430ML@Loft 20200430
ML@Loft 20200430
 
JAWS FESTA 20191102
JAWS FESTA 20191102JAWS FESTA 20191102
JAWS FESTA 20191102
 
JAWSUG 20191028 (modified)
JAWSUG 20191028 (modified)JAWSUG 20191028 (modified)
JAWSUG 20191028 (modified)
 
JAWSUG 20191028
JAWSUG 20191028JAWSUG 20191028
JAWSUG 20191028
 
JAWSUG 20190828
JAWSUG 20190828JAWSUG 20190828
JAWSUG 20190828
 
JAWSUG 20190620
JAWSUG 20190620JAWSUG 20190620
JAWSUG 20190620
 
JAWS DAYS 2019
JAWS DAYS 2019JAWS DAYS 2019
JAWS DAYS 2019
 
JAWS FESTA 2018 OSAKA AHAB
JAWS FESTA 2018 OSAKA AHABJAWS FESTA 2018 OSAKA AHAB
JAWS FESTA 2018 OSAKA AHAB
 
JAWS FESTA 2018 OSAKA KCI SESSION
JAWS FESTA 2018 OSAKA KCI SESSIONJAWS FESTA 2018 OSAKA KCI SESSION
JAWS FESTA 2018 OSAKA KCI SESSION
 
NAGOSUTA 20181020
NAGOSUTA 20181020NAGOSUTA 20181020
NAGOSUTA 20181020
 
JAWSUG20180925
JAWSUG20180925JAWSUG20180925
JAWSUG20180925
 
Nagoya Career Meetup 2018夏
Nagoya Career Meetup 2018夏Nagoya Career Meetup 2018夏
Nagoya Career Meetup 2018夏
 
Annotation Meetup 20180705
Annotation Meetup 20180705Annotation Meetup 20180705
Annotation Meetup 20180705
 

Dernier

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 

Dernier (8)

クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 

JAWS DAYS 2022