SlideShare une entreprise Scribd logo
1  sur  10
Télécharger pour lire hors ligne
1
1
May 2023
Weights & Biases
LLMモデル開発ウェビナー
2
Speakers Today
シバタ アキラ
カントリーマネージャー
Weights & Biases
機械学習エンジニア
Weights & Biases
山本 祐也
Grandmaster
4
W&B日本展開について
2023年3月
日本法人を設立。東京-京橋を拠点とし、
MLエンジニアやサポートエンジニアを含
むカスタマー・サクセスチームが発足。
4月 JDLA協会正会員に
5月 AI Expoに出展
6月 人工知能学会大会をスポンサー
MLエンジニアのためのミートアップを毎月開催
(https://wandb.connpass.com)
5
ML is transforming every industry
TRIではコンピュータビジョンを使って
完全自動運転車の開発を進めてい
ます
「W&Bは早いペースで最先端の開発
を大規模に行うチームにはなくては
ならないインフラです。」
Adrien Gaidon
Toyota Research Institute
OpenAIは深層学習と自然言語処理を
使って、超高性能なチャットボットを開発
しています
「W&Bは、一人の研究者のインサイトを
チームに波及させ、一台のマシンに閉じ
込めず、何千台にスケールさせることが
できます。」
WOJCIECH ZAREMBA
Co-founder of OpenAI
Genentechは深層学習を使って感染
病に有効な新しい抗生物質を
探しています
「W&Bのおかげで、私たちは意味の
ある科学研究により多くの時間を費
やすことができます。」
Stephen Ra
Machine Learning Lead
機械学習はあらゆるインダストリーを変革しています
6
概要と目次:
・学習済みLLMモデルの構築と購入の比較
・スケーリング法則
・ハードウェア
・データセットの収集
・データセットの前処理
・事前学習のステップ
・モデル評価
・バイアスと有害性
・インストラクションチューニング
・人間のフィードバックによる強化学習
二週間でダウンロードと配
布で1000部達成!
7
AIは3つの要因でスケールする(どんどん賢くなる)
The Pre-Deep Learning Era (pre-2010, training compute doubled every
20 months), the Deep Learning Era (2010-15, doubling every 6 months),
and the Large-Scale Era (2016-present, a 100-1000x jump, then
doubling every 10 months).
LLMの実現に繋がった
Transformer研究の発表
(2017)
データ(量x質) アルゴリズム 計算量
Source: Statistica
事前学習
教師あり
ファインチューニング
報酬モデル 強化学習(RLHF)
インターネットから収集
スクレイピングされた膨大なテキスト
何兆にも及ぶ単語数
質は低いが、量は多い
課題に対する答え方の訓練
理想的な回答を人間が作成
10~10万のプロンプト・答えのペア
量は少ないが、質は高い
(モデルで生成する手法も)
結果の評価
10万〜100万の比較結果
人間が結果を見比べて評価
量は少ないが、質は高い
プロンプト
1万〜10万のプロンプト
人間によって書かれたプロンプト
量は少ないが、質は高い
何億円もの計算コスト
何千ものGPU
何週間〜何ヶ月に及ぶ学習
例:GPT, LLaMA, PaLM
数百ドルで計算できる手法も
1~100 GPU
数時間から数日の学習
例:Vicuna-13B
計算コストよりも、データにコスト
1~100 GPU
数時間から数日の学習
まだ十分に確立されていない
1~100 GPU
数時間から数日の学習
例:ChatGPT, Claude, Bard
デプロイして使うことのできるモデル
深層学習:Transformer
次のトークンを予測する学習方法で、何百億
ものパラメーターを計算
深層学習:Transformer
次のトークンを予測す学習でモデルの全ても
しくは一部のパラメーターを再計算
二値分類
人間がより高く評価する結果を学習し、プロ
ンプトの答えを評価
強化学習
結果の評価を最大化するようにモデルを変
更
基盤モデル SFTモデル RMモデル RLモデル
What is ChatGPT doing...and why does it work? https://www.youtube.com/watch?v=bZQun8Y4L2A
ステージ
データセット
アルゴリズム
モデル
計算方法・
コスト
基盤モデルが
インプット
SFTモデル
がインプット
SFTとRMモデル
がインプット
チャット型GPTモデルの作り方まとめ
巨大言語モデルとの関わり方
独自のデータを使って
ファンデーションモデル
をカスタマイズ
● 基盤モデルのファイン
・チューニング
● 既存のアーキテク
チャーで独自学習
非常に大量のデータ、
技術的専門性、計算リ
ソースを使い、現在より
もさらに複雑で精度の
高いファンデーションモ
デルを開発
基盤モデルを
カスタマイズ
自社でLLMを
ゼロから構築
すでに公開されている
学習済み・チューニング
済みモデルをそのまま
使う
● プロンプトで対話
● APIを使いアプリケー
ションに組込む
基盤モデルを
そのまま使う
akira.shibata@wandb.com

Contenu connexe

Tendances

Tendances (20)

CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査
 
[DL輪読会]Explainable Reinforcement Learning: A Survey
[DL輪読会]Explainable Reinforcement Learning: A Survey[DL輪読会]Explainable Reinforcement Learning: A Survey
[DL輪読会]Explainable Reinforcement Learning: A Survey
 
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
 
W&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdfW&B webinar finetuning_配布用.pdf
W&B webinar finetuning_配布用.pdf
 
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
 
帰納バイアスが成立する条件
帰納バイアスが成立する条件帰納バイアスが成立する条件
帰納バイアスが成立する条件
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
最適輸送入門
最適輸送入門最適輸送入門
最適輸送入門
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
 
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けてSSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
 
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 

Similaire à LLM Webinar - シバタアキラ to share.pdf

サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
Yuta Matsumura
 

Similaire à LLM Webinar - シバタアキラ to share.pdf (20)

誰もが AI を使う時代、作る時代
誰もが AI を使う時代、作る時代誰もが AI を使う時代、作る時代
誰もが AI を使う時代、作る時代
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
それは本当にAutomate? 改めて考えるPower Automate
それは本当にAutomate? 改めて考えるPower Automateそれは本当にAutomate? 改めて考えるPower Automate
それは本当にAutomate? 改めて考えるPower Automate
 
Future customer experience
Future customer experienceFuture customer experience
Future customer experience
 
AIの見方、AIとの付き合い方
AIの見方、AIとの付き合い方AIの見方、AIとの付き合い方
AIの見方、AIとの付き合い方
 
DOO-012_FinTech だけじゃモッタイない! ブロックチェーンとクラウドが作る未来
DOO-012_FinTech だけじゃモッタイない! ブロックチェーンとクラウドが作る未来DOO-012_FinTech だけじゃモッタイない! ブロックチェーンとクラウドが作る未来
DOO-012_FinTech だけじゃモッタイない! ブロックチェーンとクラウドが作る未来
 
これからはじめる Power Platform
これからはじめる Power Platformこれからはじめる Power Platform
これからはじめる Power Platform
 
BIerのためのAI入門
BIerのためのAI入門BIerのためのAI入門
BIerのためのAI入門
 
W&B monthly meetup#6 Weave.pdf
W&B monthly meetup#6 Weave.pdfW&B monthly meetup#6 Weave.pdf
W&B monthly meetup#6 Weave.pdf
 
Smfl20201001
Smfl20201001Smfl20201001
Smfl20201001
 
API ペタペタしただけのお手軽 感情分析アプリ
API ペタペタしただけのお手軽 感情分析アプリAPI ペタペタしただけのお手軽 感情分析アプリ
API ペタペタしただけのお手軽 感情分析アプリ
 
アルゴリズムから学ぶAzure mlモジュールの使いこなし方 hd-insight編-
アルゴリズムから学ぶAzure mlモジュールの使いこなし方 hd-insight編-アルゴリズムから学ぶAzure mlモジュールの使いこなし方 hd-insight編-
アルゴリズムから学ぶAzure mlモジュールの使いこなし方 hd-insight編-
 
成長する組織を支えるシロクの自動化
成長する組織を支えるシロクの自動化成長する組織を支えるシロクの自動化
成長する組織を支えるシロクの自動化
 
IoTC -> Power Automate & Apps
IoTC -> Power Automate & AppsIoTC -> Power Automate & Apps
IoTC -> Power Automate & Apps
 
Machine Learning studio で構造化データから予測分析 (LT版)
Machine Learning studio で構造化データから予測分析 (LT版)Machine Learning studio で構造化データから予測分析 (LT版)
Machine Learning studio で構造化データから予測分析 (LT版)
 
MOV お客さま探索ナビの GCP ML開発フローについて
MOV お客さま探索ナビの GCP ML開発フローについてMOV お客さま探索ナビの GCP ML開発フローについて
MOV お客さま探索ナビの GCP ML開発フローについて
 
MOV お客さま探索ナビの GCP ML開発フローについて
MOV お客さま探索ナビの GCP ML開発フローについてMOV お客さま探索ナビの GCP ML開発フローについて
MOV お客さま探索ナビの GCP ML開発フローについて
 
Custom Visionで仏像を画像分類
Custom Visionで仏像を画像分類Custom Visionで仏像を画像分類
Custom Visionで仏像を画像分類
 
サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
サーバーレスやマイクロサービスへの"チャレンジ"を後押ししてくれるセッションを紹介
 
Twilio Meetup Tokyo 2015 Microsoft 講演資料「開発コミュニティでアイディアと仲間を見つけよう!ハッカソンから技術系スター...
Twilio Meetup Tokyo 2015 Microsoft 講演資料「開発コミュニティでアイディアと仲間を見つけよう!ハッカソンから技術系スター...Twilio Meetup Tokyo 2015 Microsoft 講演資料「開発コミュニティでアイディアと仲間を見つけよう!ハッカソンから技術系スター...
Twilio Meetup Tokyo 2015 Microsoft 講演資料「開発コミュニティでアイディアと仲間を見つけよう!ハッカソンから技術系スター...
 

Plus de Akira Shibata

The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNN
Akira Shibata
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software Development
Akira Shibata
 

Plus de Akira Shibata (20)

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdf
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdf
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
 
W&B Seminar #4.pdf
W&B Seminar #4.pdfW&B Seminar #4.pdf
W&B Seminar #4.pdf
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data science
 
Data x
Data xData x
Data x
 
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira shibata at developer summit 2016
Akira shibata at developer summit 2016
 
PyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlowPyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlow
 
20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンス20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンス
 
人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かす
 
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
 
20150128 cross2015
20150128 cross201520150128 cross2015
20150128 cross2015
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNN
 
LHC for Students
LHC for StudentsLHC for Students
LHC for Students
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software Development
 

LLM Webinar - シバタアキラ to share.pdf