Soumettre la recherche
Mettre en ligne
データ表現のパターン
•
1 j'aime
•
1,404 vues
Hironori Washizaki
Suivre
鷲崎弘宜, データ表現のパターン, 出版記念セミナー: AI活用成熟度と機械学習デザインパターン詳説, スマートエスイー, 2021
Lire moins
Lire la suite
Logiciels
Signaler
Partager
Signaler
Partager
1 sur 5
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説
Hironori Washizaki
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Teppei Kurita
トピックモデルの基礎と応用
トピックモデルの基礎と応用
Tomonari Masada
Probabilistic face embeddings
Probabilistic face embeddings
Kazuki Maeno
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Atsushi KOMIYA
Proof summit 2017 for slideshare
Proof summit 2017 for slideshare
Keisuke Yahata
次元の呪い
次元の呪い
Kosuke Tsujino
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
Recommandé
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説
Hironori Washizaki
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係)
Teppei Kurita
トピックモデルの基礎と応用
トピックモデルの基礎と応用
Tomonari Masada
Probabilistic face embeddings
Probabilistic face embeddings
Kazuki Maeno
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Atsushi KOMIYA
Proof summit 2017 for slideshare
Proof summit 2017 for slideshare
Keisuke Yahata
次元の呪い
次元の呪い
Kosuke Tsujino
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
Deep Learning JP
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
Shuyo Nakatani
最適輸送の解き方
最適輸送の解き方
joisino
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
最適化計算の概要まとめ
最適化計算の概要まとめ
Yuichiro MInato
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
機械学習の理論と実践
機械学習の理論と実践
Preferred Networks
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
『データ解析におけるプライバシー保護』勉強会 秘密計算
『データ解析におけるプライバシー保護』勉強会 秘密計算
MITSUNARI Shigeo
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
Pythonによる黒魔術入門
Pythonによる黒魔術入門
大樹 小倉
猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder
Sho Tatsuno
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
tmtm otm
NLPにおけるAttention~Seq2Seq から BERTまで~
NLPにおけるAttention~Seq2Seq から BERTまで~
Takuya Ono
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
【解説】 一般逆行列
【解説】 一般逆行列
Kenjiro Sugimoto
オントロジーとは?
オントロジーとは?
Kouji Kozaki
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
AGIRobots
Machine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their Engineering
Hironori Washizaki
IEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions Update
Hironori Washizaki
Contenu connexe
Tendances
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
Deep Learning JP
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
Shuyo Nakatani
最適輸送の解き方
最適輸送の解き方
joisino
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
最適化計算の概要まとめ
最適化計算の概要まとめ
Yuichiro MInato
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
機械学習の理論と実践
機械学習の理論と実践
Preferred Networks
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
『データ解析におけるプライバシー保護』勉強会 秘密計算
『データ解析におけるプライバシー保護』勉強会 秘密計算
MITSUNARI Shigeo
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
Pythonによる黒魔術入門
Pythonによる黒魔術入門
大樹 小倉
猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder
Sho Tatsuno
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
tmtm otm
NLPにおけるAttention~Seq2Seq から BERTまで~
NLPにおけるAttention~Seq2Seq から BERTまで~
Takuya Ono
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
【解説】 一般逆行列
【解説】 一般逆行列
Kenjiro Sugimoto
オントロジーとは?
オントロジーとは?
Kouji Kozaki
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
AGIRobots
Tendances
(20)
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
最適輸送の解き方
最適輸送の解き方
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
最適化計算の概要まとめ
最適化計算の概要まとめ
グラフィカルモデル入門
グラフィカルモデル入門
機械学習の理論と実践
機械学習の理論と実践
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
『データ解析におけるプライバシー保護』勉強会 秘密計算
『データ解析におけるプライバシー保護』勉強会 秘密計算
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
Pythonによる黒魔術入門
Pythonによる黒魔術入門
猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
NLPにおけるAttention~Seq2Seq から BERTまで~
NLPにおけるAttention~Seq2Seq から BERTまで~
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【解説】 一般逆行列
【解説】 一般逆行列
オントロジーとは?
オントロジーとは?
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
Plus de Hironori Washizaki
Machine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their Engineering
Hironori Washizaki
IEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions Update
Hironori Washizaki
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
Hironori Washizaki
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
Hironori Washizaki
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
Hironori Washizaki
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
Hironori Washizaki
Joseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about Architecture
Hironori Washizaki
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
Hironori Washizaki
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
Hironori Washizaki
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
Hironori Washizaki
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
Hironori Washizaki
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
Hironori Washizaki
スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介
Hironori Washizaki
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方
Hironori Washizaki
対応性のある運用のパターン
対応性のある運用のパターン
Hironori Washizaki
モデル訓練のパターン
モデル訓練のパターン
Hironori Washizaki
パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度
Hironori Washizaki
機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクル
Hironori Washizaki
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
Hironori Washizaki
Software Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning Applications
Hironori Washizaki
Plus de Hironori Washizaki
(20)
Machine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their Engineering
IEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions Update
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
Joseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about Architecture
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方
対応性のある運用のパターン
対応性のある運用のパターン
モデル訓練のパターン
モデル訓練のパターン
パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度
機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクル
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
Software Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning Applications
データ表現のパターン
1.
データ表現のパターン 鷲崎 弘宜 早稲田大学 /
国立情報学研究所 / システム情報 / エクスモーション 2021年 11月10日 washizaki@waseda.jp http://www.washi.cs.waseda.ac.jp/ 1 出版記念セミナー: AI活用成熟度と機械学習デザインパターン詳説
2.
データ表現パターン 2 • 様々なデータから機械学習モデルが扱いやすい特徴量への表現 パターン 問題
解決 特徴量ハッシュ Hashed Feature カテゴリ型特徴量に関連する問 題(不完全な語彙、値の種類の 多さに伴うモデルの大きさ、 コールドスタートなど)。 文字列表現の決定的かつ可搬 性のあるハッシュをバケット 化し、データ表現における衝 突のトレードオフを許容 埋め込み Embeddings 値の種類が多く、関係性の近さ の保持が重要な特徴量 問題上で関係のある情報が保 持されるように、値の種類が 多いデータを低次元の空間に マッピングするデータ表現を 学習 特徴量クロス Feature Cross 特徴量が持つ関係性を学習する 上でのモデルの複雑性の不足 入力値の組み合わせを明示的 に個別の特徴量とし、モデル による入力間の関係性の学習 を加速 マルチモーダル入力 Multimodal Input 複数のデータ表現が存在する場 合の選択方法 使用可能なデータ表現を連結 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
3.
特徴量ハッシュ Hashed Feature •
問題: カテゴリ変数についてとりうる種類を特定困難。One-hot encodingで はout-of-vocabulary問題・Cold-Start問題。 • 解決: • 1. ユニークな文字列へ変換 • 2. 決定的な方法でハッシュ値に変換 • 3. ハッシュ値の設定バケット数(カテゴリ数)の剰余の採用 • 考慮: バケット衝突、他の集約特徴量併用、バケット数チューニング 3 ワンホットエンコーディング tf.feature_column.categorical_column_with_hash_bucket( airport, num_buckets, dtype=tf.dtypes.string ) 特徴量ハッシュ TensorFlowに おける実装 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
4.
埋め込み Embeddings • 問題:
カテゴリ数が膨大な場合の難しさ(疎行列化)。ワンホットエン コーディングではデータの近さを扱えない。 • 解決: 訓練可能な特徴埋め込みレイヤで意味的な近さを表すように小次元 のベクトル化、および、重みの訓練 • 考慮 • 経験則: 次元数 = 元のカテゴリ数の4乗根 • テキスト: 語単位の小次元ベクトル表現、平均をとるなどの集約。Word2VecやBERT などのさらなる意味・文脈考慮。 • 画像: 畳み込みCNN、オートエンコーダなど 4 オートエンコーダ 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
5.
その他のデータ表現パターン 5 x × y
ラベル AC + BC - AD - BD + A B C D 特徴量クロス マルチモーダ ル入力 x y 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
Télécharger maintenant