Soumettre la recherche
Mettre en ligne
コサインクラスタリング
•
Télécharger en tant que ODP, PDF
•
2 j'aime
•
2,797 vues
osamu morimoto
Suivre
コサイン類似度を用いたクラスタリング
Lire moins
Lire la suite
Sciences
Signaler
Partager
Signaler
Partager
1 sur 8
Télécharger maintenant
Recommandé
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2020の目標は「トップ会議30+本投稿」することです。 http://xpaperchallenge.org/cv/
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
2019/06/21 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Deep Learning JP
2019/03/01 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
2018.10.29「第1回NIPS2018 理論と実装を話し合う会」で発表した資料です。
Attention-Guided GANについて
Attention-Guided GANについて
yohei okawa
動画中の人物行動認識における3D CNNを用いた手法の動向を紹介します.
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
時系列分析による異常検知入門
時系列分析による異常検知入門
Yohei Sato
IBIS 2021 https://ibisml.org/ibis2021/ における最適輸送についてのチュートリアルスライドです。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-ru-men
最適輸送入門
最適輸送入門
joisino
異常検知のサーベイ論文の紹介 (2020/11/01)
Anomaly detection survey
Anomaly detection survey
ぱんいち すみもと
Recommandé
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2020の目標は「トップ会議30+本投稿」することです。 http://xpaperchallenge.org/cv/
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
2019/06/21 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Deep Learning JP
2019/03/01 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
2018.10.29「第1回NIPS2018 理論と実装を話し合う会」で発表した資料です。
Attention-Guided GANについて
Attention-Guided GANについて
yohei okawa
動画中の人物行動認識における3D CNNを用いた手法の動向を紹介します.
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
Kensho Hara
時系列分析による異常検知入門
時系列分析による異常検知入門
Yohei Sato
IBIS 2021 https://ibisml.org/ibis2021/ における最適輸送についてのチュートリアルスライドです。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-ru-men
最適輸送入門
最適輸送入門
joisino
異常検知のサーベイ論文の紹介 (2020/11/01)
Anomaly detection survey
Anomaly detection survey
ぱんいち すみもと
異常検知のまとめ
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
ぱんいち すみもと
春学期に行ったゼミでの文献調査です. ベイズの枠組みを利用したActive Learningを中心に発表しました
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
Naoki Matsunaga
異常検知・OOD検知論文紹介 ICLR・NIPS・ICML
パンハウスゼミ 異常検知論文紹介 20191005
パンハウスゼミ 異常検知論文紹介 20191005
ぱんいち すみもと
2020/6/11 画像センシングシンポジウム オーガナイズドセッション2 「限られたデータからの深層学習」 https://confit.atlas.jp/guide/event/ssii2020/static/organized#OS2 での招待講演資料です。 コンピュータビジョン分野を中心とした転移学習についての講演です。 パブリックなデータセットも増えていて、物体検出や領域分割などの研究も盛んですが、実際に社会実装しようとするときのデータは学習データと異なる性質(異なるドメイン)のデータである場合も非常に多いです。 本講演では、そのような場合に有効なドメイン適応の原理となるアプローチ2つと応用としての物体検出と領域分割の事例を紹介しています。
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Yoshitaka Ushiku
SSII2022 [OS3-02] Federated Learningの基礎と応用 6月10日 (金) 11:00 - 12:30 メイン会場 登壇者:西尾 理志 氏(東京工業大学) 概要:Federated Learning (FL)とは、分散して保持されたデータを収集・集約することなく機械学習モデルの訓練に用いる方法である。画像や音声、ヘルスケア情報など個人情報や機密情報の保護の観点から集約が難しいデータを機械学習へ活用できるという期待から、学術および産業の両面から注目を集めている。本講演では、FLの原理と応用例、FLの課題解決に向けた近年の取り組みについて解説する。
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII
2019/09/27 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
Deep Learning JP
2020/11/27 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
Deep Learning JP
2023/7/20 Deep Learning JP http://deeplearning.jp/seminar-2/
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
授業のゼミで作りました。
Bayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
tmtm otm
6/9 (木) 14:45~15:15 メイン会場 講師:石井 雅人 氏(ソニーグループ株式会社) 概要: 機械学習技術の急速な発達により、コンピュータによる知的処理は様々なタスクで人間に匹敵あるいは凌駕する性能を達成してきた。一方、このような高い性能は大量かつ高品質な学習データによって支えられており、多様化する機械学習応用においてデータの収集コストが大きな導入障壁の1つとなっている。本講演では、少ないデータやラベルから効率的に学習するための様々な技術について、「足りない情報をどのように補うか?」という観点から概観するとともに、特に画像認識分野における最新の研究動向についても紹介する。
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
2017/11/06 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
Deep Learning JP
機械学習の社会実装では、予測精度が高くても、機械学習がブラックボックであるために使うことができないということがよく起きます。 このスライドでは機械学習が不得意な予測結果の根拠を示すために考案されたLIMEの論文を解説します。 Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "" Why should i trust you?" Explaining the predictions of any classifier." Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016.
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
巷で話題の画像生成サービス, Stable Diffusion, Midjourney, DALL-E2 の基盤となる 生成モデルDiffusion Model の解説です。 機械学習の社会実装勉強会 第15回の発表内容です。 https://machine-learning-workshop.connpass.com/event/246825/
12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
変分ベイズ法の説明。 最尤法との対比で説明した。また、EMアルゴリズムとの対応も述べられている。 職場の勉強会での資料です。
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
cvpaper. challenge
Twitter: ottamm_190 追記 2022/4/24 speakerdeck版:https://speakerdeck.com/masatoto/shen-ceng-xue-xi-falsebu-que-shi-xing-uncertainty-in-deep-neural-networks コンパクト版:https://speakerdeck.com/masatoto/shen-ceng-xue-xi-niokerubu-que-shi-xing-ru-men
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
ブースティングはアンサンブル学習の一つです。アンサンブル学習では、性能の低い学習器を組み合わせて、高性能な学習器を作ります。教師あり機械学習の問題設定の復習から始めて、バギングやブースティングのアルゴリズムについて解説します。 レトリバセミナーで話したときの動画はこちらです: https://www.youtube.com/watch?v=SJtdG62691g
ブースティング入門
ブースティング入門
Retrieva inc.
2017/12/12 強化学習アーキテクチャ勉強会の資料
GAN(と強化学習との関係)
GAN(と強化学習との関係)
Masahiro Suzuki
論文「Deep Clustering for Unsupervised Learning of Visual Features」について輪読した際の資料です。
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
lavaanパッケージの出力からキレイなパス図を描く。
Tokyo.R #76 lavaan plot
Tokyo.R #76 lavaan plot
osamu morimoto
クラスター分析におけるクラスタ数の決め方
クラスタ数の決め方(Tokyo.r#60)
クラスタ数の決め方(Tokyo.r#60)
osamu morimoto
Contenu connexe
Tendances
異常検知のまとめ
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
ぱんいち すみもと
春学期に行ったゼミでの文献調査です. ベイズの枠組みを利用したActive Learningを中心に発表しました
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
Naoki Matsunaga
異常検知・OOD検知論文紹介 ICLR・NIPS・ICML
パンハウスゼミ 異常検知論文紹介 20191005
パンハウスゼミ 異常検知論文紹介 20191005
ぱんいち すみもと
2020/6/11 画像センシングシンポジウム オーガナイズドセッション2 「限られたデータからの深層学習」 https://confit.atlas.jp/guide/event/ssii2020/static/organized#OS2 での招待講演資料です。 コンピュータビジョン分野を中心とした転移学習についての講演です。 パブリックなデータセットも増えていて、物体検出や領域分割などの研究も盛んですが、実際に社会実装しようとするときのデータは学習データと異なる性質(異なるドメイン)のデータである場合も非常に多いです。 本講演では、そのような場合に有効なドメイン適応の原理となるアプローチ2つと応用としての物体検出と領域分割の事例を紹介しています。
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Yoshitaka Ushiku
SSII2022 [OS3-02] Federated Learningの基礎と応用 6月10日 (金) 11:00 - 12:30 メイン会場 登壇者:西尾 理志 氏(東京工業大学) 概要:Federated Learning (FL)とは、分散して保持されたデータを収集・集約することなく機械学習モデルの訓練に用いる方法である。画像や音声、ヘルスケア情報など個人情報や機密情報の保護の観点から集約が難しいデータを機械学習へ活用できるという期待から、学術および産業の両面から注目を集めている。本講演では、FLの原理と応用例、FLの課題解決に向けた近年の取り組みについて解説する。
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII
2019/09/27 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
Deep Learning JP
2020/11/27 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
Deep Learning JP
2023/7/20 Deep Learning JP http://deeplearning.jp/seminar-2/
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
cvpaper. challenge
授業のゼミで作りました。
Bayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
tmtm otm
6/9 (木) 14:45~15:15 メイン会場 講師:石井 雅人 氏(ソニーグループ株式会社) 概要: 機械学習技術の急速な発達により、コンピュータによる知的処理は様々なタスクで人間に匹敵あるいは凌駕する性能を達成してきた。一方、このような高い性能は大量かつ高品質な学習データによって支えられており、多様化する機械学習応用においてデータの収集コストが大きな導入障壁の1つとなっている。本講演では、少ないデータやラベルから効率的に学習するための様々な技術について、「足りない情報をどのように補うか?」という観点から概観するとともに、特に画像認識分野における最新の研究動向についても紹介する。
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
2017/11/06 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
Deep Learning JP
機械学習の社会実装では、予測精度が高くても、機械学習がブラックボックであるために使うことができないということがよく起きます。 このスライドでは機械学習が不得意な予測結果の根拠を示すために考案されたLIMEの論文を解説します。 Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "" Why should i trust you?" Explaining the predictions of any classifier." Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016.
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
巷で話題の画像生成サービス, Stable Diffusion, Midjourney, DALL-E2 の基盤となる 生成モデルDiffusion Model の解説です。 機械学習の社会実装勉強会 第15回の発表内容です。 https://machine-learning-workshop.connpass.com/event/246825/
12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
変分ベイズ法の説明。 最尤法との対比で説明した。また、EMアルゴリズムとの対応も述べられている。 職場の勉強会での資料です。
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
cvpaper. challenge
Twitter: ottamm_190 追記 2022/4/24 speakerdeck版:https://speakerdeck.com/masatoto/shen-ceng-xue-xi-falsebu-que-shi-xing-uncertainty-in-deep-neural-networks コンパクト版:https://speakerdeck.com/masatoto/shen-ceng-xue-xi-niokerubu-que-shi-xing-ru-men
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
ブースティングはアンサンブル学習の一つです。アンサンブル学習では、性能の低い学習器を組み合わせて、高性能な学習器を作ります。教師あり機械学習の問題設定の復習から始めて、バギングやブースティングのアルゴリズムについて解説します。 レトリバセミナーで話したときの動画はこちらです: https://www.youtube.com/watch?v=SJtdG62691g
ブースティング入門
ブースティング入門
Retrieva inc.
2017/12/12 強化学習アーキテクチャ勉強会の資料
GAN(と強化学習との関係)
GAN(と強化学習との関係)
Masahiro Suzuki
論文「Deep Clustering for Unsupervised Learning of Visual Features」について輪読した際の資料です。
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
Tendances
(20)
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
パンハウスゼミ 異常検知論文紹介 20191005
パンハウスゼミ 異常検知論文紹介 20191005
ドメイン適応の原理と応用
ドメイン適応の原理と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]Dense Captioning分野のまとめ
[DL輪読会]Dense Captioning分野のまとめ
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
Bayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf
変分ベイズ法の説明
変分ベイズ法の説明
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
ブースティング入門
ブースティング入門
GAN(と強化学習との関係)
GAN(と強化学習との関係)
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
Plus de osamu morimoto
lavaanパッケージの出力からキレイなパス図を描く。
Tokyo.R #76 lavaan plot
Tokyo.R #76 lavaan plot
osamu morimoto
クラスター分析におけるクラスタ数の決め方
クラスタ数の決め方(Tokyo.r#60)
クラスタ数の決め方(Tokyo.r#60)
osamu morimoto
Rでコンジョイント分析
Rでコンジョイント分析
osamu morimoto
R言語でアソシエーションルール。マーケットバスケット分析。
Tokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
osamu morimoto
Tokyo r 11_self_organizing_map
Tokyo r 11_self_organizing_map
osamu morimoto
第8回東京R勉強会の発表資料
Tokyo.R8 brand positioning 2010.08.28.
Tokyo.R8 brand positioning 2010.08.28.
osamu morimoto
Tokyo.R#7
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
osamu morimoto
Tokyo r6 sem3
Tokyo r6 sem3
osamu morimoto
Tokyo webmining5
Tokyo webmining5
osamu morimoto
tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.
osamu morimoto
Plus de osamu morimoto
(10)
Tokyo.R #76 lavaan plot
Tokyo.R #76 lavaan plot
クラスタ数の決め方(Tokyo.r#60)
クラスタ数の決め方(Tokyo.r#60)
Rでコンジョイント分析
Rでコンジョイント分析
Tokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
Tokyo r 11_self_organizing_map
Tokyo r 11_self_organizing_map
Tokyo.R8 brand positioning 2010.08.28.
Tokyo.R8 brand positioning 2010.08.28.
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
Tokyo r6 sem3
Tokyo r6 sem3
Tokyo webmining5
Tokyo webmining5
tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.
コサインクラスタリング
1.
コサイン類似度を用い た クラスタリング @bob3bob3 Tokyo.R #54 2016/06/19
2.
お伝えしたいこと ● いわゆるビッグデータによくあるスパースな行 列のクラスタリングにはコサイン類似度を使う といい感じだよ。 ● コサイン類似度を用いたクラスタリングは skmeansパッケージで実行できるよ。 ● このLTの内容は『マーケティング・サイエンス のトップランナーたち』の第2章「商品市場を 細分化するビッグデータ適合型クラスター分析 の活用」がネタ元だよ。
3.
同じような購買傾向の消費者を グループ化したい ケース1 ビール ワイン
日本酒 焼酎 ウイス キー Aさん 1 1 Bさん 1 ケース2 ビール ワイン 日本酒 焼酎 ウイス キー Cさん 1 1 1 Dさん 1 1 1 1 この二人は別々のグループにしたい この二人は同じグループにしたい
4.
K-means法で使用される ユークリッド距離だと ケース1 ビール ワイン
日本酒 焼酎 ウイス キー Aさん 1 1 Bさん 1 ケース1 ビール ワイン 日本酒 焼酎 ウイス キー Aさん 1 1 1 Bさん 1 1 1 1 ユークリッド距離:1.732 ユークリッド距離:1.732
5.
1-コサイン類似度だと ケース1 ビール ワイン
日本酒 焼酎 ウイス キー Aさん 1 1 Bさん 1 ケース1 ビール ワイン 日本酒 焼酎 ウイス キー Aさん 1 1 1 Bさん 1 1 1 1 1−コサイン類似度:1.000 1−コサイン類似度:0.423
6.
skmeansパッケージを使ってみる # 関連規則のパッケージに入っているサンプルデータを使う library(arules) # transactions形式のサンプルデータ data(Groceries) #スパースなデータを扱いやすくするパッケージ。圧倒的に処理が早い。 library(slam) #transactions形式からmatrix形式に Groceries.mat
<- as(Groceries,"matrix") #真偽値を0/1に変換 Groceries.mat <- ifelse(Groceries.mat==TRUE,1,0) #matrix形式からstm形式へ Groceries.stm <- as.simple_triplet_matrix(Groceries.mat)
7.
skmeansパッケージを使ってみる library(skmeans) #コサイン距離を使ったkmeans set.seed(1234) #再現性のための乱数種設定 res
<- skmeans(Groceries.stm, k=05) table(res$cluster) #各クラスタのサイズ aggregate(Groceries.mat, by=list(res$cluster), mean)
8.
Enjoy!
Télécharger maintenant