SlideShare une entreprise Scribd logo
1  sur  19
アダルトデータマイニング 
のすゝめ
まずは自己紹介 
 氏名:三澤賢佑 
 勤務先:某スマホ向けゲーム会社 
 職種:データサイエンティスト() 
 出身:NAIST 松本研究室 
 大学の時は外国語学部にいたので、 
統計・機械学習非ガチ勢の人です
みなさんはアダルトコンテンツを 
お好きでしょうか?
みなさんはアダルトコンテンツを 
お好きでしょうか? 
私は大好きです
私はこんなにも課金をしており 
ます 
9000 
8000 
7000 
6000 
5000 
4000 
3000 
2000 
1000 
0 
5月6月7月 
自社アプリへの課金 
DMM.R18への課金
私はこんなにも課金をしており 
ます 
9000 
8000 
7000 
6000 
5000 
4000 
3000 
2000 
1000 
0 
5月6月7月 
自社アプリへの課金 
DMM.R18への課金 
なんと6倍近くの差 
が!!
やっぱりみんな大好き 
アダルトコンテンツ 
男性に聞いた「アダルトコンテンツを週に一回は見ます 
か?」 
Yes No 
N=15 
そこら辺の人に聞いてみた
ぼくの大好き、みんな大好き 
アダルトコンテンツ 
と、なれば・・・・ 
アダルトコンテンツを分析して、結果が見れたら 
データサイエンティスト() 
としてこれほど幸せなことはない 
と、いうことでこっそりやっていた調査があるので、 
きょうは1つ紹介します
動画タグの関連度から性欲の好み 
がみえるか? 
目的:よく好まれるカテゴリをグループ 
化してみたい 
やってみたこと: 
動画タグの関連度行列で、グラフ構築 
ノード集合をクラスターに分離する
(一部の)世界的に有名なSexualitics 
datasetを利用(フリー) 
 http://sexualitics.github.io/
動画タグ同士の隣接行列 
を使ってみる 
Sexualiticsにはタグの隣接行列が用意されている
グラフを描いてみる
コミュニティ抽出アルゴリズムを 
使ってタグをクラスタ化してみる 
コミュニティ抽出法
19のクラスタに分離できた
それぞれのクラスタをまとめてみ 
ると 
ヨーロッパ人好き・おもちゃとか使っち素人好き 
黒人好き 
xxx好き 
アジア系好き 
日本人&変態的なプレイ好き 
野外・10代 
…….
それぞれのクラスタをまとめてみ 
ると 
ヨーロッパ人好き・おもちゃとか使っち素人好き 
黒人好き 
xxx好き 
アジア系好き 
日本人&変態的なプレイ好き 
野外・10代 
……. 
内容と好みの人種がうまいことくっついた状態に 
→人種によって好まれる内容は違う?
おまけ 
19番目のクラスタは
つまり、こういうこと?
まとめ 
アダルトデータを分析するの 
は 
楽しい^^;

Contenu connexe

Tendances

ユーザーエクスペリエンスの分解
ユーザーエクスペリエンスの分解ユーザーエクスペリエンスの分解
ユーザーエクスペリエンスの分解
Takehisa Gokaichi
 
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
Naoto Tamiya
 

Tendances (20)

社会的共通資本と資本主義
社会的共通資本と資本主義社会的共通資本と資本主義
社会的共通資本と資本主義
 
人間中心設計の国際規格ISO9241-210:2010のポイント
人間中心設計の国際規格ISO9241-210:2010のポイント人間中心設計の国際規格ISO9241-210:2010のポイント
人間中心設計の国際規格ISO9241-210:2010のポイント
 
Web3 School
Web3 SchoolWeb3 School
Web3 School
 
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
 
Devsumi 2018summer
Devsumi 2018summerDevsumi 2018summer
Devsumi 2018summer
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
 
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
 
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
 
ユーザーエクスペリエンスの分解
ユーザーエクスペリエンスの分解ユーザーエクスペリエンスの分解
ユーザーエクスペリエンスの分解
 
スタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレートスタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレート
 
【DL輪読会】Aspect-based Analysis of Advertising Appeals for Search Engine Advert...
【DL輪読会】Aspect-based Analysis of Advertising Appeals for Search  Engine Advert...【DL輪読会】Aspect-based Analysis of Advertising Appeals for Search  Engine Advert...
【DL輪読会】Aspect-based Analysis of Advertising Appeals for Search Engine Advert...
 
機械学習工学の進展と課題 2021
機械学習工学の進展と課題 2021機械学習工学の進展と課題 2021
機械学習工学の進展と課題 2021
 
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
 
居場所を隠すために差分プライバシーを使おう
居場所を隠すために差分プライバシーを使おう居場所を隠すために差分プライバシーを使おう
居場所を隠すために差分プライバシーを使おう
 
Introduction to PEG
Introduction to PEGIntroduction to PEG
Introduction to PEG
 
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
 
ラベル付けのいろは
ラベル付けのいろはラベル付けのいろは
ラベル付けのいろは
 
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
 
NLP2023 緊急パネル:ChatGPTで自然言語処理は終わるのか? 説明スライド
NLP2023 緊急パネル:ChatGPTで自然言語処理は終わるのか? 説明スライドNLP2023 緊急パネル:ChatGPTで自然言語処理は終わるのか? 説明スライド
NLP2023 緊急パネル:ChatGPTで自然言語処理は終わるのか? 説明スライド
 
分散型サイエンスにおけるバイオテックエコシステム.pptx
分散型サイエンスにおけるバイオテックエコシステム.pptx分散型サイエンスにおけるバイオテックエコシステム.pptx
分散型サイエンスにおけるバイオテックエコシステム.pptx
 

Plus de Kensuke Mitsuzawa (6)

サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27
 
サポーターズ勉強会スライド
サポーターズ勉強会スライドサポーターズ勉強会スライド
サポーターズ勉強会スライド
 
形態素解析器の比較できるPythonパッケージつくった話
形態素解析器の比較できるPythonパッケージつくった話形態素解析器の比較できるPythonパッケージつくった話
形態素解析器の比較できるPythonパッケージつくった話
 
slides for "Supervised Model Learning with Feature Grouping based on a Discre...
slides for "Supervised Model Learning with Feature Grouping based on a Discre...slides for "Supervised Model Learning with Feature Grouping based on a Discre...
slides for "Supervised Model Learning with Feature Grouping based on a Discre...
 
Learning to rankの評価手法
Learning to rankの評価手法Learning to rankの評価手法
Learning to rankの評価手法
 
Brml 3.3 d-separation
Brml 3.3 d-separationBrml 3.3 d-separation
Brml 3.3 d-separation
 

アダルトデータマイニングの勧め