SlideShare une entreprise Scribd logo
1  sur  18
Gunosyにおける仮説検証とABテスト
株式会社Gunosy メディア事業本部
小澤俊介
2018.9.11
2©Gunosy Inc.
自己紹介
● 小澤俊介(こざわしゅんすけ)
○ skozawa (twitter: @5kozawa)
● Gunosy メディア事業本部 ルクラ事業部
○ データ分析、ロジック開発全般
3©Gunosy Inc.
はじめに
● グノシーではプロダクト改善のために、日々、仮説検証を回
し、効果測定を行なっている
○ 機能追加、アルゴリズム変更、UI変更など
● ニュースアプリのため、記事の質や季節要因などの影響を受
けやすい
● データに予期しないノイズが乗り、計測が困難になる
○ e.g 機能実装後にバグが発生し、実装により効果が上が
ったのか確認できない
4©Gunosy Inc.
効果測定(よくない例)
5©Gunosy Inc.
効果測定(よくない例)
6©Gunosy Inc.
効果測定(よくない例)
7©Gunosy Inc.
ABテスト
特定のアルゴリズムやUIを2種類用意し、ユーザ毎に出し分け
て検証する
メリット
● 時間変化などのノイズが入りにくい
● 最適化すべきメトリクスが決まってさえいれば
単純なクロス集計で済む
8©Gunosy Inc.
効果測定
9©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
10©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
価値仮説シートを利用
価値仮説シート
(ユーザ) は
(欲求) (し)たいが、
(課題) (でき)ないの
で、
(製品の特徴) (こと)に価値がある
https://speakerdeck.com/katsuma/service-development-for-users?slide=36
価値仮説シート(仮)
ユーザは
好きなメディアの最新記事をチェックしたいが、
メディアで絞って記事を読めないので、
メディアごとの記事閲覧機能に価値がある
LUCRAでの施策:フォロータブの改善
11©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
KPIを決める
● 継続率
● 記事クリック数
● メディアフォロー数
など
12©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
● KPIに基づいてエンジニア
(サーバ、クライアント)
がログを設計
● 分析チームでレビュー
○ KPIの項目が分析できるかど
うか
○ その他、追加で分析したい項
目があるかどうか
13©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
● 以前はuser idを割った値を
利用
○ テストが複数同時に走るとバ
イアスがかかる可能性がある
○ e.g. 同じ人がコントロールに
当たる
● 現在はuser idのハッシュ関
数を利用して割り当て
○ 詳細:ABテストの対象をいい感
じに割り振る方法
14©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
15©Gunosy Inc.
システム全体像
ABテストAPI
Kinesis redshift
16©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
● KPIを集計
○ redshift, presto, athena,
BigQueryなど
○ AB集計用のredashのダッシ
ュボードを作成
■ 中間テーブルを生成して
A/Bテストの集計を効率化
する
● サンプルサイズ確認
○ 効果量、有意水準、検出力か
ら算出
17©Gunosy Inc.
開発/仮説検証の流れ
1. 仮説を立てる
2. 指標を決める
3. ログの設計
4. ABテスト対象ユーザの選定
5. 実装、リリース
6. 集計
7. 可否決定
● 集計結果を分析
○ 分析は施策オーナー主体
○ 分析チームがサポート
● レポーティング
○ コンフル
● 次のアクションを決める
○ ABの拡大、棄却
○ 追加分析
18©Gunosy Inc.
まとめ
● グノシーでの仮説検証の紹介
○ LUCRAでの事例

Contenu connexe

Tendances

組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで
Shunji Umetani
 

Tendances (20)

Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
 
グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題
 
機械学習のための数学のおさらい
機械学習のための数学のおさらい機械学習のための数学のおさらい
機械学習のための数学のおさらい
 
組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで
 
データベース設計徹底指南
データベース設計徹底指南データベース設計徹底指南
データベース設計徹底指南
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論
 
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
 
関数型・オブジェクト指向 宗教戦争に疲れたなたに送るGo言語入門
関数型・オブジェクト指向宗教戦争に疲れたなたに送るGo言語入門関数型・オブジェクト指向宗教戦争に疲れたなたに送るGo言語入門
関数型・オブジェクト指向 宗教戦争に疲れたなたに送るGo言語入門
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
 
ML system design_pattern
ML system design_patternML system design_pattern
ML system design_pattern
 
PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門
 
大学3年生の僕に伝えたいことをつらつらと
大学3年生の僕に伝えたいことをつらつらと大学3年生の僕に伝えたいことをつらつらと
大学3年生の僕に伝えたいことをつらつらと
 
BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装
 
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
 
リーンスタートアップにおける良い仮説、悪い仮説
リーンスタートアップにおける良い仮説、悪い仮説リーンスタートアップにおける良い仮説、悪い仮説
リーンスタートアップにおける良い仮説、悪い仮説
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 

Similaire à Gunosyにおける仮説検証とABテスト

第2回 継続率経営セミナー 公開資料:データの設計・取得について
第2回 継続率経営セミナー 公開資料:データの設計・取得について第2回 継続率経営セミナー 公開資料:データの設計・取得について
第2回 継続率経営セミナー 公開資料:データの設計・取得について
pLucky
 
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
Cybozucommunity
 

Similaire à Gunosyにおける仮説検証とABテスト (20)

[Japan Tech summit 2017] PRD010
[Japan Tech summit 2017] PRD010[Japan Tech summit 2017] PRD010
[Japan Tech summit 2017] PRD010
 
20140825_spapps
20140825_spapps20140825_spapps
20140825_spapps
 
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
 
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
 
第2回 継続率経営セミナー 公開資料:データの設計・取得について
第2回 継続率経営セミナー 公開資料:データの設計・取得について第2回 継続率経営セミナー 公開資料:データの設計・取得について
第2回 継続率経営セミナー 公開資料:データの設計・取得について
 
約1000サービスの実績から見えた「UXを可視化するユーザーテストの極意」 先生:平石 大祐
約1000サービスの実績から見えた「UXを可視化するユーザーテストの極意」  先生:平石 大祐約1000サービスの実績から見えた「UXを可視化するユーザーテストの極意」  先生:平石 大祐
約1000サービスの実績から見えた「UXを可視化するユーザーテストの極意」 先生:平石 大祐
 
googleアナリティクス研究課題①
googleアナリティクス研究課題①googleアナリティクス研究課題①
googleアナリティクス研究課題①
 
今後10年の機械学習ビジネスの可能性
今後10年の機械学習ビジネスの可能性今後10年の機械学習ビジネスの可能性
今後10年の機械学習ビジネスの可能性
 
JaSST Tokyo 2022 アジャイルソフトウェア開発への統計的品質管理の応用
JaSST Tokyo 2022 アジャイルソフトウェア開発への統計的品質管理の応用JaSST Tokyo 2022 アジャイルソフトウェア開発への統計的品質管理の応用
JaSST Tokyo 2022 アジャイルソフトウェア開発への統計的品質管理の応用
 
MAJINを支えるフロントエンド技術
MAJINを支えるフロントエンド技術MAJINを支えるフロントエンド技術
MAJINを支えるフロントエンド技術
 
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理
 
2014/06/13 若手Webエンジニア交流会発表資料「博士課程の新卒エンジニアがデータ分析環境を作った話」
2014/06/13 若手Webエンジニア交流会発表資料「博士課程の新卒エンジニアがデータ分析環境を作った話」2014/06/13 若手Webエンジニア交流会発表資料「博士課程の新卒エンジニアがデータ分析環境を作った話」
2014/06/13 若手Webエンジニア交流会発表資料「博士課程の新卒エンジニアがデータ分析環境を作った話」
 
バグ票システム立ち上げに必要なコト
バグ票システム立ち上げに必要なコトバグ票システム立ち上げに必要なコト
バグ票システム立ち上げに必要なコト
 
LT.19 BigQueryとGoogleスプレッドシートで作る格安BI
LT.19 BigQueryとGoogleスプレッドシートで作る格安BILT.19 BigQueryとGoogleスプレッドシートで作る格安BI
LT.19 BigQueryとGoogleスプレッドシートで作る格安BI
 
MIO Prediction Engine(仮) with モブキャスト on GCP
MIO Prediction Engine(仮) with モブキャスト on GCPMIO Prediction Engine(仮) with モブキャスト on GCP
MIO Prediction Engine(仮) with モブキャスト on GCP
 
20170208 biファーストステップ
20170208 biファーストステップ20170208 biファーストステップ
20170208 biファーストステップ
 
LOGLY会社概要.pdf
LOGLY会社概要.pdfLOGLY会社概要.pdf
LOGLY会社概要.pdf
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ
 
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
電通、リクルート、サントリーショッピングクラブ、有名企業がいち早く選んだ kintone を徹底解説
 
OpManager導入事例 日テレITプロデュース様
OpManager導入事例 日テレITプロデュース様OpManager導入事例 日テレITプロデュース様
OpManager導入事例 日テレITプロデュース様
 

Plus de Shunsuke Kozawa

Plus de Shunsuke Kozawa (10)

Gunosyにおけるパーソナライズシステム
GunosyにおけるパーソナライズシステムGunosyにおけるパーソナライズシステム
Gunosyにおけるパーソナライズシステム
 
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
 
Elasticsearch in hatena bookmark
Elasticsearch in hatena bookmarkElasticsearch in hatena bookmark
Elasticsearch in hatena bookmark
 
Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成
 
はてなブックマークに基づく関連記事レコメンドエンジンの開発
はてなブックマークに基づく関連記事レコメンドエンジンの開発はてなブックマークに基づく関連記事レコメンドエンジンの開発
はてなブックマークに基づく関連記事レコメンドエンジンの開発
 
はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用
 
Heady news headline abstraction through event pattern clustering
Heady  news headline abstraction through event pattern clusteringHeady  news headline abstraction through event pattern clustering
Heady news headline abstraction through event pattern clustering
 
Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...
 
Joint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsJoint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweets
 
Topical keyphrase extraction from twitter
Topical keyphrase extraction from twitterTopical keyphrase extraction from twitter
Topical keyphrase extraction from twitter
 

Dernier

Dernier (11)

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

Gunosyにおける仮説検証とABテスト

Notes de l'éditeur

  1. https://techlife.cookpad.com/entry/2016/09/26/111601