Soumettre la recherche
Mettre en ligne
Google bigquery導入記
•
6 j'aime
•
2,721 vues
Yugo Shimizu
Suivre
GCS2015 ゲームサーバー勉強会 セッションで発表した内容です。
Lire moins
Lire la suite
Technologie
Signaler
Partager
Signaler
Partager
1 sur 45
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Platform - Japan
Log collect with google fluentd
Log collect with google fluentd
Zaki_XL
Google BigQuery クエリの処理の流れ - #bq_sushi
Google BigQuery クエリの処理の流れ - #bq_sushi
Google Cloud Platform - Japan
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現する
Kiyoshi Fukuda
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
Google Cloud のネットワークとロードバランサ
Google Cloud のネットワークとロードバランサ
Google Cloud Platform - Japan
[Cloud OnAir] 安心して GCP を使うための処方箋 ~ 実際のインシデントをもとに ~ 2019年11月14日 放送
[Cloud OnAir] 安心して GCP を使うための処方箋 ~ 実際のインシデントをもとに ~ 2019年11月14日 放送
Google Cloud Platform - Japan
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud Platform - Japan
Recommandé
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Dataflow を理解する - #bq_sushi
Google Cloud Platform - Japan
Log collect with google fluentd
Log collect with google fluentd
Zaki_XL
Google BigQuery クエリの処理の流れ - #bq_sushi
Google BigQuery クエリの処理の流れ - #bq_sushi
Google Cloud Platform - Japan
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現する
Kiyoshi Fukuda
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
Google Cloud のネットワークとロードバランサ
Google Cloud のネットワークとロードバランサ
Google Cloud Platform - Japan
[Cloud OnAir] 安心して GCP を使うための処方箋 ~ 実際のインシデントをもとに ~ 2019年11月14日 放送
[Cloud OnAir] 安心して GCP を使うための処方箋 ~ 実際のインシデントをもとに ~ 2019年11月14日 放送
Google Cloud Platform - Japan
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud Platform - Japan
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
Google Cloud Platform - Japan
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
Google Cloud Platform - Japan
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
Google Cloud Platform - Japan
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
Google Cloud Platform - Japan
BigQuery 使ってみよう
BigQuery 使ってみよう
Noriko Takiguchi
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
Google Cloud Platform - Japan
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud Platform - Japan
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
Google Cloud Platform - Japan
BigQueryを始めてみよう - Google Analytics データを活用する
BigQueryを始めてみよう - Google Analytics データを活用する
Google Cloud Platform - Japan
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
Kentaro Yoshida
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
Google Cloud Platform - Japan
#bq_sushi #17 dataform使ってみたよ
#bq_sushi #17 dataform使ってみたよ
さとる なかむら
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
Google Cloud Platform - Japan
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
Google Cloud Platform - Japan
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
Google Cloud Platform - Japan
sbc_rc_200_RealtimeCompute_handson_ver1.0
sbc_rc_200_RealtimeCompute_handson_ver1.0
洋 謝
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
Google Cloud Platform - Japan
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
AWSで作る分析基盤
AWSで作る分析基盤
Yu Otsubo
Contenu connexe
Tendances
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
Google Cloud Platform - Japan
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
Google Cloud Platform - Japan
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
Google Cloud Platform - Japan
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
Google Cloud Platform - Japan
BigQuery 使ってみよう
BigQuery 使ってみよう
Noriko Takiguchi
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
Google Cloud Platform - Japan
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud Platform - Japan
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
Google Cloud Platform - Japan
BigQueryを始めてみよう - Google Analytics データを活用する
BigQueryを始めてみよう - Google Analytics データを活用する
Google Cloud Platform - Japan
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
Kentaro Yoshida
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
Google Cloud Platform - Japan
#bq_sushi #17 dataform使ってみたよ
#bq_sushi #17 dataform使ってみたよ
さとる なかむら
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
Google Cloud Platform - Japan
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
Google Cloud Platform - Japan
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
Google Cloud Platform - Japan
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
Google Cloud Platform - Japan
sbc_rc_200_RealtimeCompute_handson_ver1.0
sbc_rc_200_RealtimeCompute_handson_ver1.0
洋 謝
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
Google Cloud Platform - Japan
Tendances
(20)
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
[Cloud OnAir ] #03 No-ops で大量データ処理基盤を簡単に構築する
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
BigQuery 使ってみよう
BigQuery 使ってみよう
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
[Cloud OnAir] Bigtable に迫る!基本機能も含めユースケースまで丸ごと紹介 2018年8月30日 放送
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
[Cloud OnAir] オンプレミスにあるデータを GCP で分析する前に知っておきたいアーキテクチャ 2019年5月30日 放送
BigQueryを始めてみよう - Google Analytics データを活用する
BigQueryを始めてみよう - Google Analytics データを活用する
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
[Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2018年11月8日 放送
#bq_sushi #17 dataform使ってみたよ
#bq_sushi #17 dataform使ってみたよ
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
[Cloud OnAir] クラウド移行後の最適化方法を伝授。でも最適化ってなんですか? (LIVE) 2018年2月8日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
[Cloud OnAir] Google Kubernetes Engine と Cloud Spanner の紹介 2020 年 1 月 30 日放送
sbc_rc_200_RealtimeCompute_handson_ver1.0
sbc_rc_200_RealtimeCompute_handson_ver1.0
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
Similaire à Google bigquery導入記
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
AWSで作る分析基盤
AWSで作る分析基盤
Yu Otsubo
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
Takumi Sakamoto
20141220 clrh etw
20141220 clrh etw
Takayoshi Tanaka
Azure Data Explorer
Azure Data Explorer
Daisuke Masubuchi
[大図解]ピグライフはこう動いている
[大図解]ピグライフはこう動いている
Akihiro Kuwano
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
Oshitari_kochi
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
ソーシャルゲームログ解析基盤のMongoDB活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例
知教 本間
Azure Datalake 大全
Azure Datalake 大全
Daiyu Hatakeyama
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
Insight Technology, Inc.
PHP on Cloud
PHP on Cloud
Akio Katayama
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
Akihiro Kuwano
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
Google Cloud Platform - Japan
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
de:code 2017
BP Study #16
BP Study #16
Toshiaki Baba
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
Amazon Web Services Japan
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
Daiyu Hatakeyama
【第21回Elasticsearch勉強会】aws環境に合わせてelastic stackをログ分析基盤として構築した話
【第21回Elasticsearch勉強会】aws環境に合わせてelastic stackをログ分析基盤として構築した話
Hibino Hisashi
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
Similaire à Google bigquery導入記
(20)
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
AWSで作る分析基盤
AWSで作る分析基盤
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
20141220 clrh etw
20141220 clrh etw
Azure Data Explorer
Azure Data Explorer
[大図解]ピグライフはこう動いている
[大図解]ピグライフはこう動いている
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
ソーシャルゲームログ解析基盤のMongoDB活用事例
ソーシャルゲームログ解析基盤のMongoDB活用事例
Azure Datalake 大全
Azure Datalake 大全
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
PHP on Cloud
PHP on Cloud
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
[DI07] あらゆるデータに価値がある! アンチ断捨離ストのための Azure Data Lake
BP Study #16
BP Study #16
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
【第21回Elasticsearch勉強会】aws環境に合わせてelastic stackをログ分析基盤として構築した話
【第21回Elasticsearch勉強会】aws環境に合わせてelastic stackをログ分析基盤として構築した話
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Plus de Yugo Shimizu
ソーシャルゲームの課金認証共通基盤をどう設計したか
ソーシャルゲームの課金認証共通基盤をどう設計したか
Yugo Shimizu
大規模ログ集約実現のためのアーキテクチャ
大規模ログ集約実現のためのアーキテクチャ
Yugo Shimizu
リアルタイムサーバー 〜Erlang/OTPで作るPubSubサーバー〜
リアルタイムサーバー 〜Erlang/OTPで作るPubSubサーバー〜
Yugo Shimizu
分割と整合性と戦う
分割と整合性と戦う
Yugo Shimizu
サーバーサイドボトルネックの探し方
サーバーサイドボトルネックの探し方
Yugo Shimizu
サーバーのおしごと
サーバーのおしごと
Yugo Shimizu
Plus de Yugo Shimizu
(6)
ソーシャルゲームの課金認証共通基盤をどう設計したか
ソーシャルゲームの課金認証共通基盤をどう設計したか
大規模ログ集約実現のためのアーキテクチャ
大規模ログ集約実現のためのアーキテクチャ
リアルタイムサーバー 〜Erlang/OTPで作るPubSubサーバー〜
リアルタイムサーバー 〜Erlang/OTPで作るPubSubサーバー〜
分割と整合性と戦う
分割と整合性と戦う
サーバーサイドボトルネックの探し方
サーバーサイドボトルネックの探し方
サーバーのおしごと
サーバーのおしごと
Google bigquery導入記
1.
Google BigQuery導入記
2.
自己紹介 @yamionp gumi ってところでエンジニアやってます Python歴約3年 サーバーさわりはじめて約10年
3.
関わったもの
4.
アジェンダ ログについて BigQueryに入れる BigQueryを使う
5.
ログ
6.
いろんなログ OSなどのシステムログ DBのログ nginxのアクセス/エラーログ ルーターなどネットワークレイヤーのログ pythonで発行するログ ユーザーの行動ログ
7.
構成 DB LB App KVS MQ Job
8.
どこに保存してますか?
9.
ログの保存先? ファイル RDB S3 DWH Elasticsearch
10.
データが大きくなると… 検索をしたいが遅い 集計をしたいが終わらない/落ちる 保存先の特性(Elasticsearch/DWH等)にくわしくないと 死ぬ 保存先の容量が足りなくなる。移動も大変
11.
そこで
12.
13.
なにがすごいか 120億行(414GB)のデータにクエリを投げても5秒 (フルスキャン+正規表現によるフィルタ+集計) データ操作にはSQLが使える てきとーなSQLを書いても動く (賢いSQLでなくても使える) JSONを入れられるのでスキーマレスに使える しかも安い(無料枠もかなりある
14.
ログを集める
15.
16.
App Log Job &
17.
App Log Job log-bigquery &
18.
fluent-plugin-bigqueryを使用 バッファリングしながら指定Tableにログを流せる 自作fluent pluginでjson化してフォーマットを える
19.
time tag message int
string string [ { "name": "tag", "type": "string" }, { "name": "time", "type": "integer" }, { "name": "message", "type": "string" } ] JSON
20.
Log log-bigquery http record_serializer bigquery JSON化
21.
use_ite 1434249466 {“count”:”1","uid":"userxxxx","success":"True","event_id":"No ne","item_id":"12","item_type":"ITEM","user_level":"None","d evice":"SP_iPhone","id":"xxxxxx"} use_item
1434249604 {“count”:”1","uid":"userxxxx","success":"True","event_id":"No ne","item_id":"12","item_type":"ITEM","user_level":"None","d evice":"SP_iPhone","id":"yyyyy"} use_item 1434249951 {“count”:”1","uid":"userxxxx","success":"True","event_id":"No ne","item_id":"12","item_type":"ITEM","user_level":"None","d evice":"SP_iPhone","id":"zzzzz"}
22.
23.
使い方
24.
実行結果 SQLエディタ CSV DL BigQuery Tableとして保存
25.
SELECT JSON_EXTRACT_SCALAR(message, "$.uid") as
user_id, JSON_EXTRACT_SCALAR(message, "$.item_id") as item_id, DATE_ADD(STRFTIME_UTC_USEC(time*1000000, "%Y-%m-%d %H:00"), 9, "HOUR") as timestamp FROM (TABLE_DATE_RANGE_STRICT( use_item_, DATE_ADD(CURRENT_TIMESTAMP(), -7, "DAY"), DATE_ADD(CURRENT_TIMESTAMP(), -1, "DAY"))) JSON Path風に指定 Datetimeに変換 &TimeZone補正 間近1週間分のTableから取得
26.
料金のかかり方 ストレージ $0.020 /
GB 転送量 $0.01 / 100,000 row 8/12から $0.01 / 200 MB クエリ課金 $5 / TB 100Gだと$0.05
27.
クエリ課金の節約術 Tableは日付で分ける 複数TableをつなげてFROMに指定する関数がある 種類ごとにもTableを分ける 同じスキーマで良い。またがって取得したい場合 はUNIONなどで繋げられる。
28.
Table分割 BigQueryにはTableあたりのInsert速度の制限がある 別Tableなら問題ない fluent-plugin-bigqueryはこのTable分割に対応している InsertにTableがなければ指定したスキーマで自動生成
29.
なにがすごいか 120億行(414GB)のデータにクエリを投げても5秒 (フルスキャン+正規表現によるフィルタ+集計) データ操作にはSQLが使える てきとーなSQLを書いても動く (賢いSQLでなくても使える) JSONを入れられるのでスキーマレスに使える しかも安い(無料枠もかなりある
30.
ある日
31.
今日のデータが見れないという報告 調べると特定日以降のTableが作られていない 特に環境の変更はしていない とくにBigQueryのアナウンスもない
32.
33.
https://github.com/kaizenplatform/fluent-plugin-bigquery/commit/ d81e002635797e2b946ee2be151bf029666f320b
34.
ファイルから流し込みなおして対応orz
35.
教訓 バックアップは常に用意する どこかで何かあってもS3に上がっているという安心 エラーメッセージに依存した実装の危険性
36.
可視化
37.
ModeAnalytics
38.
ModeAnalyticsとは イカした感じの解析ツール Webベース SQLを登録する → グラフになる シンプル! 編集者あたり
$249/m 閲覧ユーザーは無料
39.
40.
41.
できます スケジュール実行 実行結果の保存 レポートの加工(HTML風) 複数クエリの結果を複合したレポートの作成
42.
43.
App Log Job log-bigquery & BigQuery
44.
まとめ BigQueryは簡単なSQLさえあればすぐに使える JSONで突っ込むことでスキーマレスに運用可能 Tableはたくさん。スキーマは一つ。 バックアップとしてのファイル保存は残した方が良い
45.
ご静聴ありがとうございました
Télécharger maintenant