Submit Search
Upload
Hive chapter 2
•
4 likes
•
2,002 views
M
masahiro_minami
Follow
Programming Hive book Chapter 2
Read less
Read more
Technology
Report
Share
Report
Share
1 of 14
Download now
Download to read offline
Recommended
MapReduceプログラミング入門
MapReduceプログラミング入門
Satoshi Noto
オライリーセミナー Hive入門 #oreilly0724
オライリーセミナー Hive入門 #oreilly0724
Cloudera Japan
5分でわかる Apache HBase 最新版 #hcj2014
5分でわかる Apache HBase 最新版 #hcj2014
Cloudera Japan
OpenStack + Common Lisp
OpenStack + Common Lisp
irix_jp
HDFS HA セミナー #hadoop
HDFS HA セミナー #hadoop
Cloudera Japan
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Sho Shimauchi
Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編
IBM Analytics Japan
CDH4.1オーバービュー
CDH4.1オーバービュー
Cloudera Japan
Recommended
MapReduceプログラミング入門
MapReduceプログラミング入門
Satoshi Noto
オライリーセミナー Hive入門 #oreilly0724
オライリーセミナー Hive入門 #oreilly0724
Cloudera Japan
5分でわかる Apache HBase 最新版 #hcj2014
5分でわかる Apache HBase 最新版 #hcj2014
Cloudera Japan
OpenStack + Common Lisp
OpenStack + Common Lisp
irix_jp
HDFS HA セミナー #hadoop
HDFS HA セミナー #hadoop
Cloudera Japan
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Sho Shimauchi
Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編
IBM Analytics Japan
CDH4.1オーバービュー
CDH4.1オーバービュー
Cloudera Japan
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Japan
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
Koichiro Sasaki
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera Japan
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編
IBM Analytics Japan
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
ただいまHadoop勉強中
ただいまHadoop勉強中
Satoshi Noto
HBase at LINE
HBase at LINE
Shun Nakamura
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
Insight Technology, Inc.
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術
yoku0825
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
Cloudera Japan
Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)
Yukinori Suda
MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03
Aya Komuro
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
Cloudera Japan
MapReduce入門
MapReduce入門
Satoshi Noto
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Cloudera Japan
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
Hadoopの紹介
Hadoopの紹介
bigt23
More Related Content
What's hot
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Japan
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
Koichiro Sasaki
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera Japan
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編
IBM Analytics Japan
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
ただいまHadoop勉強中
ただいまHadoop勉強中
Satoshi Noto
HBase at LINE
HBase at LINE
Shun Nakamura
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
Insight Technology, Inc.
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術
yoku0825
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
Cloudera Japan
Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)
Yukinori Suda
MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03
Aya Komuro
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
Cloudera Japan
MapReduce入門
MapReduce入門
Satoshi Noto
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Cloudera Japan
What's hot
(20)
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
ただいまHadoop勉強中
ただいまHadoop勉強中
HBase at LINE
HBase at LINE
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
Apache Hive 紹介
Apache Hive 紹介
MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)
MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
MapReduce入門
MapReduce入門
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Similar to Hive chapter 2
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
Hadoopの紹介
Hadoopの紹介
bigt23
Dbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortex
Koji Shinkubo
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
AdvancedTechNight
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
adachij2002
Hive undocumented feature
Hive undocumented feature
tamtam180
OpenShift v3 Technical Overview
OpenShift v3 Technical Overview
Nakayama Kenjiro
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
Open stack reference architecture v1 2
Open stack reference architecture v1 2
Dell TechCenter Japan
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
Naoyuki Sano
20161022 Linux on Azureの世界
20161022 Linux on Azureの世界
Takayoshi Tanaka
Hadoopのインストール
Hadoopのインストール
Noritada Shimizu
Handlersocket etc. 20110906
Handlersocket etc. 20110906
akirahiguchi
PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理
Kazuki Takai
Hadoop and Kerberos
Hadoop and Kerberos
Yuta Imai
WDD2012_SC-004
WDD2012_SC-004
Kuninobu SaSaki
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
wintechq
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
NTT DATA Technology & Innovation
PHP on Cloud
PHP on Cloud
Akio Katayama
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osaka
Naotaka Jay HOTTA
Similar to Hive chapter 2
(20)
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Hadoopの紹介
Hadoopの紹介
Dbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortex
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
Hive undocumented feature
Hive undocumented feature
OpenShift v3 Technical Overview
OpenShift v3 Technical Overview
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013
Open stack reference architecture v1 2
Open stack reference architecture v1 2
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
20161022 Linux on Azureの世界
20161022 Linux on Azureの世界
Hadoopのインストール
Hadoopのインストール
Handlersocket etc. 20110906
Handlersocket etc. 20110906
PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理
Hadoop and Kerberos
Hadoop and Kerberos
WDD2012_SC-004
WDD2012_SC-004
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
PHP on Cloud
PHP on Cloud
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osaka
Recently uploaded
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
Recently uploaded
(9)
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Hive chapter 2
1.
Programming
Hive 2.Getting Started
2.
この章について この章では、以下に関して説明します。 ●
Hadoop・Hiveのインストール方法 ● Hadoop・Hiveの設定 ● Hiveの提供する機能 ● Hiveのコマンドに関して
3.
仮想マシンのインストール 以下の4サイトで公開されている、仮想マシンを使えば、 HadoopやHiveがインストールされていて、すぐに実行可能な 環境が手に入る。 ● Cloudera ● MapR ●
Hortonworks ● Think Big Analytics
4.
個別インストール ● Java
○ 1.6.X, 1.7.X ○ JREではなく、JDK ● Hadoop ○ 0.20.2推奨(性能・互換性) ● Hive ○ Hadoopのバージョンはあまり意識しなくても大丈夫
5.
Hiveに同梱されているもの ● CLI
○ 対話型のHiveコマンド実行ツール ● Server ○ Thrift、JDBC、ODBCを利用して、リモートアクセスを可能とする コンポーネント ● Metastore ○ デフォルトはDerbyだけど、シングルプロセス用 ○ MysqlなどのRDBを利用する事も可能 ● HWI ○ Hiveにリモートアクセウする為のシンプルなWebインターフェー ス
6.
Hiveを始める Hiveコマンドを実行 $HIVE_HOME/bin/hiveはCLIを起動する為のShellScript
このコマンドを実行する事で、対話型にHiveコマンドを実行する事が できる クエリは複数行にする事も可能 デフォルトのDerbyのmetastoreは、作業ディレクトリにサブディレクト リが作成され、そこに作成されるが、設定により場所変更は可能
7.
Hiveの設定 基本的な設定 個人的な設定は、$HOME/.hivercに記載
○ hive.metastore.warehouse.dir Hiveテーブルの保存場所 メタストア関連 DistributedModeで利用する場合は、JDBCのデータストアを利用を 推奨 ※ メタストアの容量は小さいので、ハイスペックなサーバは不要 ただし、レプリケーションなどを利用してSPOFを作らない ○ javax.jdo.option.ConnectionURL 接続先DBのURL ○ javax.jdo.option.ConnectionDiriverName DBのドライバ名 ○ javax.jdo.option.ConnectionUserName 接続先DBのユーザ名 ○ javax.jdo.option.ConnectionPassword 接続先DBのパスワード
8.
Hiveコマンド コマンドオプション
--help でオプションの一覧を参照可能 --service name で指定のサービスを立ち上げる事が可能 「name」には、cli, hiveserver, hwi, jar, metasotore, rcfilecatが指 定可能 --auxpath でUDFなどの入ったJARファイルやJARのあるディレクト リを指定する事が可能 --config でconfのディレクトリを変更可能
9.
Command-Line interface コマンドオプション
-d, --define でCLIで利用するKeyValueを設定 NameSpaceにより、KeyValueは分けて保存されるが、上記コマンド では、hivevarというNameSpaceに保存される NameSpaceは、hivevar, hiveconf, system, envがある KeyValueはJavaのStringで保存され、クエリ処理前にHiveによっ て、置換される CLIでset を利用して、値の設定・参照を行う set に -v なしだと、全てのNameSpaceの設定値が表示される set に-v をつけると、HDFSやMapReduceの設定値が表示される
10.
Command-Line interface NameSpaceの説明
hiveconf のNameSpaceには、ユーザが利用したい任意の値を保 存する(--hivevar key=value も可能) hiveconf のNameSpaceには、Hiveの振る舞いに関する値が保存さ れる(--hiveconf key=value も可能) system のNameSpaceには、Javaのsystem関連の値が保存される env のNameSpaceには、環境変数関連の値が保存される
11.
Command-Line interface コマンドオプション
-e でクエリを指定する事で、直接HiveQLを実行可能 -S で「OK」や「Time taken...」の表示を抑制可能 $ hive -S -e "set" | grep *****を利用すると、プロパティ名を探すの に便利 -f でファイルに記載されたHiveQLを実行 HiveShellに入ってから、sourceコマンドでも同様にファイルから HiveQLを実行できる "src"というテーブルを利用したサンプルを時々見かけるが、これは 不適切 HiveのUnitTestでは、"src"を作成しており、いつでもある訳ではな い。
12.
Command-Line interface コマンドオプション
-i filename 指定されたファイルのHiveコマンドを実行してから、CLI を起動 $HOME/.hivercは、自動で読み込まれる ※コマンドの末尾には必ずセミコロンを付ける
13.
Command-Line interface その他の機能
Tabキーを押す事で、キーワードや関数名がオートコンプリートで表 示される ↑↓キーで、ヒストリーを参照 ただし、セミコロンまでの1クエリという単位でなく、1行単位で保存さ れる $HOME/.hivehistoryに履歴は保存される ! を行頭につけると、ShellCommandを実行可能 ただし、パイプやワイルドカードは利用できない
14.
Command-Line interface その他の機能
dfs を行頭につけると、DFSコマンドを実行可能 -- を行頭につけると、その行はコメント扱い hive.cli.print.header=trueを設定すると、結果の1行目にカラム名表 示
Download now