SlideShare a Scribd company logo
1 of 14
Download to read offline
Programming
    Hive
 2.Getting Started
この章について
この章では、以下に関して説明します。
  ● Hadoop・Hiveのインストール方法
  ● Hadoop・Hiveの設定
  ● Hiveの提供する機能
  ● Hiveのコマンドに関して
仮想マシンのインストール
以下の4サイトで公開されている、仮想マシンを使えば、
HadoopやHiveがインストールされていて、すぐに実行可能な
環境が手に入る。
● Cloudera
● MapR
● Hortonworks
● Think Big Analytics
個別インストール

● Java
  ○ 1.6.X, 1.7.X
  ○ JREではなく、JDK
● Hadoop
  ○ 0.20.2推奨(性能・互換性)
● Hive
  ○ Hadoopのバージョンはあまり意識しなくても大丈夫
Hiveに同梱されているもの

● CLI
    ○ 対話型のHiveコマンド実行ツール
●   Server
    ○ Thrift、JDBC、ODBCを利用して、リモートアクセスを可能とする
      コンポーネント
● Metastore
    ○ デフォルトはDerbyだけど、シングルプロセス用
    ○ MysqlなどのRDBを利用する事も可能
●   HWI
    ○ Hiveにリモートアクセウする為のシンプルなWebインターフェー
      ス
Hiveを始める
Hiveコマンドを実行
  $HIVE_HOME/bin/hiveはCLIを起動する為のShellScript
  このコマンドを実行する事で、対話型にHiveコマンドを実行する事が
できる
  クエリは複数行にする事も可能
  デフォルトのDerbyのmetastoreは、作業ディレクトリにサブディレクト
リが作成され、そこに作成されるが、設定により場所変更は可能
Hiveの設定
基本的な設定
  個人的な設定は、$HOME/.hivercに記載
   ○   hive.metastore.warehouse.dir      Hiveテーブルの保存場所


メタストア関連
  DistributedModeで利用する場合は、JDBCのデータストアを利用を
推奨
  ※ メタストアの容量は小さいので、ハイスペックなサーバは不要
    ただし、レプリケーションなどを利用してSPOFを作らない
  ○ javax.jdo.option.ConnectionURL 接続先DBのURL
  ○    javax.jdo.option.ConnectionDiriverName   DBのドライバ名
  ○    javax.jdo.option.ConnectionUserName      接続先DBのユーザ名
  ○    javax.jdo.option.ConnectionPassword      接続先DBのパスワード
Hiveコマンド
コマンドオプション
   --help でオプションの一覧を参照可能

  --service name で指定のサービスを立ち上げる事が可能
  「name」には、cli, hiveserver, hwi, jar, metasotore, rcfilecatが指
定可能

  --auxpath でUDFなどの入ったJARファイルやJARのあるディレクト
リを指定する事が可能

   --config でconfのディレクトリを変更可能
Command-Line interface
コマンドオプション
  -d, --define でCLIで利用するKeyValueを設定
  NameSpaceにより、KeyValueは分けて保存されるが、上記コマンド
では、hivevarというNameSpaceに保存される
  NameSpaceは、hivevar, hiveconf, system, envがある
  KeyValueはJavaのStringで保存され、クエリ処理前にHiveによっ
て、置換される

  CLIでset を利用して、値の設定・参照を行う
  set に -v なしだと、全てのNameSpaceの設定値が表示される
  set に-v をつけると、HDFSやMapReduceの設定値が表示される
Command-Line interface
NameSpaceの説明
  hiveconf のNameSpaceには、ユーザが利用したい任意の値を保
存する(--hivevar key=value も可能)
  hiveconf のNameSpaceには、Hiveの振る舞いに関する値が保存さ
れる(--hiveconf key=value も可能)
  system のNameSpaceには、Javaのsystem関連の値が保存される
  env のNameSpaceには、環境変数関連の値が保存される
Command-Line interface
コマンドオプション
  -e でクエリを指定する事で、直接HiveQLを実行可能

  -S で「OK」や「Time taken...」の表示を抑制可能
  $ hive -S -e "set" | grep *****を利用すると、プロパティ名を探すの
に便利

   -f でファイルに記載されたHiveQLを実行
   HiveShellに入ってから、sourceコマンドでも同様にファイルから
HiveQLを実行できる
   "src"というテーブルを利用したサンプルを時々見かけるが、これは
不適切
   HiveのUnitTestでは、"src"を作成しており、いつでもある訳ではな
い。
Command-Line interface
コマンドオプション
  -i filename 指定されたファイルのHiveコマンドを実行してから、CLI
を起動
  $HOME/.hivercは、自動で読み込まれる
  ※コマンドの末尾には必ずセミコロンを付ける
Command-Line interface
その他の機能
  Tabキーを押す事で、キーワードや関数名がオートコンプリートで表
示される

  ↑↓キーで、ヒストリーを参照
  ただし、セミコロンまでの1クエリという単位でなく、1行単位で保存さ
れる
  $HOME/.hivehistoryに履歴は保存される

  ! を行頭につけると、ShellCommandを実行可能
  ただし、パイプやワイルドカードは利用できない
Command-Line interface
その他の機能
    dfs を行頭につけると、DFSコマンドを実行可能

    -- を行頭につけると、その行はコメント扱い

    hive.cli.print.header=trueを設定すると、結果の1行目にカラム名表
示

More Related Content

What's hot

Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013Cloudera Japan
 
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #520160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5Koichiro Sasaki
 
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013Cloudera Japan
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltToshihiro Suzuki
 
Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編IBM Analytics Japan
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とToru Takahashi
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中Satoshi Noto
 
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)Hadoop / Spark Conference Japan
 
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...Insight Technology, Inc.
 
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギングfluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギングYuichi Tateno
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門Insight Technology, Inc.
 
MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術yoku0825
 
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Cloudera Japan
 
Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)Yukinori Suda
 
MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03Aya Komuro
 
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wスケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wCloudera Japan
 
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13wIntroduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13wCloudera Japan
 

What's hot (20)

Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
 
20160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #520160121 データサイエンティスト協会 木曜セミナー #5
20160121 データサイエンティスト協会 木曜セミナー #5
 
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
 
Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編Db2 Warehouse Spark利用ガイド データ操作編
Db2 Warehouse Spark利用ガイド データ操作編
 
EmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤とEmbulkとDigdagとデータ分析基盤と
EmbulkとDigdagとデータ分析基盤と
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中
 
HBase at LINE
HBase at LINEHBase at LINE
HBase at LINE
 
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
 
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
 
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギングfluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
 
Apache Hive 紹介
Apache Hive 紹介Apache Hive 紹介
Apache Hive 紹介
 
MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術MySQLを割と一人で300台管理する技術
MySQLを割と一人で300台管理する技術
 
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
 
Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)Cloudera impalaの性能評価(Hiveとの比較)
Cloudera impalaの性能評価(Hiveとの比較)
 
MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03MySQL カジュアル 福岡 03
MySQL カジュアル 福岡 03
 
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wスケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
 
MapReduce入門
MapReduce入門MapReduce入門
MapReduce入門
 
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13wIntroduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
 

Similar to Hive chapter 2

TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTeruo Kawasaki
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介bigt23
 
Dbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortexDbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortexKoji Shinkubo
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちAdvancedTechNight
 
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみたHDPをWindowsで動かしてみた
HDPをWindowsで動かしてみたadachij2002
 
Hive undocumented feature
Hive undocumented featureHive undocumented feature
Hive undocumented featuretamtam180
 
OpenShift v3 Technical Overview
OpenShift v3 Technical OverviewOpenShift v3 Technical Overview
OpenShift v3 Technical OverviewNakayama Kenjiro
 
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Cloudera Japan
 
Open stack reference architecture v1 2
Open stack reference architecture v1 2Open stack reference architecture v1 2
Open stack reference architecture v1 2Dell TechCenter Japan
 
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみよう自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみようNaoyuki Sano
 
20161022 Linux on Azureの世界
20161022 Linux on Azureの世界20161022 Linux on Azureの世界
20161022 Linux on Azureの世界Takayoshi Tanaka
 
Hadoopのインストール
HadoopのインストールHadoopのインストール
HadoopのインストールNoritada Shimizu
 
Handlersocket etc. 20110906
Handlersocket etc. 20110906Handlersocket etc. 20110906
Handlersocket etc. 20110906akirahiguchi
 
PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理Kazuki Takai
 
Hadoop and Kerberos
Hadoop and KerberosHadoop and Kerberos
Hadoop and KerberosYuta Imai
 
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモHyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモwintechq
 
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...NTT DATA Technology & Innovation
 
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osakaCloudstack user group meeting in osaka
Cloudstack user group meeting in osakaNaotaka Jay HOTTA
 

Similar to Hive chapter 2 (20)

TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介
 
Dbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortexDbts2015 tokyo vector_in_hadoop_vortex
Dbts2015 tokyo vector_in_hadoop_vortex
 
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たちATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
 
HDPをWindowsで動かしてみた
HDPをWindowsで動かしてみたHDPをWindowsで動かしてみた
HDPをWindowsで動かしてみた
 
Hive undocumented feature
Hive undocumented featureHive undocumented feature
Hive undocumented feature
 
OpenShift v3 Technical Overview
OpenShift v3 Technical OverviewOpenShift v3 Technical Overview
OpenShift v3 Technical Overview
 
Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013Hadoopデータプラットフォーム #cwt2013
Hadoopデータプラットフォーム #cwt2013
 
Open stack reference architecture v1 2
Open stack reference architecture v1 2Open stack reference architecture v1 2
Open stack reference architecture v1 2
 
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみよう自分のPcに仮想環境を作ってlinuxをインストールしてみよう
自分のPcに仮想環境を作ってlinuxをインストールしてみよう
 
20161022 Linux on Azureの世界
20161022 Linux on Azureの世界20161022 Linux on Azureの世界
20161022 Linux on Azureの世界
 
Hadoopのインストール
HadoopのインストールHadoopのインストール
Hadoopのインストール
 
Handlersocket etc. 20110906
Handlersocket etc. 20110906Handlersocket etc. 20110906
Handlersocket etc. 20110906
 
PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理PowerShell を使用した Hyper-V の管理
PowerShell を使用した Hyper-V の管理
 
Hadoop and Kerberos
Hadoop and KerberosHadoop and Kerberos
Hadoop and Kerberos
 
WDD2012_SC-004
WDD2012_SC-004WDD2012_SC-004
WDD2012_SC-004
 
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモHyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
Hyper-V 仮想マシンをAzure ARMへV2C移行...のメモ
 
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
 
PHP on Cloud
PHP on CloudPHP on Cloud
PHP on Cloud
 
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osakaCloudstack user group meeting in osaka
Cloudstack user group meeting in osaka
 

Recently uploaded

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 

Recently uploaded (9)

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 

Hive chapter 2

  • 1. Programming Hive 2.Getting Started
  • 2. この章について この章では、以下に関して説明します。 ● Hadoop・Hiveのインストール方法 ● Hadoop・Hiveの設定 ● Hiveの提供する機能 ● Hiveのコマンドに関して
  • 4. 個別インストール ● Java ○ 1.6.X, 1.7.X ○ JREではなく、JDK ● Hadoop ○ 0.20.2推奨(性能・互換性) ● Hive ○ Hadoopのバージョンはあまり意識しなくても大丈夫
  • 5. Hiveに同梱されているもの ● CLI ○ 対話型のHiveコマンド実行ツール ● Server ○ Thrift、JDBC、ODBCを利用して、リモートアクセスを可能とする コンポーネント ● Metastore ○ デフォルトはDerbyだけど、シングルプロセス用 ○ MysqlなどのRDBを利用する事も可能 ● HWI ○ Hiveにリモートアクセウする為のシンプルなWebインターフェー ス
  • 6. Hiveを始める Hiveコマンドを実行 $HIVE_HOME/bin/hiveはCLIを起動する為のShellScript このコマンドを実行する事で、対話型にHiveコマンドを実行する事が できる クエリは複数行にする事も可能 デフォルトのDerbyのmetastoreは、作業ディレクトリにサブディレクト リが作成され、そこに作成されるが、設定により場所変更は可能
  • 7. Hiveの設定 基本的な設定 個人的な設定は、$HOME/.hivercに記載 ○ hive.metastore.warehouse.dir Hiveテーブルの保存場所 メタストア関連 DistributedModeで利用する場合は、JDBCのデータストアを利用を 推奨 ※ メタストアの容量は小さいので、ハイスペックなサーバは不要   ただし、レプリケーションなどを利用してSPOFを作らない ○ javax.jdo.option.ConnectionURL 接続先DBのURL ○ javax.jdo.option.ConnectionDiriverName DBのドライバ名 ○ javax.jdo.option.ConnectionUserName 接続先DBのユーザ名 ○ javax.jdo.option.ConnectionPassword 接続先DBのパスワード
  • 8. Hiveコマンド コマンドオプション --help でオプションの一覧を参照可能 --service name で指定のサービスを立ち上げる事が可能 「name」には、cli, hiveserver, hwi, jar, metasotore, rcfilecatが指 定可能 --auxpath でUDFなどの入ったJARファイルやJARのあるディレクト リを指定する事が可能 --config でconfのディレクトリを変更可能
  • 9. Command-Line interface コマンドオプション -d, --define でCLIで利用するKeyValueを設定 NameSpaceにより、KeyValueは分けて保存されるが、上記コマンド では、hivevarというNameSpaceに保存される NameSpaceは、hivevar, hiveconf, system, envがある KeyValueはJavaのStringで保存され、クエリ処理前にHiveによっ て、置換される CLIでset を利用して、値の設定・参照を行う set に -v なしだと、全てのNameSpaceの設定値が表示される set に-v をつけると、HDFSやMapReduceの設定値が表示される
  • 10. Command-Line interface NameSpaceの説明 hiveconf のNameSpaceには、ユーザが利用したい任意の値を保 存する(--hivevar key=value も可能) hiveconf のNameSpaceには、Hiveの振る舞いに関する値が保存さ れる(--hiveconf key=value も可能) system のNameSpaceには、Javaのsystem関連の値が保存される env のNameSpaceには、環境変数関連の値が保存される
  • 11. Command-Line interface コマンドオプション -e でクエリを指定する事で、直接HiveQLを実行可能 -S で「OK」や「Time taken...」の表示を抑制可能 $ hive -S -e "set" | grep *****を利用すると、プロパティ名を探すの に便利 -f でファイルに記載されたHiveQLを実行 HiveShellに入ってから、sourceコマンドでも同様にファイルから HiveQLを実行できる "src"というテーブルを利用したサンプルを時々見かけるが、これは 不適切 HiveのUnitTestでは、"src"を作成しており、いつでもある訳ではな い。
  • 12. Command-Line interface コマンドオプション -i filename 指定されたファイルのHiveコマンドを実行してから、CLI を起動 $HOME/.hivercは、自動で読み込まれる ※コマンドの末尾には必ずセミコロンを付ける
  • 13. Command-Line interface その他の機能 Tabキーを押す事で、キーワードや関数名がオートコンプリートで表 示される ↑↓キーで、ヒストリーを参照 ただし、セミコロンまでの1クエリという単位でなく、1行単位で保存さ れる $HOME/.hivehistoryに履歴は保存される ! を行頭につけると、ShellCommandを実行可能 ただし、パイプやワイルドカードは利用できない
  • 14. Command-Line interface その他の機能 dfs を行頭につけると、DFSコマンドを実行可能 -- を行頭につけると、その行はコメント扱い hive.cli.print.header=trueを設定すると、結果の1行目にカラム名表 示