SlideShare une entreprise Scribd logo
1  sur  35
Télécharger pour lire hors ligne
Batasan
Pengenalan
HiveQL
EoF
Apache Hive
Sekilas mengenai Apache Hive
Kalamangga.Net
Bagian Riset dan Pengembangan
Februari 2016
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Batasan
Perangkat
Distribusi Cloudera : CDH 5.2.4
OS : CentOS 6.5
Penempatan data pada HDFS
Web
https://hive.apache.org
https://cwiki.apache.org/confluence/display/Hive
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Apache itu Hive?
Apache itu Hive?
Sebuah proyek pada Yayasan Apache yang memiliki fungsi
sebagai gudang data data warehouse.
Dikembangkan di atas platform Apache Hadoop.
Pada awal pengembangan merupakan sub-proyek dari
Apache Hadoop.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Bagaimana penggunaan Hive?
Bagaimana penggunaan Hive?
Umumnya digunakan pada proses ETL.
Memberikan struktur data pada berbagai format berkas.
Mengakses data langsung dari HDFS atau HBase.
Sebagai gudang data.
Manajemen data.
Analisis data.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Bagaimana data dikelola?
Data dapat dikelompokkan ke dalam database.
Bila tidak ditentukan, database ’default’ akan digunakan.
Data disimpan pada HDFS di lokasi sesuai konfigurasi
’hive.metastore.warehouse.dir’, konfigurasi
standar menunjuk lokasi ’/user/hive/warehouse’
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Bagaimana data dikelola?
Tabel pada Hive mirip dengan konsep tabel pada RDBMS.
Setiap tabel diasosiasikan dengan sebuah direktori pada
HDFS.
Misal : tabel ’pegawai’ pada database default
diasosiasikan dengan direktori
’/user/hive/warehouse/pegawai’ di HDFS.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Bagaimana data dikelola?
Tabel internal.
Tabel yang dimiliki oleh Hive.
Pengaturan tabel dan data sepenuhnya oleh Hive.
Tabel eksternal.
Hive hanya dapat mengatur tabel.
Data diatur oleh perangkat / mekanisme lain.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Numerik.
TINYINT.
SMALLINT.
INT.
BIGINT.
FLOAT.
DOUBLE.
DECIMAL.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Waktu.
TIMESTAMP.
DATE.
String.
STRING.
VARCHAR.
CHAR.
Boolean.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Apa itu Hive?
Bagaimana penggunaan Hive?
Bagaimana data dikelola?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Apa saja tipe data yang didukung?
Binary.
Kompleks.
Arrays.
Maps.
Structs.
Named Struct.
Union.
Boolean.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Pengenalan
Pengenalan
Apache Hive dapat melakukan query pada data yang
disimpan dalam HDFS.
Untuk melakukan query, Hive menyediakan bahasa SQL
yang disebut Hive Query Language disingkat (HiveQL
atau HQL).
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DDL
Data Definition Language
Database.
CREATE DATABASE.
COMMENT
LOCATION
WITH DBPROPERTIES
SHOW DATABASE.
LIKE ’*’
DESCRIBE DATABASE.
USE.
DROP.
ALTER
SET DBPROPERTIES
SET OWNER USER
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DDL
Data Definition Language
Tabel.
CREATE TABLE.
ROW FORMAT DELIMITED
FIELDS TERMINATED BY
COLLECTION ITEMS TERMINATED BY
MAP KEYS TERMINATED BY
STORED AS
AS (CTAS)
LIKE
PARTITIONED BY
INSERT INTO TABLE
DROP TABLE
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DSL
Data Selection Language
SELECT.
FROM
WHERE
LIMIT
Sub Query
IN
NOT IN
EXIST
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DSL
Data Selection Language
Join.
INNER JOIN
LEFT OUTER JOIN
RIGHT OUTER JOIN
FULL OUTER JOIN
CROSS JOIN
UNION ALL.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DML
Data Manipulation Language
LOAD DATA.
LOCAL
INPATH
OVERWRITE
INTO
INSERT.
INTO TABLE
OVERWRITE
LOCAL DIRECTORY
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
DML
Data Manipulation Language
EXPORT TABLE ... TO ...
IMPORT TABLE ... FROM ...
ORDER.
SORT.
Built-in Functions.
SHOW FUNCTIONS
DESCRIBE FUNCTIONS
EXTENDED
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Data Aggregation
COUNT.
MAX.
MIN.
AVG.
GROUPING SETS.
ROLLUP.
CUBE.
GROUP BY.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Data Aggregation
Kondisional.
CASE WHEN
COALESCE
IF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Data Aggregation
Fungsi analisis.
RANK
DENSE_RANK
ROW_NUMBER
CUME_DIST
PERCENT_RANK
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Data Aggregation
Fungsi analisis.
NTILE
LEAD
LAG
FIRST_VALUE
LAST_VALUE
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
Outline
1 Batasan
2 Pengenalan
Definisi
Penggunaan
Pengelolaan Data
Tipe Data
3 HiveQL
DDL (Data Definition Language)
DSL (Data Selection Language)
DML (Data Manipulation Language)
Data Aggregation
User-Defined Function
4 EoF
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
UDF
User-Defined Function
Temporary.
CREATE TEMPORARY FUNCTION function_name AS
class_name
DROP TEMPORARY FUNCTION [IF EXISTS]
function_name
Permanen.
CREATE FUNCTION [db_name].function_name AS
class_name [USING JAR|FILE|ARCHIVE ’file_uri’ [,USING
JAR|FILE|ARCHIVE ’file_uri’] ]
DROP FUNCTION [IF EXISTS] function_name
Reload.
RELOAD FUNCTION
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
UDF
User-Defined Function
UDF (User Defined Function)
Berjalan pada tiap baris dan menghasilkan keluaran untuk
tiap barisnya.
UDAF (User Defined Aggregate Function)
Berjalan pada tiap baris atau kelompok baris dan
menghasilkan keluaran untuk tiap baris atau kelompok
baris yang didefinisikan.
UDTF (User Defined Table-Generating Function)
Berjalan pada tiap baris atau kelompok baris dan
menghasilkan keluaran berupa tabel.
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
Data Definition Language
Data Selection Language
Data Manipulation Language
Data Aggregation
User-Defined Function
UDF
User-Defined Function
Langkah pembuatan
Buat fungsi dalam bahasa Java
Compile dan pack menjadi JAR
Load JAR ke HDFS
Daftarkan JAR
ADD JAR /path/di/hdfs/nama_file.jar
Definisikan fungsi
CREATE TEMPORARY FUNCTION nama_fungsi AS
net.kalamangga.dev.nama_fungsi
Gunakan dalam query
SELECT nama_fungsi(kolom1) FROM nama_tabel
http://www.kalamangga.net Hive
Batasan
Pengenalan
HiveQL
EoF
EoF
End of File
Terima Kasih
Disiapkan oleh :
Yudha H Tejaningrat
yht@kalamangga.web.id
http://www.kalamangga.net Hive

Contenu connexe

En vedette

Building a Big Data Analytics Platform- Impetus White Paper
Building a Big Data Analytics Platform- Impetus White PaperBuilding a Big Data Analytics Platform- Impetus White Paper
Building a Big Data Analytics Platform- Impetus White PaperImpetus Technologies
 
Copavacaciones daviajes 2010
Copavacaciones daviajes 2010Copavacaciones daviajes 2010
Copavacaciones daviajes 2010neira320
 
Funcionarios parqueadero
Funcionarios parqueaderoFuncionarios parqueadero
Funcionarios parqueaderorutaimedellin
 
Y tú dónde te ves
Y tú dónde te vesY tú dónde te ves
Y tú dónde te vesyeimijaraba
 
Outcome n2.1
Outcome n2.1Outcome n2.1
Outcome n2.1susan70
 
Economia para no economistas
Economia para no economistasEconomia para no economistas
Economia para no economistasAtuel Ledesma
 
Hoje no brasil o que mais se existe são leis
Hoje no brasil o que mais se existe são leisHoje no brasil o que mais se existe são leis
Hoje no brasil o que mais se existe são leisJoze Fllávio
 
Sistema Computacao Revisao 1
Sistema Computacao Revisao 1Sistema Computacao Revisao 1
Sistema Computacao Revisao 1Duílio Andrade
 
Educational theory
Educational    theoryEducational    theory
Educational theoryhaiyun1166
 
1.2. arti penting biologi
1.2. arti penting biologi1.2. arti penting biologi
1.2. arti penting biologiSebelas Erka
 
E-mail Id Of Btech mca Batch final year 2012
E-mail Id Of Btech mca Batch final year 2012E-mail Id Of Btech mca Batch final year 2012
E-mail Id Of Btech mca Batch final year 2012Gaganjeet Singh
 

En vedette (18)

Customer Case Study - CMCC
Customer Case Study - CMCCCustomer Case Study - CMCC
Customer Case Study - CMCC
 
Building a Big Data Analytics Platform- Impetus White Paper
Building a Big Data Analytics Platform- Impetus White PaperBuilding a Big Data Analytics Platform- Impetus White Paper
Building a Big Data Analytics Platform- Impetus White Paper
 
Copavacaciones daviajes 2010
Copavacaciones daviajes 2010Copavacaciones daviajes 2010
Copavacaciones daviajes 2010
 
Northcrest salmon
Northcrest salmonNorthcrest salmon
Northcrest salmon
 
Funcionarios parqueadero
Funcionarios parqueaderoFuncionarios parqueadero
Funcionarios parqueadero
 
Y tú dónde te ves
Y tú dónde te vesY tú dónde te ves
Y tú dónde te ves
 
Outcome n2.1
Outcome n2.1Outcome n2.1
Outcome n2.1
 
Economia para no economistas
Economia para no economistasEconomia para no economistas
Economia para no economistas
 
PM Mitaussteller BioFach.pdf
PM Mitaussteller BioFach.pdfPM Mitaussteller BioFach.pdf
PM Mitaussteller BioFach.pdf
 
Hoje no brasil o que mais se existe são leis
Hoje no brasil o que mais se existe são leisHoje no brasil o que mais se existe são leis
Hoje no brasil o que mais se existe são leis
 
Sistema Computacao Revisao 1
Sistema Computacao Revisao 1Sistema Computacao Revisao 1
Sistema Computacao Revisao 1
 
Reflexion
ReflexionReflexion
Reflexion
 
Doc2
Doc2Doc2
Doc2
 
Forgiveness
ForgivenessForgiveness
Forgiveness
 
Educational theory
Educational    theoryEducational    theory
Educational theory
 
1.2. arti penting biologi
1.2. arti penting biologi1.2. arti penting biologi
1.2. arti penting biologi
 
Role of CRT and CRTD in CHF
Role of CRT and CRTD in CHFRole of CRT and CRTD in CHF
Role of CRT and CRTD in CHF
 
E-mail Id Of Btech mca Batch final year 2012
E-mail Id Of Btech mca Batch final year 2012E-mail Id Of Btech mca Batch final year 2012
E-mail Id Of Btech mca Batch final year 2012
 

Similaire à Apache Hive

Tugas[4] 0317-[rachmawan darma]-[1311500100].
Tugas[4] 0317-[rachmawan darma]-[1311500100].Tugas[4] 0317-[rachmawan darma]-[1311500100].
Tugas[4] 0317-[rachmawan darma]-[1311500100].Rachmawan Darma
 
ETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopSyafrizal Adi
 
Teori Web Database Server Linux Debian
Teori Web Database Server Linux DebianTeori Web Database Server Linux Debian
Teori Web Database Server Linux DebianHasbullah Marwan
 
Sistem basis data
Sistem basis dataSistem basis data
Sistem basis dataramdani ,
 
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...Fitria Nanda
 
Tugas iv 0317_arie firmandani_1512510445
Tugas iv  0317_arie firmandani_1512510445Tugas iv  0317_arie firmandani_1512510445
Tugas iv 0317_arie firmandani_1512510445Arie Firmandani
 
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...Lisa Andriyani
 
Pemrograman database dengan dao pada vb
Pemrograman database dengan dao pada vbPemrograman database dengan dao pada vb
Pemrograman database dengan dao pada vbMateri Kuliah Online
 
Database dan manajemen database
Database dan manajemen databaseDatabase dan manajemen database
Database dan manajemen databaseSigit Sanjaya
 
Bab 4 tools-pemrograman-web-dan-database
Bab 4 tools-pemrograman-web-dan-databaseBab 4 tools-pemrograman-web-dan-database
Bab 4 tools-pemrograman-web-dan-databasefebeniken
 
Tutorial Installasi dan Melakukan DDL DML pada MariaDB
Tutorial Installasi dan Melakukan DDL DML pada MariaDBTutorial Installasi dan Melakukan DDL DML pada MariaDB
Tutorial Installasi dan Melakukan DDL DML pada MariaDBFahmi Helminardi
 
SISTEM BASIS DATA1
SISTEM BASIS DATA1SISTEM BASIS DATA1
SISTEM BASIS DATA1Ayu_lestari
 
Tugas[4] 0317-[tryanita]-[1411511676]
Tugas[4]  0317-[tryanita]-[1411511676]Tugas[4]  0317-[tryanita]-[1411511676]
Tugas[4] 0317-[tryanita]-[1411511676]trya nita
 

Similaire à Apache Hive (20)

Tugas[4] 0317-[rachmawan darma]-[1311500100].
Tugas[4] 0317-[rachmawan darma]-[1311500100].Tugas[4] 0317-[rachmawan darma]-[1311500100].
Tugas[4] 0317-[rachmawan darma]-[1311500100].
 
Tugas Rekweb 4
Tugas Rekweb 4Tugas Rekweb 4
Tugas Rekweb 4
 
ETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache Hadoop
 
Sbd ke4 5
Sbd ke4 5Sbd ke4 5
Sbd ke4 5
 
Teori Web Database Server Linux Debian
Teori Web Database Server Linux DebianTeori Web Database Server Linux Debian
Teori Web Database Server Linux Debian
 
Pel myswl
Pel myswlPel myswl
Pel myswl
 
Tugas 4
Tugas 4Tugas 4
Tugas 4
 
Jumpa 1
Jumpa 1Jumpa 1
Jumpa 1
 
Sistem basis data
Sistem basis dataSistem basis data
Sistem basis data
 
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...
5. SI-PI, Fitria Dwinanda, Hapzi Ali, DASAR-DASAR INTELEGENSI BISNIS: BASIS D...
 
Tugas iv 0317_arie firmandani_1512510445
Tugas iv  0317_arie firmandani_1512510445Tugas iv  0317_arie firmandani_1512510445
Tugas iv 0317_arie firmandani_1512510445
 
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...
Sim,lisa andriyani,hapzi ali,sistem manajemen database,universitas mercubuana...
 
Pemrograman database dengan dao pada vb
Pemrograman database dengan dao pada vbPemrograman database dengan dao pada vb
Pemrograman database dengan dao pada vb
 
Database dan manajemen database
Database dan manajemen databaseDatabase dan manajemen database
Database dan manajemen database
 
Bab 4 tools-pemrograman-web-dan-database
Bab 4 tools-pemrograman-web-dan-databaseBab 4 tools-pemrograman-web-dan-database
Bab 4 tools-pemrograman-web-dan-database
 
Tutorial Installasi dan Melakukan DDL DML pada MariaDB
Tutorial Installasi dan Melakukan DDL DML pada MariaDBTutorial Installasi dan Melakukan DDL DML pada MariaDB
Tutorial Installasi dan Melakukan DDL DML pada MariaDB
 
SISTEM BASIS DATA1
SISTEM BASIS DATA1SISTEM BASIS DATA1
SISTEM BASIS DATA1
 
Makalah File , Database
Makalah File , DatabaseMakalah File , Database
Makalah File , Database
 
kelompok.pptx
kelompok.pptxkelompok.pptx
kelompok.pptx
 
Tugas[4] 0317-[tryanita]-[1411511676]
Tugas[4]  0317-[tryanita]-[1411511676]Tugas[4]  0317-[tryanita]-[1411511676]
Tugas[4] 0317-[tryanita]-[1411511676]
 

Apache Hive

  • 1. Batasan Pengenalan HiveQL EoF Apache Hive Sekilas mengenai Apache Hive Kalamangga.Net Bagian Riset dan Pengembangan Februari 2016 http://www.kalamangga.net Hive
  • 2. Batasan Pengenalan HiveQL EoF Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 3. Batasan Pengenalan HiveQL EoF Batasan Perangkat Distribusi Cloudera : CDH 5.2.4 OS : CentOS 6.5 Penempatan data pada HDFS Web https://hive.apache.org https://cwiki.apache.org/confluence/display/Hive http://www.kalamangga.net Hive
  • 4. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 5. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Apache itu Hive? Apache itu Hive? Sebuah proyek pada Yayasan Apache yang memiliki fungsi sebagai gudang data data warehouse. Dikembangkan di atas platform Apache Hadoop. Pada awal pengembangan merupakan sub-proyek dari Apache Hadoop. http://www.kalamangga.net Hive
  • 6. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 7. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Bagaimana penggunaan Hive? Bagaimana penggunaan Hive? Umumnya digunakan pada proses ETL. Memberikan struktur data pada berbagai format berkas. Mengakses data langsung dari HDFS atau HBase. Sebagai gudang data. Manajemen data. Analisis data. http://www.kalamangga.net Hive
  • 8. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 9. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Bagaimana data dikelola? Data dapat dikelompokkan ke dalam database. Bila tidak ditentukan, database ’default’ akan digunakan. Data disimpan pada HDFS di lokasi sesuai konfigurasi ’hive.metastore.warehouse.dir’, konfigurasi standar menunjuk lokasi ’/user/hive/warehouse’ http://www.kalamangga.net Hive
  • 10. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Bagaimana data dikelola? Tabel pada Hive mirip dengan konsep tabel pada RDBMS. Setiap tabel diasosiasikan dengan sebuah direktori pada HDFS. Misal : tabel ’pegawai’ pada database default diasosiasikan dengan direktori ’/user/hive/warehouse/pegawai’ di HDFS. http://www.kalamangga.net Hive
  • 11. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Bagaimana data dikelola? Tabel internal. Tabel yang dimiliki oleh Hive. Pengaturan tabel dan data sepenuhnya oleh Hive. Tabel eksternal. Hive hanya dapat mengatur tabel. Data diatur oleh perangkat / mekanisme lain. http://www.kalamangga.net Hive
  • 12. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 13. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Numerik. TINYINT. SMALLINT. INT. BIGINT. FLOAT. DOUBLE. DECIMAL. http://www.kalamangga.net Hive
  • 14. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Waktu. TIMESTAMP. DATE. String. STRING. VARCHAR. CHAR. Boolean. http://www.kalamangga.net Hive
  • 15. Batasan Pengenalan HiveQL EoF Apa itu Hive? Bagaimana penggunaan Hive? Bagaimana data dikelola? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Apa saja tipe data yang didukung? Binary. Kompleks. Arrays. Maps. Structs. Named Struct. Union. Boolean. http://www.kalamangga.net Hive
  • 16. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Pengenalan Pengenalan Apache Hive dapat melakukan query pada data yang disimpan dalam HDFS. Untuk melakukan query, Hive menyediakan bahasa SQL yang disebut Hive Query Language disingkat (HiveQL atau HQL). http://www.kalamangga.net Hive
  • 17. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 18. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DDL Data Definition Language Database. CREATE DATABASE. COMMENT LOCATION WITH DBPROPERTIES SHOW DATABASE. LIKE ’*’ DESCRIBE DATABASE. USE. DROP. ALTER SET DBPROPERTIES SET OWNER USER http://www.kalamangga.net Hive
  • 19. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DDL Data Definition Language Tabel. CREATE TABLE. ROW FORMAT DELIMITED FIELDS TERMINATED BY COLLECTION ITEMS TERMINATED BY MAP KEYS TERMINATED BY STORED AS AS (CTAS) LIKE PARTITIONED BY INSERT INTO TABLE DROP TABLE http://www.kalamangga.net Hive
  • 20. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 21. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DSL Data Selection Language SELECT. FROM WHERE LIMIT Sub Query IN NOT IN EXIST http://www.kalamangga.net Hive
  • 22. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DSL Data Selection Language Join. INNER JOIN LEFT OUTER JOIN RIGHT OUTER JOIN FULL OUTER JOIN CROSS JOIN UNION ALL. http://www.kalamangga.net Hive
  • 23. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 24. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DML Data Manipulation Language LOAD DATA. LOCAL INPATH OVERWRITE INTO INSERT. INTO TABLE OVERWRITE LOCAL DIRECTORY http://www.kalamangga.net Hive
  • 25. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function DML Data Manipulation Language EXPORT TABLE ... TO ... IMPORT TABLE ... FROM ... ORDER. SORT. Built-in Functions. SHOW FUNCTIONS DESCRIBE FUNCTIONS EXTENDED http://www.kalamangga.net Hive
  • 26. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 27. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Data Aggregation COUNT. MAX. MIN. AVG. GROUPING SETS. ROLLUP. CUBE. GROUP BY. http://www.kalamangga.net Hive
  • 28. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Data Aggregation Kondisional. CASE WHEN COALESCE IF http://www.kalamangga.net Hive
  • 29. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Data Aggregation Fungsi analisis. RANK DENSE_RANK ROW_NUMBER CUME_DIST PERCENT_RANK http://www.kalamangga.net Hive
  • 30. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Data Aggregation Fungsi analisis. NTILE LEAD LAG FIRST_VALUE LAST_VALUE http://www.kalamangga.net Hive
  • 31. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function Outline 1 Batasan 2 Pengenalan Definisi Penggunaan Pengelolaan Data Tipe Data 3 HiveQL DDL (Data Definition Language) DSL (Data Selection Language) DML (Data Manipulation Language) Data Aggregation User-Defined Function 4 EoF http://www.kalamangga.net Hive
  • 32. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function UDF User-Defined Function Temporary. CREATE TEMPORARY FUNCTION function_name AS class_name DROP TEMPORARY FUNCTION [IF EXISTS] function_name Permanen. CREATE FUNCTION [db_name].function_name AS class_name [USING JAR|FILE|ARCHIVE ’file_uri’ [,USING JAR|FILE|ARCHIVE ’file_uri’] ] DROP FUNCTION [IF EXISTS] function_name Reload. RELOAD FUNCTION http://www.kalamangga.net Hive
  • 33. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function UDF User-Defined Function UDF (User Defined Function) Berjalan pada tiap baris dan menghasilkan keluaran untuk tiap barisnya. UDAF (User Defined Aggregate Function) Berjalan pada tiap baris atau kelompok baris dan menghasilkan keluaran untuk tiap baris atau kelompok baris yang didefinisikan. UDTF (User Defined Table-Generating Function) Berjalan pada tiap baris atau kelompok baris dan menghasilkan keluaran berupa tabel. http://www.kalamangga.net Hive
  • 34. Batasan Pengenalan HiveQL EoF Data Definition Language Data Selection Language Data Manipulation Language Data Aggregation User-Defined Function UDF User-Defined Function Langkah pembuatan Buat fungsi dalam bahasa Java Compile dan pack menjadi JAR Load JAR ke HDFS Daftarkan JAR ADD JAR /path/di/hdfs/nama_file.jar Definisikan fungsi CREATE TEMPORARY FUNCTION nama_fungsi AS net.kalamangga.dev.nama_fungsi Gunakan dalam query SELECT nama_fungsi(kolom1) FROM nama_tabel http://www.kalamangga.net Hive
  • 35. Batasan Pengenalan HiveQL EoF EoF End of File Terima Kasih Disiapkan oleh : Yudha H Tejaningrat yht@kalamangga.web.id http://www.kalamangga.net Hive