SlideShare une entreprise Scribd logo
1  sur  77
Télécharger pour lire hors ligne
Datenbanken
Big Data
Johannes Schildgen
2015-03-13
schildgen@cs.uni-kl.de
http://bit.ly/schildgen
Analyse
NoSQL-&
Seit Anbeginn der Zivilisation bis zum
Jahre 2003 haben die Menschen
fünf Exabytes an Daten produziert.
Seit Anbeginn der Zivilisation bis zum
Jahre 2003 haben die Menschen
fünf Exabytes an Daten produziert.
Mittlerweile produzieren wir
fünf Exabytes alle zwei Tage.
Mittlerweile produzieren wir
fünf Exabytes alle zwei Tage.
Eric Schmidt – Executive Chairman, Google
Eric Schmidt.jpg, Author: Gisela Giardino, Wikimedia Commons, 12 April2007,20:24:40
Big Data = Groß ?
Big Data = Groß
Volume
6 Mrd. Mobiltelefone6 Mrd. Mobiltelefone
1,4 Mrd. Mitglieder1,4 Mrd. Mitglieder
140 Mrd. Freundschaften140 Mrd. Freundschaften
290 Mrd. Fotos290 Mrd. Fotos
Big Data = Schnell
Volume Velocity
500 Mio. Tweets / Tag500 Mio. Tweets / Tag 500 Mio. Kommentare / Minute500 Mio. Kommentare / Minute
48h Videos / Sekunde48h Videos / Sekunde
>100 Sensoren>100 Sensoren
Big Data = Heterogen
Volume Velocity Variety
ID Vorname Nachname Beruf Gehalt
1 Anna Schmidt Manager 60000
2 Jakob Heinz Programmierer 50000
3 Susanne Bäcker Programmierer 50000
4 Gregor Meyer Berater 60000
5 Carlo Franzen Programmierer 45000
Strukturierte DatenStrukturierte Daten
{
_id: 883,
"Titel": "Notebook zu verkaufen",
"Preis": 400,
"Waehrung": "EURO",
"Verkaeufer": {
"Name": "Franzen",
"Vorname": "Carlo",
"maennlich": true,
"Hobbys": [ "Reiten", "Golfen", "Lesen" ],
"Alter": 42,
"Kinder": [],
"Partner": null
}
}
Semi-Strukturierte DatenSemi-Strukturierte Daten
„Hab heute nen schönen Tag zs. mit meiner Mutter
in der Frankfurter Innenstadt verbracht, Pics folgen
später.“
Unstrukturierte DatenUnstrukturierte Daten
Media DatenMedia Daten
Multi-Media DatenMulti-Media Daten
"datastreams": [
{
"name": "temperature",
"description": "Temperature"
"longitude": "2.363471",
"latitude": "48.917536",
"timezone": "+1",
„value": „19.2",
"unit": "Celsius"
}
SensordatenSensordaten
Big Data = Unklar
Volume Velocity Variety Veracity
Ich habe Elvis gesehenIch habe Elvis gesehen
Die Elbphilamonie wird 2016 eröffnetDie Elbphilamonie wird 2016 eröffnet
Merkel ist zurückgetretenMerkel ist zurückgetreten
Die Elbphilamobie
öffnet 2015
Die Elbphilamobie
öffnet 2015
Big-Data-Anwendungen
Empfehlungssysteme
• Clustering, Collaborative Filtering
Marketing
• Online-Werbung, Offline-Werbung
Prozessoptimierung
• Fertigung, Lagerhaltung, Personalplanung
Diagnosetools
• KFZ, Luft- und Raumfahrt
Forschung
• Klima, Rohstoffe, Krankheiten
Relationale Datenbanksysteme
ID Vorname Nachname Beruf Gehalt
1 Anna Schmidt Manager 60000
2 Jakob Heinz Programmierer 50000
3 Susanne Bäcker Programmierer 50000
4 Gregor Meyer Berater 60000
5 Carlo Franzen Programmierer 45000
SQL
ID Vorname Nachname Beruf Gehalt
1 Anna Schmidt Manager 60000
2 Jakob Heinz Programmierer 50000
3 Susanne Bäcker Programmierer 50000
4 Gregor Meyer Berater 60000
5 Carlo Franzen Programmierer 45000
SELECT vorname, nachname FROM
pers WHERE gehalt > 50000
SELECT vorname, nachname FROM
pers WHERE gehalt > 50000
SQL: DDL*
PrID Titel PrLeiter
100 Projekt X 5
101 DB-Projekt 1
CREATE TABLE proj (
PrID INT PRIMARY KEY,
Titel VARCHAR(100) NOT NULL,
PrLeiter INT REFERENCES pers(ID))
CREATE TABLE proj (
PrID INT PRIMARY KEY,
Titel VARCHAR(100) NOT NULL,
PrLeiter INT REFERENCES pers(ID))
* Data-DefinitionLanguage
SQL: Joins
ID Vorname Nachname Beruf Gehalt
1 Anna Schmidt Manager 60000
2 Jakob Heinz Programmierer 50000
3 Susanne Bäcker Programmierer 50000
4 Gregor Meyer Berater 60000
5 Carlo Franzen Programmierer 45000
SELECT proj.titel FROM pers, proj
WHERE proj.PrLeiter = pers.ID AND
pers.beruf = ‘Manager’
SELECT proj.titel FROM pers, proj
WHERE proj.PrLeiter = pers.ID AND
pers.beruf = ‘Manager’
PrID Titel PrLeiter
100 Projekt X 5
101 DB-Projekt 1
NoSQL-Datenbanken
Not Only SQLNot Only SQL
Alle Open-SourceAlle Open-Source
NoSQL-Datenbanken
Verteilte DatenbankVerteilte Datenbank => Lastverteilung,
Hochverfügbarkeit,
Verteilte Berechnungen
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
Key-Value Stores
Key Value
a 5
b 17
SET c 9SET c 9
c 9 GET aGET a
Key Value
pers:1:vorname Anna
pers:1:nachname Schmidt
pers:1:projekte [“DB-Projekt“]
INCR aINCR a
a 6
RPUSH pers:1:projekte
“Projekt Y”
RPUSH pers:1:projekte
“Projekt Y”
pers:1:projekte [“DB-Projekt“, “Projekt Y“]
Range Partitioning
Keys: a-e f-j k-n o-s t-z
Key Value
a 6
b 17
c 9
Key Value
pers:1:vorname Anna
pers:1:nachname Schmidt
pers:1:projekte [“DB-Projekt“, “Projekt Y“]
Range Partitioning
Keys: a-pers:0 pers:1-pers:500 … ... …
Key Value
a 6
b 17
c 9
Key Value
pers:1:vorname Anna
pers:1:nachname Schmidt
pers:1:projekte [“DB-Projekt“, “Projekt Y“]
Hash Partitioning
0 1 2 3 4
Key Value
a 6
c 9
Key Value
b 17
h(key) = … mod 5h(key) = … mod 5
Key Value
c 9
Hash Partitioning
0 1 2 3 4
Key Value
a 6
Key Value
b 17
h(key) = … mod 4h(key) = … mod 4
X
Consistent Hashing
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Key Value
a 6
c 9
Key Value
b 17
h(key) = … mod 20h(key) = … mod 20
Consistent Hashing
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Key Value
a 6
c 9
Key Value
b 17
X
h(key) = … mod 20h(key) = … mod 20
16 17 18 19
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
Wide-Column Stores SCAN ‘t’SCAN ‘t’
GET ‘t’, ‘5’GET ‘t’, ‘5’
SET ‘t’, ‘4’,
‘geboren’, ‘1982’
SET ‘t’, ‘4’,
‘geboren’, ‘1982’
Row-ID Vorname Nachname Beruf Gehalt
1 Anna Schmidt Manager 60000
2 Jakob Heinz Programmierer 50000
3 Susanne Bäcker Programmierer 50000
4 Gregor Meyer Berater 60000
5 Carlo Franzen Programmierer 45000
SET ‘t’, ‘3’,
Beruf, ‘Berater’
SET ‘t’, ‘3’,
Beruf, ‘Berater’
Wide-Column Stores
Row-ID Info Chef-von
1 Vorname
Anna
Nachname
Schmidt
2
2015-01-01
2 Nachname
Heinz
Geboren
1982
3
2014-06-01
4
2014-02-15
3 Vorname
Susanne
Beruf
Bäcker
4 Vorname
Carlo
Nachname
Franzen
Column FamilyColumn Family
GET ‘t’, ‘2’, {COLUMNS=>['Chef-von:']}GET ‘t’, ‘2’, {COLUMNS=>['Chef-von:']}
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
{
_id: 883,
"Titel": "Notebook zu verkaufen",
"Preis": 400,
"Waehrung": "EURO",
"Verkaeufer": {
"Name": "Franzen",
"Vorname": "Carlo",
"maennlich": true,
"Hobbys": [ "Reiten", "Golfen", "Lesen" ],
"Alter": 42,
"Kinder": [],
"Partner": null
}
}
Dokumenten-Datenbanken
JSON-DokumentJSON-Dokument
db.prod.find()db.prod.find()
db.prod.find({Preis: {
$gt: 100} }, {Titel:1})
db.prod.find({Preis: {
$gt: 100} }, {Titel:1})
db.prod.insert({_id:
884, Titel:”xyz”})
db.prod.insert({_id:
884, Titel:”xyz”})
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
I
J
F
G
H
D
A
B
CE
Graph-Datenbanken
ls –f Freund:OUT Hls –f Freund:OUT H
Graph-Datenbanken
H
vorname: Achim
nachname:Schneider
gehalt:50000
ls –f gehalt>40000ls –f gehalt>40000
NoSQL-Datenbanken
Key-Value
Stores
Wide-Column
Stores
Dokumenten-
Datenbanken
Graph-
Datenbanken
ACID
Atomarität
Konsistenz
Isolation
Dauerhaftigkeit
Alles-oder-Nichts-PrinzipAlles-oder-Nichts-Prinzip
Transaktion hinterlässt
konsistenten DB-Zustand
Transaktion hinterlässt
konsistenten DB-Zustand
Parallel laufenden TAs
beeinflussen sich nicht
Parallel laufenden TAs
beeinflussen sich nicht
Freigegebene Änderungen
gehen nicht verloren
Freigegebene Änderungen
gehen nicht verloren
ACID
Atomarität
Konsistenz
Isolation
Dauerhaftigkeit
a = 10
b = 10
Begin of Transaction
a -= 2
b += 2
End of Transaction
a = 8
b = 12
BASE
Basically
Avaiable
Soft State
Eventual
Consistent
a = 10
b = 10
a -= 2
b += 2
a = 10
b = 10
BASE
Basically
Avaiable
Soft State
Eventual
Consistent
a = 10
b = 10
a -= 2
b += 2
a = 10
b = 12
BASE
Basically
Avaiable
Soft State
Eventual
Consistent
a = 10
b = 10
a -= 2
b += 2
a = 8
b = 12
CAP-Theorem
Nimm 2
Consistency
Availability
Partition
Tolerance
Leseoperation
liefert stets
aktuellen Wert
Leseoperation
liefert stets
aktuellen Wert
System nimmt
Anfragen
entgegen
System nimmt
Anfragen
entgegen
Netzwerkknoten
können
unterschiedlichen
Zustand haben
Netzwerkknoten
können
unterschiedlichen
Zustand haben
CAP-Theorem
a: 10 10 10 10 10
SET a 8SET a 8
CAP-Theorem
a: 8 10 10 10 10
CAP-Theorem
a: 8 8 8 10 8
CAP-Theorem
a: 8 8 8 8 8
Konsistent
CAP-Theorem
In einem verteilten System gehen Nachrichten
verloren oder kommen verzögert an.
Nimm 2
Consistency
Availability
Partition
Tolerance
Muss!Muss!
entweder
… oder
entweder
… oder
entweder
… oder
entweder
… oder
CAP-Theorem (Beweis-Skizze)
a: 8 8 8 10 8
GET aGET a
Inkonsistent
Nimm 2
Consistency
Availability
Partition
Tolerance
CAP-Theorem (Beweis-Skizze)
a: 8 8 8 10 8
GET aGET a
Nimm 2
Consistency
Availability
Partition
Tolerance
CAP-Theorem (Beweis-Skizze)
a: 8 8 8 8 8
GET aGET a
Nimm 2
Consistency
Availability
Partition
Tolerance
Strong Consistency
a: 10 10 10 10 10
SET a 8SET a 8 SET a 8SET a 8 SET a 8SET a 8 SET a 8SET a 8 SET a 8SET a 8
N = 5
W = 5
R = 1
Strong Consistency
SET a 8SET a 8
GET aGET a GET aGET a GET aGET a GET aGET a GET aGET a
a: 8 10 10 10 10
N = 5
W = 1
R = 5
Strong Consistency: W+R>N
SET a 8SET a 8
GET aGET a GET aGET a GET aGET a
a: 8 8 8 10 10
N = 5
W = 3
R = 3
SET a 8SET a 8 SET a 8SET a 8
Eventual Consistency: W+R≤N
SET a 8SET a 8
GET aGET a GET aGET a GET aGET a
a: 8 8 10 10 10
N = 5
W = 2
R = 3
SET a 8SET a 8
Map Reduce
MapReduce
Wandle Datensatz für
Datensatz in Key-Value-Paare
Wandle Datensatz für
Datensatz in Key-Value-Paare
Sortiere alles
nach Key
Sortiere alles
nach Key
Verarbeite für jeden Key
die Liste der Values
Verarbeite für jeden Key
die Liste der Values
MapReduce
map(zeilennr, text):
for each word in text:
emit(word, 1)
reduce(word, values):
sum = 0
for each v in values:
sum = sum + v
emit(word, sum)
1: ich bin ich1: ich bin ich
(ich, 1)(ich, 1) (bin, 1)(bin, 1) (ich, 1)(ich, 1)
(ich, [1,1])(ich, [1,1])
(ich, 2)(ich, 2)
MapReduceMap
Map
Map
Map
Map
Reduce
Reduce
Reduce
Reduce
Reduce
MapReduce
• Von Google
• Freie Implementierung: Apache Hadoop
• Eingabe-/Ausgabe-Formate:
• HBase
• MongoDB
• HDFS (Hadoop Distributed File System)
• Höhere Sprachen
• Hive (Generiert MapReduce aus SQL)
• Pig
• NotaQL
Big-Data-Analysen
DB
Upload
Map Reduce
Σ
StatistikenStatistiken
EmpfehlungenEmpfehlungen
Oft Personenbezogene Daten Anonymisierte/ Aggregierte
Daten
Big-Data-Analysen
DB
Klick
Map Reduce
Σ
Uwe Peters klickt auf Laptop-Werbung
Mike Lorenz klickt auf Kinofilm-Werbung
FrankaZwickau klick auf Kinofilm-Werbung
(Laptop, 1)
(Kinofilm, 2)
k-Anonymität
Ein sichtbares Ergebnis hat seinen
Ursprung in mind. k Datensätzen
Ein sichtbares Ergebnis hat seinen
Ursprung in mind. k Datensätzen
=> Verhindert, dass man auf die
Datensätze rückschließen kann
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
Identifier Quasi-Identifier Sensibles Attribut
Krankheit von Uta ThielKrankheit von Uta Thiel
X
Identifier
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
Krankheiten von Frauen aus
54550, die 1988 geboren sind
Krankheiten von Frauen aus
54550, die 1988 geboren sind
X
Identifier Quasi-Identifier Sensibles AttributIdentifier
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
Krankheiten von Frauen,
die 1988 geboren sind
Krankheiten von Frauen,
die 1988 geboren sind
Identifier Quasi-Identifier Sensibles AttributIdentifier
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
Keine Anonymität bzgl.
dieses Quasi-Identifiers
Keine Anonymität bzgl.
dieses Quasi-Identifiers
Quasi-Identifier
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
2-Anonymiät2-Anonymiät
k-Anonymität
ID Name PLZ Geschl Geboren Krankheit
1 FrankaMeyer 67663 W 1988 Diabetes
2 Heinrich Schmidt 54550 M 1984 Magersucht
3 Peter Huber 67663 M 1984 Schizophrenie
4 Uta Thiel 54550 W 1988 Magersucht
5 Gregor Bauer 67653 M 1984 Diabetes
2-Anonymiät2-Anonymiät
Äquivalenzklassen:
((W, 1988), {Diabetes, Magersucht}, 2)
((M, 1984), {Diabetes, Magersucht, Schizophrenie},3)
k-Anonymität
ID Name PLZ Geschl Geboren Gehalt
1 FrankaMeyer 67663 W 1988 50000
2 Heinrich Schmidt 54550 M 1984 40000
3 Peter Huber 67663 M 1984 50000
4 Uta Thiel 54550 W 1988 60000
5 Gregor Bauer 67653 M 1984 70000
2-Anonymiät2-Anonymiät
Äquivalenzklassen:
((W, 1988), AVG: 55000, 2)
((M, 1984), AVG: 50000, 3)
Zusammenfassung
• Big Data
• Volume
• Velocity
• Variety
• Veracity
• NoSQL
• Key-Value-, Wide-Column-, Dokumenten-, Graph-DBs
• BASE, CAP Theorem, Eventual Consistency
• MapReduce
• k-Anonymität
Quellen / Weitere Literatur
• NoSQL: Einstieg in die Welt nichtrelationaler Web
2.0 Datenbanken, Stefan Edlich, 2011
• http://nosql-database.org
• http://wwwlgis.informatik.uni-
kl.de/cms/courses/distributeddatamanagement
• http://www.ipd.uni-
karlsruhe.de/~buchmann/14SS-Datenschutz

Contenu connexe

En vedette

Studeo deskriptive statistik_ein_merkmal
Studeo deskriptive statistik_ein_merkmalStudeo deskriptive statistik_ein_merkmal
Studeo deskriptive statistik_ein_merkmal
Studeo
 
Unidad 1. desarrollo sustentable
Unidad 1.  desarrollo sustentableUnidad 1.  desarrollo sustentable
Unidad 1. desarrollo sustentable
NidiaArroyoA
 
PRESENTATION BY SHIVA KUMAR
PRESENTATION BY SHIVA KUMARPRESENTATION BY SHIVA KUMAR
PRESENTATION BY SHIVA KUMAR
Santhosh Nani
 
Coupons erfolgreich einsetzen
Coupons erfolgreich einsetzenCoupons erfolgreich einsetzen
Coupons erfolgreich einsetzen
kmubusinessworld
 

En vedette (20)

Help Desk
Help DeskHelp Desk
Help Desk
 
E-Books im Spannungsfeld von Learning Analytics
E-Books im Spannungsfeld von Learning AnalyticsE-Books im Spannungsfeld von Learning Analytics
E-Books im Spannungsfeld von Learning Analytics
 
Introduccion teoriade señales
Introduccion teoriade señalesIntroduccion teoriade señales
Introduccion teoriade señales
 
Konzept für Open Educational Resources im sekundären Bildungsbereich
Konzept für Open Educational Resources im sekundären BildungsbereichKonzept für Open Educational Resources im sekundären Bildungsbereich
Konzept für Open Educational Resources im sekundären Bildungsbereich
 
Mediacion escolar nuevo
Mediacion escolar nuevoMediacion escolar nuevo
Mediacion escolar nuevo
 
La edad media
La edad mediaLa edad media
La edad media
 
Presentación1
Presentación1Presentación1
Presentación1
 
Society 2.0 & Social Media
Society 2.0 & Social MediaSociety 2.0 & Social Media
Society 2.0 & Social Media
 
Unidad 6 y 7, carlos villarreal
Unidad 6 y 7, carlos villarrealUnidad 6 y 7, carlos villarreal
Unidad 6 y 7, carlos villarreal
 
Galdamez mejia kevin eduardo
Galdamez mejia kevin eduardoGaldamez mejia kevin eduardo
Galdamez mejia kevin eduardo
 
Studeo deskriptive statistik_ein_merkmal
Studeo deskriptive statistik_ein_merkmalStudeo deskriptive statistik_ein_merkmal
Studeo deskriptive statistik_ein_merkmal
 
Informacion n la nube
Informacion n la nubeInformacion n la nube
Informacion n la nube
 
LA NETIQUETA
LA NETIQUETALA NETIQUETA
LA NETIQUETA
 
Las tecnologías de la información y comunicación
Las tecnologías de la información y comunicación         Las tecnologías de la información y comunicación
Las tecnologías de la información y comunicación
 
Unidad 1. desarrollo sustentable
Unidad 1.  desarrollo sustentableUnidad 1.  desarrollo sustentable
Unidad 1. desarrollo sustentable
 
Empresa y competencia
Empresa y competenciaEmpresa y competencia
Empresa y competencia
 
El agua
El aguaEl agua
El agua
 
Tage wie diese für juli
Tage wie diese für juliTage wie diese für juli
Tage wie diese für juli
 
PRESENTATION BY SHIVA KUMAR
PRESENTATION BY SHIVA KUMARPRESENTATION BY SHIVA KUMAR
PRESENTATION BY SHIVA KUMAR
 
Coupons erfolgreich einsetzen
Coupons erfolgreich einsetzenCoupons erfolgreich einsetzen
Coupons erfolgreich einsetzen
 

Similaire à Big-Data-Analyse und NoSQL-Datenbanken

Differenzial Analyse in der Praxis (Florian Walther)
Differenzial Analyse in der Praxis (Florian Walther)Differenzial Analyse in der Praxis (Florian Walther)
Differenzial Analyse in der Praxis (Florian Walther)
GEEKcon
 

Similaire à Big-Data-Analyse und NoSQL-Datenbanken (20)

Visuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataXVisuelle Gestaltung und Testdatenentwicklung mit BizDataX
Visuelle Gestaltung und Testdatenentwicklung mit BizDataX
 
Solr & Cassandra: Searching Cassandra with DataStax Enterprise
Solr & Cassandra: Searching Cassandra with DataStax EnterpriseSolr & Cassandra: Searching Cassandra with DataStax Enterprise
Solr & Cassandra: Searching Cassandra with DataStax Enterprise
 
Elegantes In-Memory Computing mit Apache Ignite und Kubernetes. @data2day
Elegantes In-Memory Computing mit Apache Ignite und Kubernetes. @data2dayElegantes In-Memory Computing mit Apache Ignite und Kubernetes. @data2day
Elegantes In-Memory Computing mit Apache Ignite und Kubernetes. @data2day
 
In-Memory Computing mit Apache Ignite und Kubernetes
In-Memory Computing mit Apache Ignite und KubernetesIn-Memory Computing mit Apache Ignite und Kubernetes
In-Memory Computing mit Apache Ignite und Kubernetes
 
Hibernate Tuning
Hibernate TuningHibernate Tuning
Hibernate Tuning
 
Quarterly Technology Briefing - Big Data - Germany
Quarterly Technology Briefing - Big Data - GermanyQuarterly Technology Briefing - Big Data - Germany
Quarterly Technology Briefing - Big Data - Germany
 
Differenzial Analyse in der Praxis (Florian Walther)
Differenzial Analyse in der Praxis (Florian Walther)Differenzial Analyse in der Praxis (Florian Walther)
Differenzial Analyse in der Praxis (Florian Walther)
 
IPv6 bei der Post - Step by Step zu IPv6
IPv6 bei der Post - Step by Step zu IPv6IPv6 bei der Post - Step by Step zu IPv6
IPv6 bei der Post - Step by Step zu IPv6
 
Modellierung agliler Data Warehouses mit Data Vault
Modellierung agliler Data Warehouses mit Data VaultModellierung agliler Data Warehouses mit Data Vault
Modellierung agliler Data Warehouses mit Data Vault
 
Modellierung agiler Data Warehouses mit Data Vault Dani Schnider
Modellierung agiler Data Warehouses mit Data Vault Dani SchniderModellierung agiler Data Warehouses mit Data Vault Dani Schnider
Modellierung agiler Data Warehouses mit Data Vault Dani Schnider
 
Big Data in der Fertigung und das Smart Data Projekt PRO-OPT
Big Data in der Fertigung und das Smart Data Projekt PRO-OPTBig Data in der Fertigung und das Smart Data Projekt PRO-OPT
Big Data in der Fertigung und das Smart Data Projekt PRO-OPT
 
Oracle 11g - Neuerungen im Überblick
Oracle 11g - Neuerungen im ÜberblickOracle 11g - Neuerungen im Überblick
Oracle 11g - Neuerungen im Überblick
 
Dr. Andreas Lattner - Aufsetzen skalierbarer Prognose- und Analysedienste mit...
Dr. Andreas Lattner - Aufsetzen skalierbarer Prognose- und Analysedienste mit...Dr. Andreas Lattner - Aufsetzen skalierbarer Prognose- und Analysedienste mit...
Dr. Andreas Lattner - Aufsetzen skalierbarer Prognose- und Analysedienste mit...
 
Mögen die Tests mit dir sein
Mögen die Tests mit dir seinMögen die Tests mit dir sein
Mögen die Tests mit dir sein
 
OSMC 2008 | Nagios & OTRS Integration by Jens Bothe
OSMC 2008 | Nagios & OTRS Integration by Jens BotheOSMC 2008 | Nagios & OTRS Integration by Jens Bothe
OSMC 2008 | Nagios & OTRS Integration by Jens Bothe
 
Josef Hanschitz (Hewlett Packard)
Josef Hanschitz (Hewlett Packard)Josef Hanschitz (Hewlett Packard)
Josef Hanschitz (Hewlett Packard)
 
Datenqualität von Stammdaten - einfach realisiert und schnell eingeführt
Datenqualität von Stammdaten - einfach realisiert und schnell eingeführtDatenqualität von Stammdaten - einfach realisiert und schnell eingeführt
Datenqualität von Stammdaten - einfach realisiert und schnell eingeführt
 
5min analyse
5min analyse5min analyse
5min analyse
 
Schnell, schneller, Quarkus!!
Schnell, schneller, Quarkus!!Schnell, schneller, Quarkus!!
Schnell, schneller, Quarkus!!
 
Big Game Data - Event Tracking mit Storm, Kestrel und der Lambda Architektur ...
Big Game Data - Event Tracking mit Storm, Kestrel und der Lambda Architektur ...Big Game Data - Event Tracking mit Storm, Kestrel und der Lambda Architektur ...
Big Game Data - Event Tracking mit Storm, Kestrel und der Lambda Architektur ...
 

Plus de Johannes Schildgen (7)

Precision and Recall
Precision and RecallPrecision and Recall
Precision and Recall
 
Visualization of NotaQL Transformations using Sampling
Visualization of NotaQL Transformations using SamplingVisualization of NotaQL Transformations using Sampling
Visualization of NotaQL Transformations using Sampling
 
NotaQL Is Not a Query Language! It's for Data Transformation on Wide-Column S...
NotaQL Is Not a Query Language! It's for Data Transformation on Wide-Column S...NotaQL Is Not a Query Language! It's for Data Transformation on Wide-Column S...
NotaQL Is Not a Query Language! It's for Data Transformation on Wide-Column S...
 
Incremental Data Transformations on Wide-Column Stores with NotaQL
Incremental Data Transformations on Wide-Column Stores with NotaQLIncremental Data Transformations on Wide-Column Stores with NotaQL
Incremental Data Transformations on Wide-Column Stores with NotaQL
 
Precision und Recall
Precision und RecallPrecision und Recall
Precision und Recall
 
Marimba - A MapReduce-based Programming Model for Self-maintainable Aggregate...
Marimba - A MapReduce-based Programming Model for Self-maintainable Aggregate...Marimba - A MapReduce-based Programming Model for Self-maintainable Aggregate...
Marimba - A MapReduce-based Programming Model for Self-maintainable Aggregate...
 
Marimba - Ein MapReduce-basiertes Programmiermodell für selbstwartbare Aggreg...
Marimba - Ein MapReduce-basiertes Programmiermodell für selbstwartbare Aggreg...Marimba - Ein MapReduce-basiertes Programmiermodell für selbstwartbare Aggreg...
Marimba - Ein MapReduce-basiertes Programmiermodell für selbstwartbare Aggreg...
 

Big-Data-Analyse und NoSQL-Datenbanken