2. Miksi useita ”kategorioita”
• Lista alkaa yksinkertaisimmasta rakenteesta ja
etenee monimutkaisimpaan.
• Mitä yksinkertaisempi sitä vähemmän
riippuvainen data on toisista dataentryistä.
• Ja mitä yksinkertaisempi stiä helpommin ja
nopeammin hajautettavissa klusteriin.
• Yksinkertaisin malli ei aina kuitenkaan sovellu,
siksi on kehitetty useita eri ratkaisuja jotka on
jaettu neljään kategoriaan
4. 1. Key Value stores
• Saanut alkunsa Amazonin "Dynamo Paperista”
• Datamalli: globaali collection of K, V parit (eli
Dictionary)
• Esimerkkejä: Viak, Voldemort, Tokyo*
5. 2. Column family
• perustuu Googlen BigTable dokumentaatioon
• Datamalli: big table, column families (tarkoittaa sitä, että jokaisella rivillä voi olla eri
rakenne)
• Esimerkkejä: HBase, Hypertable, Cassandra (integroitavissa Hadoopiin, samoihin
klustereihin sekä myös erikseen)
• Cassandraa käyttää: Twitter, Facebook, Digg, Reddit, Rackspace, Cisco...
• Cassandra 4 noden klusterin asennus alle 2 minuutissa: http://www.screenr.com/5G6
• Cassandran tietokannan suunnittelusta esimerkki:
• http://www.juhonkoti.net/2010/09/25/example-how-to-model-your-data-into-nosql-
with-cassandra
• Miksi Twitter valitsi Cassandran:
• http://nosql.mypopescu.com/post/407159447/cassandra-twitter-an-interview-with-
ryan-king
• Miksi Facebook loi Cassandran:
http://www.facebook.com/note.php?note_id=24413138919
• HBase käytössä: Yahoo, Twitter, Facebook, StumpleUpon, TrendMicro, Meetup, Adobe
6. 3. Dokumenttitietokannat
• saanut innostuksen Lotus Notesista
• Datamalli: collection of K,V collections
• Esimerkkejä: CouchDB, MongoDB
• CouchDB talletetaan yleensä suoraan JSON/BSON
muotoista dataa:
http://www.youtube.com/watch?v=wv1pVpo4Bbg&fea
ture=related
• CouchDB ja Web:
http://www.parleys.com/#st=5&id=1867&sl=38
• CouchDB vs. RDBMS:
http://www.parleys.com/#st=5&id=1874&sl=17
7. 4. Graafitietokannat
• pohjana Eulerin graafiteoria
• Datamalli: nodet, relaatiot, K,V-parit molemmissa
• Esimerkkejä: AllegroGraph, Sones, Noe4
• Monimutkaisin kaikista, tulevaisuudessa
mielenkiinto keskittyy tähän
• http://en.wikipedia.org/wiki/Graph_database
• Esimerkkisovellus graafitietokannalla:
http://research.microsoft.com/en-
us/projects/trinity/demo.aspx