Base NoSql et Python

1. Les bases NoSQL et Python Youenn Boussard

3. 1960 : 1er base de donnée : militaire , hiérarchique, sous forme d'arbre

4. 1970 : Théorie sur l'algèbre relationnelle de Codd

5. 1980 : troisième génération des sgbd : les bases de données orientées objets

7. 1969 – RFC

8. 1974 – Mise au point de la norme IP

9. 1981 – 213 ordinateurs connectés

10. 1989 – Naissance du World wide Web

11. 2004 – Web 2.0, Facebook

12. 2006 – twitter

13. 186,7 millions de sites web

15. Facebook 50TB

17. Beaucoup de trafic

18. Et les bases relationnelles pour gérer tout cela ?

21. Un ou plusieurs esclave

22. Toute les écritures vont sur le maître, répliquer sur les esclaves

24. Le maître est le point d'engorgement du système

26. Les jointures sont déportées au niveau de l'application

28. Le fonctionnel devient compliqué

29. La maintenance aussi !!

30. Et la disponibilité !! Des centaines de millions de lignes Des millions de lignes 14sec

32. A comme Availability (Disponibilité)

35. Cohérente

36. Isolée

38. Soft state

39. Eventually consistent

41. Distribuée

42. Open source

47. Accessible via RESTful

48. Distribué, réplication incrémental, résolution de conflit bi directionnel

49. Donnée indexable et requetable suivant des vues

50. Ecrit en

53. Ecriture / update : PUT

54. Créer : POST

55. Supprimer : DELETE

57. Si le serveur tombe, il faut juste redémarrer CouchDB -> pas de « repair »

58. On peut prendre des snapshots avec des simples cp

59. Plusieurs niveaux de durabilité : Choix entre synchroniser à toutes les mises à jours ou à la demande

61. Les vues sont définies par des documents spéciaux les « designs documents »

62. Les vues sont écrites en javascript.

63. Pour maintenir des performances sur les vues, le moteur de vues maintient des indexes sous forme btree

66. { "_id":"_design/company", "_rev":"12345", "language": "javascript", "views": { "all": { "map": "function(doc) { if (doc.Type == 'customer') emit(null, doc) }" }, "by_lastname": { "map": "function(doc) { if (doc.Type == 'customer') emit(doc.LastName, doc) }" }, "total_purchases": { "map": "function(doc) { if (doc.Type == 'purchase') emit(doc.Customer, doc.Amount) }", "reduce": "function(keys, values) { return sum(values) }" } } } Exemple d'une vue

67. Exemple de map/reduce

69. couchdb.design -> pour gérer les design documents

72. >>> server.create('python-tests')

73. Pour accéder à une base de données

74. >>> server['mabase']

75. Pour supprimer une base de données

76. >>> del server['mabase']

78. >>> db = server.create('test')

81. 'contact'

85. … name = couchdb.mapping.TextField()

86. … age = couchdb.mapping.IntegerField()

87. … modified = couchdb.mapping.DateTimeField(default=datetime.now)

88. >>> person = Person(name='youyou', age = 32)

89. >>> person.store(db)

90. >>> Person.load(db, 'youyou').rev

91. ....

93. class Person(Document):

94. by_name = ViewField('people', '''... function(doc) { ... emit(doc.name, doc); ... }''') >>> Person.by_name(db, count=3)

96. couchdbkit.client -> API client vers couchdb

97. Mapping dynamique des documents

98. Extension django

99. couchdbkit.consumer -> Ecoute les changements effectués sur la base de données

100. couchdbkit.loaders -> pousse des fichiers de vues sur couchdb

102. Ecrit en python

103. Crée un squellete d'application

104. Génère du code à l'aide de macros

105. Déploie les applications sur des serveurs CouchDB

108. Tolérant à la panne

109. Décentraliser

110. Sous contrôle

111. Modèle de données efficient et efficace

112. Elastique

113. Durable

115. C'est un triplet

117. Mais la valeur est une liste de colonnes

120. Super c'est que les lignes contiennent des super colonnes aka cle : list( colonne)

121. Une ligne est une liste de colonnes ou de super colonnes identifiées par une clé

122. Super famille de colonne

123. L'ensemble des familles de colonnes et des supers familles de colonnes constituent un espace de clés (keyspace)

125. Ce tri est respecté quand on recupère les éléments -> le model doit être conçu en fonction de cela

126. Les lignes sont triées par leur nom

127. Les options de tri se font au niveau des familles de colonnes

129. Cassandra par l'exemple en python

130. La façon de structurer les données doit être proche de la façon pour lesquelles on doit les récupérer pour les afficher

132. La clé de la ligne est l'id de l'utilisateur

138. Pycassa utilise thrift, un framework d'appel de procédure à distance

139. Thrift gere 12 languages dont python

143. Lazy Boy: http://github.com/digg/lazyboy/tree/master

144. Telephus: http://github.com/driftx/Telephus/tree/master (Twisted)

147. Embarqué

148. Stocké sur disque

149. Scalable

150. Framework de traversée

151. API simple et pratique

153. Relations entre les noeuds

154. De propriétés (au niveau des relations et noeuds)

156. Dans une famille il peut y avoir des produits

157. Chaque famille de produits peut avoir des propriétés

158. Exemple d'une instance de la base

164. Order : l'ordre de traversée

165. Stop : la condition de d'arrêt

166. Returnable : La définition des noeuds qui vont être retournés

167. Neo4j.py : binding python pour Neo4

169. http://natishalom.typepad.com/nati_shaloms_blog/2009/12/the-common-principles-behind-the-nosql-alternatives.html

170. http://horicky.blogspot.com/2009/11/nosql-patterns.html

172. http://davidwatson.org/2008/02/python-couchdb-rocks.html

173. http://wiki.apache.org/couchdb/Introduction_to_CouchDB_views

174. http://labs.mudynamics.com/wp-content/uploads/2009/04/icouch.html

175. http://horicky.blogspot.com/2008/10/couchdb-cluster.html

177. http://spyced.blogspot.com/2009/03/why-i-like-cassandra.html

178. http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model

179. http://wiki.apache.org/cassandra/ThriftExamples#Python

180. ttp://www.slideshare.net/stuhood/cassandra-talk-austin-jug

181. http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example/

183. http://python.mirocommunity.org/video/1597/pycon-2010-persistent-graphs-i

184. http://blog.neo4j.org/2010/03/modeling-categories-in-graph-database.html

Base NoSql et Python

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Base NoSql et Python

Similaire à Base NoSql et Python (20)

Base NoSql et Python

Notes de l'éditeur