1. Come invecchiare in un giorno
per colpa di Amazon... pur essendo Lean!
Nicola Junior Vitto
Blomming
Better Software - June 27, 2011 - Firenze
@njvitto - @blomming
nicola@blomming.com
2. L’incubo
Immaginate una mattina (di lavoro)
come tante altre...
10. Mattina diversa
Questa mattina è diversa dal solito perchè
attendete l’intervista sulla vostra startup che vi
hanno fatto qualche giorno prima e che andrà in
onda al TG1 del pranzo
11. Mattina diversa
...ma sfortunatamente non sarà una giornata
diversa dal solito solo per questo
12. Flashback
...tornando a noi facciamo
un breve flashback sui giorni precedenti...
18. 21 aprile
Esattamente alle 10:08 (italiane) il nostro servizio
di monitoring (Ranger)
invia una prima mail che segnala...
DOWN: http://blomming.com
19. 21 aprile
Ed ecco cosa mi scrive istantaneamente Andrea
20. 21 aprile
Magari fossi io... :(
Vado subito a guardare lo status del nostro
servizio (Heroku) e sembra tutto ok
21. 21 aprile
Poco dopo arriva un barlume di speranza...
Ranger ci scrive:
UP: http://blomming.com
24. 21 aprile
Heroku dichiara di avere dei
problemi di connettività e
il sito va infatti ad intermittenza
25. 21 aprile
Ma sono ancora le 10:30 e noi continuiamo ad
avere la speranza che per le 14 (ora del servizio
sul TG1) tutto si risolva per il meglio
SO...
26. 21 aprile
...Il peggio però non era ancora arrivato...
27. AWS down
Poco dopo si diffonde la notizia del vero
problema: un’intera region Amazon Web
Service è down per problemi di networking.
E’ la region USA più grande: quella della Virgina
che è usata anche da Heroku!
31. AWS down: re-mirroring storm
Tutto a causa di un errore, probabilmente
umano, di aggiornamento dell’infrastruttura di
rete
32. AWS down: re-mirroring storm
“Re-mirroring storm”: i server hanno “creduto”
di non essere più collegati alle loro “copie
specchio” (mirror) e hanno iniziato a cercare di
“auto-ripararsi”. Così facendo hanno esaurito lo
spazio disponibile nella loro rete locale e hanno
messo in crisi anche i server di altre reti, che
hanno cercato di “auto-ripararsi” anche loro. Il
problema si è quindi amplificato e ha portato a un
collasso del sistema.
33. AWS down
La region Amazon AWS della Virginia ed è
tornata a pieno regime dopo quasi 3 giorni!!!
Blomming.com “fortunatamente” solo dopo
poco più di 24 ore, grazie ad una migrazione in
un’altra region AWS effettuata da Heroku...
34. AWS down
...anche grazie alla priorità acquisita per aver
attivato un database dedicato :)
Ecco la mail che mi ha fatto tirare un sospiro di
sollievo dopo più di 24 ore di agonia:
35. Lesson Learned
Quindi: i sistemi di cloud computing
non sono così sicuri come sembrano?
36. Lesson Learned
Heroku ha affermato che: “Se non riescono a
risolvere il problema i tecnici di AWS,
probabilmente non ci può riuscire nessun altro al
mondo”.
Quora ha scritto: “Senza AWS non esisteremmo”
38. Lesson Learned
George Reese infatti scrive su un blog di
O’Reilly (*): “it was the cloud’s shining moment,
exposing the strength of cloud computing”
(*): http://broadcast.oreilly.com/2011/04/the-aws-outage-the-clouds-shining-
moment.html
39. Cloud computing
Il cloud computing è stato una rivoluzione che
ha permesso l’accesso a sistemi:
• Affidabili e a disponibilità immediata
• Robusti e sicuri
• Scalabili
• Standard
• Con costi associati all’utilizzo
40. Cloud computing
Il tutto a una frazione del costo di una
infrastruttura tradizionale
Questo è particolarmente importante per una
startup (lean) senza rinunciare alla sicurezza e
affidabilità del servizio offerto
41. Cloud computing
Fino a qualche anno fa i servizi offerti dai
sistemi di cloud erano nella maggior parte dei
casi inaccessibili per una startup
50. Cloud computing: design for failure
Design for failure
“The application is responsible for its own
availability, regardless of the reliability of the
underlying cloud infrastructure”
51. Cloud computing: design for failure
Design for failure
“The strength of cloud computing is that it puts
control over application availability in the hands
of the application developer and not in the
hands of your IT staff, data center limitations, or
a managed services provider”
55. What’s a startup?
A startup is first of all an experiment, it is a human
institution designed to deliver a new product or
service under conditions of extreme uncertainty
(From Lessons Learned blog By Eric Ries)
88. Business Plans
While the death of the business plan as a
method to engage investors is a welcome
development, it doesn’t eliminate the need to
think through your business – a process aided
by, ironically, the writing of a business plan.
104. What’s a Lean Startup?
Problem:
unknown
Solution:
unknown
105. A classic full-featured product
Yes...it can be well organized, but not all features are
required to your lean startup.
106. Minimum Viable Product
MVP: A product with the
fewest number of features
needed to achieve a
specific objective, for
which users are willing to
‘pay’ in some form of a
scarce resource.
107. Intermediate MVPs
Final MVPs test the business model
Intermediate MVPs test high risk
components of the business model.
108. Early Adopters
The MVP is for your first customers:
they are called Innovators and Early adopters.
113. MVP
on Blomming
on his
blogs/websites
on Facebook
Creating a Shop
on Blomming a
merchant can On existing
immediately sell... websites /
community
API
on mobiles