What we learned from AWS outage and why cloud systems are still crucial for startup, if you know how to design for failure, build the right mvp and be a lean startup
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Blomming Lean Startup @ Better Software 2011
1. Come invecchiare in un giorno
per colpa di Amazon... pur essendo Lean!
Nicola Junior Vitto
Blomming
Better Software - June 27, 2011 - Firenze
@njvitto - @blomming
nicola@blomming.com
lunedì 27 giugno 2011
2. L’incubo
Immaginate una mattina (di lavoro)
come tante altre...
lunedì 27 giugno 2011
4. Colazione
Fate tranquillamente colazione
lunedì 27 giugno 2011
5. Vi preparate
Vi preparate per andare a lavoro
lunedì 27 giugno 2011
6. Casa-Ufficio
Uscite di casa per andare in ufficio
lunedì 27 giugno 2011
7. Ufficio
E finalmente vi mettete a lavorare
lunedì 27 giugno 2011
8. Mattina diversa
Tutto come al solito quindi...
lunedì 27 giugno 2011
9. Mattina diversa
...ma prima ho detto una piccola bugia...
lunedì 27 giugno 2011
10. Mattina diversa
Questa mattina è diversa dal solito perchè
attendete l’intervista sulla vostra startup che vi
hanno fatto qualche giorno prima e che andrà in
onda al TG1 del pranzo
lunedì 27 giugno 2011
11. Mattina diversa
...ma sfortunatamente non sarà una giornata
diversa dal solito solo per questo
lunedì 27 giugno 2011
12. Flashback
...tornando a noi facciamo
un breve flashback sui giorni precedenti...
lunedì 27 giugno 2011
17. 21 aprile
Torniamo al 21 aprile...
lunedì 27 giugno 2011
18. 21 aprile
Esattamente alle 10:08 (italiane) il nostro servizio
di monitoring (Ranger)
invia una prima mail che segnala...
DOWN: http://blomming.com
lunedì 27 giugno 2011
19. 21 aprile
Ed ecco cosa mi scrive istantaneamente Andrea
lunedì 27 giugno 2011
20. 21 aprile
Magari fossi io... :(
Vado subito a guardare lo status del nostro
servizio (Heroku) e sembra tutto ok
lunedì 27 giugno 2011
21. 21 aprile
Poco dopo arriva un barlume di speranza...
Ranger ci scrive:
UP: http://blomming.com
lunedì 27 giugno 2011
22. 21 aprile
E sono continuate battute in chat di questo tipo...
lunedì 27 giugno 2011
23. 21 aprile
Ma a un certo punto il peggio
lunedì 27 giugno 2011
24. 21 aprile
Heroku dichiara di avere dei
problemi di connettività e
il sito va infatti ad intermittenza
lunedì 27 giugno 2011
25. 21 aprile
Ma sono ancora le 10:30 e noi continuiamo ad
avere la speranza che per le 14 (ora del servizio
sul TG1) tutto si risolva per il meglio
SO...
lunedì 27 giugno 2011
26. 21 aprile
...Il peggio però non era ancora arrivato...
lunedì 27 giugno 2011
27. AWS down
Poco dopo si diffonde la notizia del vero
problema: un’intera region Amazon Web Service
è down per problemi di networking.
E’ la region USA più grande: quella della Virgina
che è usata anche da Heroku!
lunedì 27 giugno 2011
31. AWS down: re-mirroring storm
Tutto a causa di un errore, probabilmente umano,
di aggiornamento dell’infrastruttura di rete
lunedì 27 giugno 2011
32. AWS down: re-mirroring storm
“Re-mirroring storm”: i server hanno “creduto”
di non essere più collegati alle loro “copie
specchio” (mirror) e hanno iniziato a cercare di
“auto-ripararsi”. Così facendo hanno esaurito lo
spazio disponibile nella loro rete locale e hanno
messo in crisi anche i server di altre reti, che
hanno cercato di “auto-ripararsi” anche loro. Il
problema si è quindi amplificato e ha portato a un
collasso del sistema.
lunedì 27 giugno 2011
33. AWS down
La region Amazon AWS della Virginia ed è
tornata a pieno regime dopo quasi 3 giorni!!!
Blomming.com “fortunatamente” solo dopo
poco più di 24 ore, grazie ad una migrazione in
un’altra region AWS effettuata da Heroku...
lunedì 27 giugno 2011
34. AWS down
...anche grazie alla priorità acquisita per aver
attivato un database dedicato :)
Ecco la mail che mi ha fatto tirare un sospiro di
sollievo dopo più di 24 ore di agonia:
lunedì 27 giugno 2011
35. Lesson Learned
Quindi: i sistemi di cloud computing
non sono così sicuri come sembrano?
lunedì 27 giugno 2011
36. Lesson Learned
Heroku ha affermato che: “Se non riescono a
risolvere il problema i tecnici di AWS,
probabilmente non ci può riuscire nessun altro al
mondo”.
Quora ha scritto: “Senza AWS non esisteremmo”
lunedì 27 giugno 2011
38. Lesson Learned
George Reese infatti scrive su un blog di
O’Reilly (*): “it was the cloud’s shining moment,
exposing the strength of cloud computing”
(*): http://broadcast.oreilly.com/2011/04/the-aws-outage-the-clouds-shining-moment.html
lunedì 27 giugno 2011
39. Cloud computing
Il cloud computing è stato una rivoluzione che
ha permesso l’accesso a sistemi:
• Affidabili e a disponibilità immediata
• Robusti e sicuri
• Scalabili
• Standard
• Con costi associati all’utilizzo
lunedì 27 giugno 2011
40. Cloud computing
Il tutto a una frazione del costo di una
infrastruttura tradizionale
Questo è particolarmente importante per una
startup (lean) senza rinunciare alla sicurezza e
affidabilità del servizio offerto
lunedì 27 giugno 2011
41. Cloud computing
Fino a qualche anno fa i servizi offerti dai
sistemi di cloud erano nella maggior parte dei
casi inaccessibili per una startup
lunedì 27 giugno 2011
42. Cloud computing
Quindi dov’è il problema?
lunedì 27 giugno 2011
43. Cloud computing: design for failure
“Design for failure”(*) (*): George Reese
lunedì 27 giugno 2011
46. Cloud computing: Redundancy
VR VR
VR VR
Physical resource 1 Physical resource 2
Availability Zone
lunedì 27 giugno 2011
47. Cloud computing: Redundancy
VR VR
VR VR
PH 1 PH 3
Availability Zone A Availability Zone B
VR VR
VR VR
PH 2 PH 4
Region
Modello “n-1”
lunedì 27 giugno 2011
50. Cloud computing: design for failure
Design for failure
“The application is responsible for its own
availability, regardless of the reliability of the
underlying cloud infrastructure”
lunedì 27 giugno 2011
51. Cloud computing: design for failure
Design for failure
“The strength of cloud computing is that it puts
control over application availability in the hands
of the application developer and not in the hands
of your IT staff, data center limitations, or a
managed services provider”
lunedì 27 giugno 2011
52. Cloud computing: design for failure
“Design for failure”: si... può... fare!!!
lunedì 27 giugno 2011
54. Startup
...avevo promesso di parlare anche di startup,
vero?
lunedì 27 giugno 2011
55. What’s a startup?
A startup is first of all an experiment, it is a human
institution designed to deliver a new product or
service under conditions of extreme uncertainty
(From Lessons Learned blog By Eric Ries)
lunedì 27 giugno 2011
56. Ideas
How important are ideas?
lunedì 27 giugno 2011
88. Business Plans
While the death of the business plan as a
method to engage investors is a welcome
development, it doesn’t eliminate the need to
think through your business – a process aided
by, ironically, the writing of a business plan.
lunedì 27 giugno 2011
89. Business Models
We said:
“It’s all about business models”
lunedì 27 giugno 2011
104. What’s a Lean Startup?
Problem:
unknown
Solution:
unknown
lunedì 27 giugno 2011
105. A classic full-featured product
Yes...it can be well organized, but not all features are
required to your lean startup.
lunedì 27 giugno 2011
106. Minimum Viable Product
MVP: A product with the
fewest number of features
needed to achieve a
specific objective, for
which users are willing to
‘pay’ in some form of a
scarce resource.
lunedì 27 giugno 2011
107. Intermediate MVPs
Final MVPs test the business model
Intermediate MVPs test high risk
components of the business model.
lunedì 27 giugno 2011
108. Early Adopters
The MVP is for your first customers:
they are called Innovators and Early adopters.
lunedì 27 giugno 2011
113. MVP
on Blomming
on his
blogs/websites
on Facebook
Creating a Shop
on Blomming a
On existing
merchant can
websites /
immediately sell...
community
API
on mobiles
lunedì 27 giugno 2011