Le document présente un retour sur la Chaos Conf de septembre 2018, abordant l'importance de l'ingénierie du chaos et de l'observabilité dans les systèmes distribués. Des experts comme Kolton Andrus et Adrian Cockroft mettent en avant la nécessité d'une approche proactive vis-à-vis des pannes, tout en proposant une taxonomie des pannes pour mieux comprendre et gérer les incidents. Enfin, des stratégies d'influence sont partagées pour convaincre les décideurs d'adopter des pratiques de chaos engineering.