Le document traite du développement de ressources en swahili pour un système de reconnaissance vocale. Il souligne l'importance du swahili en tant que langue largement parlée en Afrique de l'Est, ainsi que les défis liés à la création de corpus audio et à la transcription. Des méthodes variées ont été utilisées pour collecter des données, incluant le crowdsourcing et la transcription collaborative.