Ce support de cours est destiné aux étudiants du Master Intelligence Artificielle et Génie Informatique de la Faculté Polydisciplinaire de Khouribga (FPK), relevant de l’Université Sultan Moulay Slimane (USMS).
Il s’inscrit dans le cadre du module Python pour les sciences de données et vise à fournir une maîtrise progressive et pratique de la bibliothèque Pandas, pilier fondamental de la manipulation et de l’analyse de données tabulaires en Python.
Le document couvre l’ensemble des concepts essentiels de Pandas, depuis les bases jusqu’aux usages avancés, notamment :
- la découverte des structures de données Series et DataFrame ;
l’importation, l’exploration et le nettoyage de jeux de données réels (CSV, Excel, JSON, etc.) ;
- les opérations de transformation, d’agrégation et de combinaison des données (groupby, pivot tables, jointures, concaténations) ;
- la gestion des données temporelles et des index avancés ;
- la préparation des datasets pour les applications en Machine Learning et Intelligence Artificielle, avec une intégration naturelle vers Scikit-learn.
Les exemples et études de cas s’appuient principalement sur le dataset Titanic, permettant une approche concrète et pédagogique, orientée vers les usages réels en Data Science.
Ce support se veut à la fois :
- un cours structuré pour l’apprentissage académique,
- un guide pratique pour les travaux dirigés et projets,
- et une référence pour la préparation des données dans les projets d’IA et de Data Science.