Formation en individuel avec un formateur à distance. Le support de formation sera remis au stagiaire en fin
de formation.
Présentation de la formation python Panda
Lire des données, les formatter pour en faire des graphiques de datavisualisation. Cette formation est conçue pour permettre aux développeurs, analystes de données et professionnels du numérique de maîtriser Pandas, l’une des bibliothèques les plus puissantes de l’écosystème Python pour la manipulation et l’analyse de données. À travers une approche progressive et orientée pratique, les participants apprendront à importer, structurer, nettoyer et analyser efficacement des ensembles de données de tailles variées. La formation Python Panda couvre les concepts fondamentaux tels que les structures de données principales de Pandas, notamment les DataFrame et les Series, ainsi que les opérations essentielles comme le filtrage, l’agrégation, la transformation et la fusion de données provenant de différentes sources.
Au fil des modules, les apprenants découvriront comment automatiser des traitements de données, gérer les valeurs manquantes, manipuler des fichiers courants comme les formats CSV ou Excel, et produire des analyses claires et exploitables. L’accent est mis sur la compréhension des méthodes les plus utilisées en analyse de données afin de permettre aux participants de gagner en productivité et de manipuler des volumes importants d’informations avec efficacité.
Grâce à de nombreux exemples concrets et exercices pratiques, les participants développeront les compétences nécessaires pour intégrer Pandas dans leurs projets professionnels. À l’issue de la formation, les apprenants seront capables d’utiliser Pandas de manière autonome pour analyser, transformer et exploiter des données dans différents contextes, notamment en data analysis, data science ou automatisation de tâches liées aux données.
Rappel des notions fondamentales de Python
- Les variables et types
- Les opérateurs
- Structure de controles
- Structures de données
- Fonctions
- Les objets en Python et la programmation orientée objet
Panda en bref
- Présentation de Panda
- Installer Panda depuis le terminal
- Installer Jupyter Notebook
- Installation de Pandas et ses dépendance depuis Notebook
- Tour rapide des quelques fonctionnalités de Notebook
- Fondamental : le Serie
- Fondamental : le DataFrame
- Fondamental : l’index
Utiliser l’objet Series
- Construire un objet Series à partir d’une liste et d’un dictionnaire
- Différence en attributs et méthodes
- Manipuler une Series
- Appliquer une fonction personnalisée à une Series avec apply()
Utiliser l’objet Dataframe
- Tour des fonctionnalités de Dataframe de Panda (Cheatsheet)
- Créer un objet Dataframe
- Méthodes et attributs de Dataframe
- Ordonner par index ou valeur
- Manipulation de colonnes
- Ajouter une ligne
- Enlever les doublons
Dataframe : Filtrage de données
- Les problèmes engendrés par les valeurs manquantes
- Filtrer les données lors de la consultation
Tracer des graphiques avec matplotlib
- Notions sur les graphiques dans Pandas
- Tracé d’un graphique de bourse
- Tracer un graphique après calcul
- Plus de style avec les graphiques
- Tracer plusieurs graphiques
- Tracé de deux graphiques avec des échelles différentes
- Tracé avec d’autres types de graphique
- TimeSeries ; travailler avec les données temporelles
Graphiques de bourse avec Matplotlib
- Tracer les moyennes mobiles
- Tracer les bandes de bollinger
- Tracer des bougies japonaise avec la librairie mlpfinance
- Ateliers graphiques
Tracer des cartes colorée Choropleth
- C’est quoi un choropleth?
- Tracer des cartes avec Geopandas 1/4
- Tracer des cartes avec Geopandas 2/4
- Tracer des cartes avec Geopandas 3/4
- Tracer des cartes avec Geopandas 4/4
- Trouver des données à tracer
- Exemple pratique Variation population aux USA 2020-2021 1/4
- Exemple pratique Variation population aux USA 2020-2021 2/4
- Exemple pratique Variation population aux USA 2020-2021 3/4
- Exemple pratique Variation population aux USA 2020-2021 4/4
- Exercice : Carte de France
- Corrigé exercice Carte de France
Lecture et écriture de fichier sous différents formats
- Ouvrir et écrire un fichier Excel
- Ouvrir et écrire un fichier csv
- Lire et écrire dans une table en SQL
Autres ressources
Durée de la formation 8 semaines. Coaching individuel, 8 heures de visio conférence, exercices, QCM.
Les ressources continuent d’être accessibles après la fin de la formation.
Résultat attendu
A l’issue de la formation, l’apprenant sera en mesure de lire les données depuis une base de données, un
fichier Excel,
d’écrire les données, de transformer les données, d’afficher les données, de nettoyer les données en vue de tracer
dans un graphique.
