✅ Aides-mémoire

Ce document rassemble tous les aides-mémoire du cours, organisés par chapitre.

Visualisation de 3 variables ou plus

Graphiques bidimensionnels

Création de tableaux de bord interactifs (Dashboards) avec des outils comme Plotly et Dash

Regroupement et segmentation des données avec la fonction GroupBy

Analyse des relations entre variables : Covariance et Corrélation

Les statistiques descriptives de base

Techniques pour atténuer le surajustement

Métriques pour la classification

Méthodes de validation pour fiabiliser les résultats

Métriques pour la régression

Encodage des variables catégorielles pour les algorithmes : Label Encoding et One-Hot Encoding

Transformation des données : Normalisation (Min-Max, Z-score) et discrétisation (binning)

Harmonisation des formats et correction des erreurs

Compréhension des concepts clés

Différences fondamentales entre l’apprentissage supervisé et non supervisé

Méthodes d’ensemble pour améliorer les performances

Algorithmes de Clustering et techniques de réduction de dimensionnalité

L’art du “Data Storytelling” : choisir les bonnes visualisations pour faire passer un message

Conception de tableaux de bord interactifs et de rapports écrits

Importance de communiquer avec transparence sur la fiabilité et les limites du modèle