Jeu de données MNIST

Idée

Une collection célèbre de 70 000 images de chiffres écrits à la main, scannées et alignées sur des grilles 28×28.

Outil

Comme un échantillon statistique de taille 60 000 + un échantillon de validation de taille 10 000 — le découpage classique entre données d'apprentissage et données de test, hérité de la statistique inférentielle.

Formule

Cell 3 du notebook charge MNIST et appliqué une transformation. Sans regarder, donner la bibliothèque et la transformation (au moins le pattern).

Piège

MNIST à une réputation : 'tout marche dessus'. Faux ici. Le MLP 2 couches du notebook plafonne à 70% (Cell 18). Pour atteindre 97% il faut un réseau plus profond (Cell 19 : 3 couches + ReLU). MNIST est facile pour un CNN moderne mais reste un challenge pour un MLP simple — la performance dépend du modèle, pas du dataset.