Coût d'un réseau et descente de gradient — le même geste qu'un seul neurone

Idée

On mesure l'erreur entre la prédiction et la vérité, on regarde comment cette erreur change quand on bouge chaque réglage, on déplace chaque réglage dans le sens qui fait baisser l'erreur.