Backpropagation

Piège

Vidéo 9 : dZ1 = W2.T @ dZ2 * A1 * (1 - A1). Le .T est essentiel pour la cohérence dimensionnelle (n_1 = W2.T axis 0 doit être n_1 = dZ2 axis 0 wait). Sans .T, broadcasting silencieux ou erreur. C'est la ligne où la transposition fait la différence entre 'ça marche' et 'ça plante'.