L'astuce $dZ$ : factoriser la base commune des gradients

Piège

Sémantiquement les deux écritures sont identiques en math. Mais le record /008 a été rejeté pour une formule erronée. Le bon code est dZ2 = A2 - Y (sans le 1/m, intégré dans la sommation/multiplication suivante quand on calcule dW2). Discipline : suivre l'implémentation du notebook, pas le transcript brut de la vidéo.