Pilier 8

Réseau à 2 couches (Multi-Layer Perceptron)

Piège

Tentation : écrire $W_1$ de forme $(n_0, n_1)$ par analogie avec scikit-learn ($X W$). Avec la convention « colonne = exemple » de ce notebook ($X \in \mathbb{R}^{n_0 \times m}$), c'est l'inverse : $W_1$ a la forme $(n_1, n_0)$ et le produit s'écrit $W_1 X$, pas $X W_1$ — sinon les shapes ne se referment pas et l'erreur n'apparaît qu'à la première multiplication.