Idée
Tout l'apprentissage tient en quatre lignes repetees : calcul des sorties, mesure de l'erreur, calcul des pentes, correction des coefficients.
Outil
Suite recurrente vectorielle $(W_k, b_k) = T(W_{k-1}, b_{k-1})$ ou $T$ est l'opérateur de descente, qu'on itere jusqu'a stabilisation.
Formule
Le présentateur calculé l'accuracy après entraînement et donné un nombre exact. Sans regarder, donner ce pourcentage.
Piège
Vidéo 5 : Loss.append(log_loss) à chaque itération. OK pour 100 itérations. Pour 100 000 itérations, la liste pèse 800 KB de floats — pas critique. Mais si on stocke aussi W, b à chaque iter (pour animation), la mémoire explose. Pratique courante : stocker tous les 100 ou 1000 iter.