Idée
Au lieu de calculer le gradient sur les 60 000 images à chaque pas, on coupé le dataset en petits paquets de 64 images et on met a jour les poids après chaque paquet ; un passage complet sur les 60 000 images est appelé une epoch.
Au lieu de calculer le gradient sur les 60 000 images à chaque pas, on coupé le dataset en petits paquets de 64 images et on met a jour les poids après chaque paquet ; un passage complet sur les 60 000 images est appelé une epoch.