Fonction d'initialisation des parametres

Idée

Avant tout apprentissage, on tire au hasard les coefficients et le décalage : c'est le point de départ de la trajectoire qu'on va corriger pas a pas.

Outil

Condition initiale d'une suite recurrente : on choisit $u_0$ avant d'iterer $u_{k+1} = f(u_k)$.

Formule

Dans la fonction initialisation(X), on tire $W$ avec np.random.randn(X.shape[1], 1). Justifier ce choix de forme : pourquoi $X.shape[1]$ ? Pourquoi un $1$ supplementaire ? Que se passe-t-il si l'on remplace par np.random.randn(X.shape[0]) ?

Piège

Vidéo 5 : b est UN nombre réel pour un neurone. L'apprenant écrit b = np.zeros(2) (vecteur) — broadcasting silencieux fait passer le code mais Z reçoit deux biais, n'est plus celui du modèle voulu. Le présentateur insiste : b shape vide (scalaire), pas (1,) ni (n,).