Pilier 3

Le perceptron — neurone artificiel à un seuil doux

Idée

Un perceptron prend en entrée un vecteur de mesures, fait la somme pondérée de ses coordonnées, ajoute un décalage constant, puis écrase le tout dans l'intervalle $[0,1]$ via une courbe en S.

Outil

Régression affine $z = \langle w, x\rangle + b$ de spé MPSI post-composée avec une saturation ; coefficients $w$, $b$ déterminés par minimisation d'une erreur empirique.

Formule

$a = \sigma(z)$ avec $z = \langle w, x \rangle + b$ et $\sigma(z) = 1/(1 + e^{-z})$.

Piège

On prend un perceptron pour un classifieur universel parce qu'il est « le neurone du réseau ». Faux : un perceptron seul ne sépare que ce qui est linéairement séparable — XOR le casse, et c'est précisément ce qui motive l'empilement en MLP.