Idée
Un perceptron prend en entrée un vecteur de mesures, fait la somme pondérée de ses coordonnées, ajoute un décalage constant, puis écrase le tout dans l'intervalle $[0,1]$ via une courbe en S.
Pourquoi
Un perceptron prend en entrée un vecteur de mesures, fait la somme pondérée de ses coordonnées, ajoute un décalage constant, puis écrase le tout dans l'intervalle $[0,1]$ via une courbe en S. C'est un dispositif de décision : il dit si l'exemple est plutot dans la classe 0 ou dans la classe 1. C'est l'analogue d'une régression affine $z = \langle w, x\rangle + b$ de spé MPSI, post-composée avec une fonction de saturation, dont les coefficients $w$ et $b$ sont a determiner par minimisation d'une erreur empirique. À retenir : un perceptron seul ne sépare que ce qui est linéairement séparable — XOR le casse, et c'est ce qui motivera l'empilement.
Outil
Régression affine $z = \langle w, x\rangle + b$ de spé MPSI post-composée avec une saturation ; coefficients $w$, $b$ déterminés par minimisation d'une erreur empirique.
Formule
$a = \sigma(z)$ avec $z = \langle w, x \rangle + b$ et $\sigma(z) = 1/(1 + e^{-z})$.
Piège
On prend un perceptron pour un classifieur universel parce qu'il est « le neurone du réseau ». Faux : un perceptron seul ne sépare que ce qui est linéairement séparable — XOR le casse, et c'est précisément ce qui motive l'empilement en MLP.
Diagramme
graph LR x1((x1)) --> sum[somme ponderee + biais] x2((x2)) --> sum x3((x3)) --> sum sum --> sig[courbe en S sigma] sig --> y((sortie dans 0..1))