Pilier 3

Le perceptron — neurone artificiel à un seuil doux

Idée

Un perceptron prend en entrée un vecteur de mesures, fait la somme pondérée de ses coordonnées, ajoute un décalage constant, puis écrase le tout dans l'intervalle $[0,1]$ via une courbe en S.

Pourquoi

Un perceptron prend en entrée un vecteur de mesures, fait la somme pondérée de ses coordonnées, ajoute un décalage constant, puis écrase le tout dans l'intervalle $[0,1]$ via une courbe en S. C'est un dispositif de décision : il dit si l'exemple est plutot dans la classe 0 ou dans la classe 1. C'est l'analogue d'une régression affine $z = \langle w, x\rangle + b$ de spé MPSI, post-composée avec une fonction de saturation, dont les coefficients $w$ et $b$ sont a determiner par minimisation d'une erreur empirique. À retenir : un perceptron seul ne sépare que ce qui est linéairement séparable — XOR le casse, et c'est ce qui motivera l'empilement.

Outil

Régression affine $z = \langle w, x\rangle + b$ de spé MPSI post-composée avec une saturation ; coefficients $w$, $b$ déterminés par minimisation d'une erreur empirique.

Formule

$a = \sigma(z)$ avec $z = \langle w, x \rangle + b$ et $\sigma(z) = 1/(1 + e^{-z})$.

Piège

On prend un perceptron pour un classifieur universel parce qu'il est « le neurone du réseau ». Faux : un perceptron seul ne sépare que ce qui est linéairement séparable — XOR le casse, et c'est précisément ce qui motive l'empilement en MLP.

Diagramme

graph LR
  x1((x1)) --> sum[somme ponderee + biais]
  x2((x2)) --> sum
  x3((x3)) --> sum
  sum --> sig[courbe en S sigma]
  sig --> y((sortie dans 0..1))