Dataset $(X, Y)$ — 100 plantes à deux variables

Piège

Le présentateur dit 'on peut imaginer que ce dataset représente des plantes'. C'est une fiction pédagogique : les données sont générées par make_blobs (sklearn), purement synthétiques. Aucune plante n'a été mesurée. Confondre fiction pédagogique et expérience scientifique fait croire qu'on apprend de la biologie.