Voiture & Réseau de neurones

Introduction aux réseaux de neurones
Le réseau de neurones (RdN) utilisé ici sera un perceptron multicouche.
Les coefficients en entrée seront les longueurs des n rayons (en gris sur le schéma suivant) partant de la voiture jusqu'au premier mur rencontré par le rayon.
Le RdN peut alors donner 3 ordres possibles : ne pas tourner, tourner un peu à gauche ou tourner un peu à droite. (La vitesse étant prise fixe dans cette application)

Deux méthodes d'apprentissage sont alors possibles avec pour chacune d'entre elles des qualités et des défauts.

Apprentissage via un algorithme génétique, c'est-à-dire en partant de plusieurs RdN que l'ont fait évoluer « selon les lois de l'évolution ».

Plus précisément, on détermine quel RdN est le plus efficace pour réaliser le circuit et on génère à partir de lui un certain nombre d'autres réseaux dont les différents coefficients peuvent avoir mutés.
On réitère alors le même processus sur nos nouveaux RdN jusqu'à en obtenir un suffisament efficace.

Apprentissage par rétropropagation des erreurs, c'est-à-dire que le RdN évoluera en comparant à chaque instant la décision prise par l'être humain dans le circuit et celle que le RdN lui-même aurait choisi.

Si les deux décisions sont différentes, le RdN modifiera alors ses coefficients afin d' « apprendre à agir comme l'être humain ».

Note : L'algorithme employé ici sera celui de rétropropagation du gradient.