Artificial Neural Network

Le modèle du cerveau


McCulloch-Pitts (MCP) Neuron

McCulloch-Pitts Neuron — Mankind’s First Mathematical Model Of A Biological Neuron
Some specific models of artificial neural nets


Linear Threshold Unit (LTU)

Perceptron

Perceptron.ipynb


Adaptive Linear Neuron (ADALINE)


Architecture du neurone

On a désormais l’architecture d’un neurone telle qu’elle existe aujourd’hui:

  1. Des entrées

  2. Une fonction qui effectue la somme des entrées pondérées par leur poids (∑p = w ⋅ x + b)

  3. Une fonction d’activation, qui convertit la somme pondérée en sortie.
    La fonction d’activation utilisée jusqu’à présent est appelée heaviside step function (0 si ∑p <= 0, 1 sinon)

  4. Une fonction coût, dont on calculera la dérivée pour minimiser l’erreur.
    La fonction coût utilisée dans Adaline est l’erreur carrée (∑(y̅ - y)²)

  5. Un optimiseur, algorithme utilisé pour minimiser la fonction coût.
    L’optimiseur utilisé jusqu’à présent est gradient descent.


Artificial neural network (ANN)

Layers

Forward & back propagation

Initialisation des poids

Lors de l’initialisation, les poids doivent

  1. Avoir une petite valeur
  2. Avoir une valeur différente des autres poids
  3. Avoir un bon niveau de variance

Il existe différentes manières d’initialiser les poids:

Settings


Optimisation des performances

Exploding & vanishing gradients

Capacité

Batch Normalization

Early Stopping

Dropout

Transfer learning