Distributions de probabilité

Loi de probabilité

Pour rappel, une distribution de probabilité (ou loi de probabilité) est la liste de tous les résultats possibles et leur probabilité associée. La table ci-dessus montre la probabilité de distribution pour la somme de deux dé.

Lois usuelles

Il existe un certain nombre de situation qu’on retrouve très fréquemment en théorie des probabilités. On a donc définit des variables aléatoires spécifiques pour ces types d’expériences, et quand une des expérience à modéliser se ramène à une situation usuelle, alors on peut directement utiliser les formules de cette loi pour connaître les probabilités, moyenne et variance associées.

Fonction de distribution de probabilité

Une fonction de distribution de probabilité est une fonction qui, pour un résultat possible, retourne la probabilité associée.

Il y a 3 types de fonctions de distributions de probabilité:


Distribution uniforme discrète

Probabilité d’un succès parmis n événements équiprobable.

\[f(x) = \mathbb{P}(X = k) = \frac{1}{n}\] \[\mathbb{E}(X) = \frac{n + 1}{2}\] \[\mathbb{V}(X) = \frac{n^2 - 1}{12}\]
Ex: On a un dé de 6 faces.
Quelle est la probabilité de tomber sur le numéro 1?
uniform(6) = 1/6

Démonstrations

Distribution de Bernouilli

Épreuve aléatoire qui n’a que deux résultats possibles: succès ou échec. Un autrement dit Ω = {0,1}.

\[\begin{aligned} \mathbb{P}(X = x) &= \begin{cases} p & \text{si } x = 1, \\ 1-p & \text{si } x = 0 \end{cases} \\[5pt] &= p^x (1-p)^{1-x}, x \in {0,1} \end{aligned}\]


\[\mathbb{E}(X) = p\] \[\mathbb{V}(X) = p \times (1 - p)\]
Ex: On a un groupe de 10 personne, dont 6 aiment chanter.
Quelle est la probabilité qu'une personne aime chanter?
P(x = 1) = 0.6

Quelle est la probabilité qu'une personne n'aime pas chanter?
P(x = 0) = 1-0.6 = 0.4

Quelle est la variance des données?
V(X) = 0.4 * 0.6 = 0.24

Distribution binomiale

Probabilité de k succès parmis n événements indépendants, chaque événement ayant une probabilité de p.
Répond à “combien de succès pour n essais”?

\[f(k) = \mathbb{P}(X = k) = \binom{n}{k}p^k (1-p)^{n-k}\] \[\mathbb{E}(X) = np\] \[\mathbb{V}(X) = p \times (1 - p) \times n\]
Ex: Un couple a 5 enfants.  
Quelle est la probabilité qu'ils aient 3 filles?

binom(5,3) = C(5,3) (0.5)**3 × (1 - 0.5)**(5-3)
           = 5!/(3!(5-3)!) × 0.125 × 0.25
           = (5*4)/2 × 0.125 × 0.25
           = 0.3125 ≈ 31%
Ex: Lucas a 20% de chance de réussir un lancer franc.
Il vaut en faire 4. Quelle est la probabilité qu'il en réussise exactement 2 sur les 4?

binom(2,4) = C(4,2) 0.2**2 0.8**2
           = 4!/(2!(4-2)!) × 0.04 × 0.64
           = 6 × 0.04 × 0.64
           = 0.1536

Graphiquement, la loi de probabilité d’une loi binomiale a une forme de cloche.
Plus le taux de succès est petit, plus la distribution est décentrée vers la gauche. Et plus le taux de succès est élevé, plus la distribution est décentrée vers la droite.

Distribution de Poisson

Probabilité que k événements se réalisent pendant un intervalle continu donné (typiquement une durée ou une longueur).
Répond à “combien d’événements pendant un intervalle donné”?

Pour utiliser la distribution Poisson, les conditions suivantes doivent être réunies:

  1. Les intervalles sur lesquels les événements se produisent ne se chevauchent pas
  2. Les événements sont indépendants
  3. La probabilité que plusieurs événements se produisent sur une très courte période de l’intervale est d’environ 0

La distribution de Poisson peut-être utilisée comme une estimation de la distribution binomiale quand n est grand (que le calcul des factorielles devient trop long à effectuer).

\[\begin{aligned} f(k) = \mathbb{P}(X = k) &= \frac{e^{-np} \times (np)^k}{k!} \\ &= \frac{e^{-\lambda} \times \lambda^k}{k!}, \lambda = np \end{aligned}\] \[\mathbb{E}(X) = \lambda\] \[\mathbb{V}(X) = \lambda\]
Ex: Vous possèdez un restaurant où, en moyenne, 100 personnes viennent tous les jours.  
Quelle est la probabilité que 125 personnes qui viennent dans votre restaurant aujourd'hui?

P(X = 125) = (e**(-100) * 100**125)/125!
           ≈ 0.00198
           ≈ 0.198%

Poisson distribution calculator

Distribution géométrique

Probabilité de succès au n-ème essai.
Répond à “combien d’essais avant un succès”? À ne pas confondre avec la distribution binomiale, qui est utilisée pour déterminer la probabilité d’un nombre de succès k pour un nombre d’essais n.

Pour utiliser la distribution géométrique, les conditions suivantes doivent être réunies:

  1. Chaque essai est soit un succès soit un échec
  2. Chaque essai est indépendant
  3. La probabilité de succès et d’échec est constante d’un essai à l’autre
\[f(x) = \mathbb{P}(X = x) = p \times (1-p)^{x-1}\] \[\mathbb{E}(X) = \frac{1}{p}\] \[\mathbb{V}(X) = \frac{p}{(1 - p)^2}\]
Ex: Vous lancez un dé 3 fois de suite.  
Quelle est la probabilité de n'obtenir un 6 qu'au 3ème essai.

A = obtenir un 6
x = 3
p = 1/6

geom(3) = (1/6) * (1 - 1/6)**(3-1)
        = (1/6) * (5/6)**2
        = 25/216
        ≈ 0.1157

En moyenne, combien d'essais faut-il avant d'obtenir un succès (tomber sur un 6)?
E = 1/p = 1/1/6 = 6

Distribution de Pascal (ou binomiale négative)

Probabilité de k succès au n-ème essai.
Répond à “combien d’essais avant k succès”?

\[\begin{aligned} f(k) = \mathbb{P}(X = k) &= \binom{n-1}{k-1} p^k (1-p)^{n-k} \end{aligned}\] \[\mathbb{E}(X) = \frac{k}{p}\] \[\mathbb{V}(X) = \frac{k \times (1 - p)}{p^2}\]
Ex: On souhaite trouver 3 personnes ayant été à l'étranger au moins une fois dans leur vie.  
On part du principe que la probabilité qu'une personne soit déjà allé à l'étranger est de 50%.
Quelle est la probabilité qu'il nous faille demander à 10 personnes pour obtenir 3 succès?

pascal(10,3) = C(10-1,3-1) * 0.5**3 * (1 - 0.5)**(10-3)
             = 9!/(2!(9-2)!) * 0.5**3 * 0.5**7
             = 36 * 0.5**3 * 0.5**7
             ≈ 0.035

Distribution hypergéométrique

Probabilité de k succès pour n tirages sans remise parmis N éléments.

\[\mathbb{P}(X = k) = \frac{ \binom{pN}{k} \binom{(1-p)N}{n-k} }{\binom{N}{n}}\] \[\mathbb{E}(X) = np\] \[\mathbb{V}(X) = np(1-p) \frac{N - n}{N - 1}\]
Ex: Une urne contient 50 boules, dont 5 vertes et 45 rouges.  
En tirant 10 boules, quelle est la probabilité d'obtenir 4 vertes?

N = 50
p = 5/50 = 0.1
n = 10
k = 4

P(X = 4) = (C(0.1*50,4) * C(0.9*50,10-4)) / C(50,10)
         = (C(5,4) * C(45,6)) / C(50,10)
         = (5 * 8145060) / 10272278170
         ≈ 0.0040
         ≈ 0.4%

Distribution uniforme continue

Distribution uniforme sur un intervalle continu.

\[f(x) = \frac{1}{b-a}, a \lt x \lt b\] \[\mathbb{E}(X) = \frac{a+b}{2}\] \[\mathbb{E}(X) = \frac{(a-b)^2}{12}\]
Ex: On génère du bruit blanc entre 5 et 16 kHz.  
Quelle est la probabilité de générer un son de 7.3 kHz?

P(7.3) = 1/(16-5) = 1/11 ≈ 0.09

Distribution exponentielle

Probabilité qu’il se passe un intervalle t entre deux événements.
La distribution de Poisson est une distribution discrète qui nous donne la probabilité que le nombre d’événements se produisant pendant un intervalle donné soit x. La distribution exponentielle est une distribution continue qui nous donne la probabilité qu’il nous faille un intervalle inférieur à x pour réaliser un événement.
Répond à “quel intervalle avant le prochain événement”?

Les conditions pour utiliser la distribution exponentielle sont les mêmes que pour la distribution de Poisson:

  1. Les intervalles sur lesquels les événements se produisent ne se chevauchent pas
  2. Les événements sont indépendants
  3. La probabilité que plusieurs événements se produisent sur une très courte période est d’environ 0
\[f(x) = \begin{cases} \mathbb{P}(X < x) = 1 - e^{-\lambda x} \\ \mathbb{P}(X > x) = e^{-\lambda x} \end{cases}\] \[\mathbb{E}(X) = \frac{1}{\lambda}\] \[\mathbb{V}(X) = \frac{1}{\lambda^2}\]
Ex: Vous réalisez en moyenne 6 devoirs par heure.

Quelle est la probabilité que vous complétiez 2 problèmes en 20 minutes?  
Utilise la distribution de Poisson.  
λ: (20 min)*(6 problèmes / 60 min) = 2

P(X < 2) = P(X = 0) + P(X = 1)
         = (e**(-2) 2**0)/0! + (e**(-2) 2**1)/1!
         = (e**(-2) 1)/1 + (e**(-2) 2)/1
         ≈ 0.40

Quelle est la probabilité qu'il vous faille entre 5 et 8 minutes pour réaliser un devoir?  
Utilise la distribution exponentielle.
λ = 1*6/60 = 0.1

P(5 < X < 8) = P(X < 8) - P(X < 5)
             = 1-e**(-0.1*8) - [1-e**(-0.1*5)]
             = -e**(-0.1*8) + e**(-0.1*5)
             ≈ 0.1575

Video de l’exemple: The Difference Between Poisson and Exponential Distributions

Distribution Gamma

Probabilité qu’il se passe un intervalle t avant la réalisation du kème événement.
La distribution Gamma est une généralisation de la distribution exponentielle (= avec k événements et non plus un seul).
Répond à “quel intervalle avant k événements”?

Les conditions pour utiliser la distribution Gamma sont les mêmes que pour la distribution de Poisson et la distribution exponentielle:

  1. Les intervalles sur lesquels les événements se produisent ne se chevauchent pas
  2. Les événements sont indépendants
  3. La probabilité que plusieurs événements se produisent sur une très courte période est d’environ 0
\[\mathbb{P}(X < x) = \int_0^x \frac{1}{\Gamma(k)} \times \frac{1}{\lambda^{k}} \times x^{k-1} \times e^{-x/\lambda} \quad dx, \\ \Gamma(x) = \begin{cases} \text{x entier}: & (x - 1)! \\ \text{x réel}: & \int_0^\infty y^{x-1} e^{-y} dy \end{cases}\] \[\mathbb{E}(X) = \lambda k\] \[\mathbb{V}(X) = \lambda^2 k\]
Ex: vous êtes livreur de pizza.
Il vous faut en moyenne 20 minutes pour livrer une pizza.
Quelle est la probabilité qu'il vous faille
moins de 60 minutes pour livrer 3 pizzas?

P(X < 60) = int(0,60) 1/2 * 1/20**3 x**2 e**(-x/20) dx
          ≈ .577

Video: Gamma Basics
Integral calculator

Distribution normale (aka distribution Z ou Laplace-Gauss)

Ex: Une variété de pin a un diamètre moyen de 150cm et un écart-type de 30cm.  
On sait que le diamètre des pins est normalement distribué.
Quel est la probabilité de trouver un pin de diamètre supérieur à 210cm?

1. Calculer le z-score de 210:
   z = (x - mu)/sigma
     = (210 - 150)/30
     = 2

2. Utiliser la Z table pour trouver la probabilité que z > +2.00
   P(z > 2) = 1 - .97725
            = .02275 = 2.275%

Théorème de la limite centrale

Erreur-type

Distribution T

Les distributions de moyenne sont normales lorsque la taille des échantillons est suffisamment grande (> 30). Avec une petite taille d’échantillons, la distributions des moyennes n’est pas toujours tout à fait normale, raison pour laquelle on utilise la distribution T au lieu de la distribution Z.

La distribution T change sa forme en fonction de la quantité d’informations disponibles: avec des échantillons de petite taille, la distribution a des extrêmités plus épaisses pour répresenter des estimations plus incertaines. Plus on obtient de données, plus la distribution T tend vers la distribution Z.