Les statistiques inférentielles se basent sur les statistiques descriptives et les probabilités pour tirer des conclusions générales (inférences) sur une population à partir d’échantillon(s)
Pour tirer des inférences, on commence par formuler une hypothèse d’étude. Ex:
À partir de l’hypothèse d’étude, on formule deux autres hypothèses:
L’hypothèse nulle (notée H0)
Est l’hypothèse qu’il n’y a pas d’effet (pas de relation significative) entre les variables testées.
Ex: Il n’y a pas de corrélation significative entre stress et ulcère (la moyenne des ulcères entre le groupe stressé et le groupe non stressé est égale).
L’hypothèse alternative, (notée H1 ou HA)
Est l’hypothèse inverse: qu’il y a un effet entre les variables testées.
Ex: On observe une corrélation significative entre stress et ulcère (moyennes non égales).
Pour trancher entre les deux, on a alors deux approches possibles:
L’approche fréquentiste consiste à calculer le petit p (p-value en anglais), qui est la probabilité d’obtenir un effet au moins aussi extrême que celui observé en supposant que l’hypothèse nulle est vraie.
Une valeur p élevée signifie qu’il y a une forte probabilité que les résultats obtenus soient dû au hasard. Au contraire, une valeur p faible, qu’il est peu probable que ce soit un hasard et donc que les résultats observés sont statistiquement significatifs.
L’approche bayesienne calcule la probabilité qu’une hypothèse soit meilleure que l’autre. L’approche bayesienne tente de tenir compte des connaissances et des données antérieures qui pourraient influencer les résultats finaux, contrairement à l’approche fréquentiste.