Apriori

Métriques

Comment ça marche

1. Sélectionner les groupes apparaissant fréquemment

Principe apriori: tous les sous-ensembles d’un ensemble d’éléments fréquent doivent être fréquents.

  1. Pour chaque items de la base de données, compter le nombre de fois qu’il occure (C1).

  2. Supprimer les éléments qui n’apparaissent pas fréquemment (L1). Le seuil à partir duquel un élément est considéré comme fréquent est un hyperparamètre — ex: apparaît dans au moins 1% des commandes.

  3. Avec les éléments qui restent, créer des combinaisons de 2 (C2) — les articles qui ont été achetés ensemble sont mis dans un groupe.

  4. Supprimer les combinaisons qui apparaissent le moins fréquemment (L2).

  5. Avec les combinaisons qui restent, créer des combinaisons de 3 (C3). Et répéter ce processus jusqu’à ce qu’il ne soit plus possible de générer des groupes plus gros.

2. Générer les règles d’association

Calculer la confiance antecedant/conséquent pour chaque groupe d’éléments apparaissant souvent ensemble.
Forme: “Antecedent → Consequence [support, confidence]”

Si une personne achète le produit A, il y a 66% de chances qu’elle achète le produit C. Si elle achète le produit C, il y a 100% de chances qu’elle achète le produit A.

Apriori.ipynb
Association Rules Generation from Frequent Itemsets