Introduction

Intelligence Artificielle

Machine Learning

Types d’algorithmes

On distingue généralement 3 grands types d’algorithmes de machine learning: supervisé, non supervisé et par renforcement.

Supervisé

Non supervisé

Par renforcement

Natural Language Processing (NLP)

Le traitement du langage naturel (natural language processing en anglais ou NLP) est un des domaines d’application de l’intelligence artificielle: la capacité d’un ordinateur à traiter et comprendre le langage humain. Parmis les applications les plus communes du NLP on trouve:

Analyse des données

Data Science

Big Data

Data Lake

Data Mining

L’extraction de connaissances (data mining en anglais) consiste à chercher des informations utiles parmis les données dont on dispose. Contrairement à l’analyse traditionnelle, le data mining ne s’occupe pas de collecter des données de manière efficace (sondages, base de données, etc), mais à exploiter ce qu’on a. La méthaphore “extraction/mining” (comme dans exploitation minière) sous entend qu’il y a des pépites cachés sous des montagnes de données. Le data mining implique d’extraire, nettoyer, transformer, modeler les données avec des algorithmes de machine learning et visualiser les données.

Métiers du Machine Learning

Terminologie

Workflow d’un projet

Typiquement, un projet de Machine Learning / Data Science suit le cycle de vie “CRISP-DM” (Cross Industry Standard Process for Data Mining):

  1. Formuler le problème
  2. Collecter et formatter les données
  3. Préparer et analyser les données
  4. Construire un modèle
  5. Évaluer et optimiser les performances
  6. Déployer

Les différentes étapes sont présentées séquentiellement — de 1 à 6, du problème au déploiement — mais en réalité le développement en machine learning n’est pas linéaire: on évalue le modèle, on change les caractéristiques, on acquiert plus de données, on change les hyper-paramètres. Le processus est entièrement entremelé.