Définition du Machine Learning – Lexique

DÉFINITION – MACHINE LEARNING


< Retourner à la catégorie Big Data

Le machine learning, appelé apprentissage automatique en bon français, représente les actions de la conception à l’implémentation de techniques permettant d’utiliser des algorithmes avec des données issues du big data. Il existe plusieurs types de machine learning plus ou moins complexes et plus ou moins adaptées au besoin évoqué.


Le machine learning – aussi appelé apprentissage automatique ou apprentissage statistique – regroupe la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine de remplir des tâches à l’aide d’algorithmes en utilisant le big data.

Le machine learning permet également de résoudre des problématiques complexes liées au big data auxquelles nous ne pourrions répondre sans cet ensemble d’algorithmes. L’analyse effectuée peut se focaliser sur des graphes, arbres, courbes de données ou tout simplement des nombres issus du big data. Le machine learning repose essentiellement sur la combinaison de deux éléments : les algorithmes et le big data. Tous deux, ils permettent à un robot d’adapter ses analyses et ses comportements en se basant sur un ensemble de données provenant d’une source – base de donnée ou capteurs – appartenant bien évidemment à l’ensemble du big data.

Le recours au machine learning repose sur une difficulté importante : une diversité trop importante de comportements qui sont rapidement trop complexes à décrire – on parle d’explosion combinatoire. Merci le big data ! La présence de programmes est donc requise pour ajuster un modèle qui va simplifier cette complexité. Suivant le perfectionnement des programmes et du type de machine learning utilisé, ceux-ci vont intégrer – ou non – un traitement probabiliste des données, d’analyse de données, de reconnaissance ou de data-mining par exemple.

6 types de machine learning

Il existe 6 types de machine learning que nous allons exposer simplement :

  • L’apprentissage supervisé : Il se déroule en 2 temps, des données étiquetées sont intégrées dans le système par un expert puis la machine va étiqueter les nouvelles données entrantes en fonction de celles existantes.
  • L’apprentissage non supervisé : Contrairement au premier cas, le système doit découvrir seul la structure des données et les classer en groupes homogènes d’exemples. C’est ensuite l’expert de trouver un sens à chaque groupe et de les associer ou les dissocier. On peut parler de système probabiliste car un exemple peut être classé dans différentes classes en même temps.
  • L’apprentissage semi-supervisé : Probabiliste ou non, il est mis en oeuvre quand des données étiquetées sont manquantes. Le système utilise donc des exemples non étiquetés pour se renseigner et apprendre.
  • L’apprentissage partiellement supervisé : Probabiliste ou non, il est utilisé lorsque les données intégrées au départ dans le système sont partiellement étiquetées. Par exemple, des données sont définies appartenant à A, B ou C et d’autres n’appartenant pas à A mais peut-être à B ou C.
  • L’apprentissage par renforcement : L’algorithme intègre un comportement suite à une observation. L’action effectuée sur l’environnement par l’algorithme produit une valeur qui guidera l’algorithme d’apprentissage.
  • L’apprentissage par transfert : Capacité d’un système à appliquer des connaissances ou compétences apprises au cours de tâches antérieures sur de nouvelles tâches comportant des similitudes. L’apprentissage se fait donc en fonction d’un apprentissage effectué auparavant

Notre petit tips sur le Machine Learning

En cours de conception…

< Retourner aux catégories Lire un article sur le sujet Retour à la catégorie big data >

predictive B2B Scoring
01.42.66.69.83
CONNEXION
Demo gratuite