> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data Mining par la pratique > Formations > Technologies numériques > Formation Data Mining par la pratique

Formation : Data Mining par la pratique

Data Mining par la pratique

Télécharger le programme Partager cette formation


Le Data Mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche Data Mining sera illustrée sur plusieurs projets, en utilisant R.


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf. DMP
Prix : 2330 € H.T.
  3j - 21
Pauses-café et
déjeuners offerts




Le Data Mining consiste à découvrir des modèles, des correspondances, des motifs dans un ensemble de données numériques ou qualitatives. Cette activité s'appuie sur une trousse à outils algorithmiques qui vous seront présentés dans ce cours. La démarche Data Mining sera illustrée sur plusieurs projets, en utilisant R.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Comprendre l'intérêt de l’approche Data Mining
  • Traduire une problématique et savoir y répondre
  • Connaître les principales méthodes de Data Mining
  • Identifier et savoir utiliser les outils de Data Mining
  • Poser une problématique de Data Mining et rechercher la méthode appropriée
  • Être en capacité de restituer les résultats

Public concerné
Chargés d’études, responsables de projet analyse de données, responsables Infocentre, Marketing ou Qualité, utilisateurs et gestionnaires métiers de bases de données, futurs Data Scientist.

Prérequis
Connaissances de base en statistiques ou connaissances équivalentes à celles apportées par le stage "Statistiques descriptives, introduction" (réf. UES).
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Le projet de Data Mining

  • La problématique du Data Scientist : de la donnée à l’information.
  • Le vocabulaire et les concepts.
  • L’exploration descriptive du jeu de données.
  • Les métadonnées pour le suivi du projet de Data Mining.
  • Rappels sur le logiciel R.
Travaux pratiques
Utilisation de R. Caractérisation descriptive, définition et saisie des métadonnées d'un jeu de données.

Les techniques de l’approche Data Mining

  • Méthode basée sur la classification : identification de groupes d’individus statistiques.
  • Méthode par association : mise en évidence d’une cause et d’une conséquence.
  • Méthode de l’estimation : complément d’un effectif ou d’une fréquence d’un jeu de données.
  • Apports du Data Mining pour le traitement des grandes volumétries de données.
  • Méthode de segmentation : définition de critères, extension de la méthode de classification et principe des k-means.
  • Méthode de prévision : importance de la temporalité et des hypothèses.
Travaux pratiques
Appréhender les différentes méthodes en fonction des besoins exprimés.

Les outils statistiques

  • Méthodes descriptives : corrélation, classification, réseaux de Kohonen, règles d’association.
  • Méthodes prédictives : régression, arbres de décision, réseaux de neurones, les K plus proches voisins.
  • Mise en œuvre de classification par k-means et CAH (Classification Ascendante Hiérarchique).
  • Principe des méthodes supervisées.
Travaux pratiques
Mise en pratique des différentes méthodes sous R.

La visualisation des données

  • Les objectifs de la visualisation des données.
  • Les différents types de représentations de données quantitatives.
  • Concevoir des tableaux de bord.
Travaux pratiques
Création d’un tableau de bord avec R en utilisant des données quantitatives. Représentation de données quantitatives et de données qualitatives avec R.

Analyse de données qualitatives et textuelles

  • Spécificités de la problématique et les alternatives (Analyse Factorielle des Correspondances, table de contingence).
  • Présentation d’instanciation, de pattern, de vecteur et d’heuristique.
  • Comment utiliser un espace de vecteurs, d’indexation, de scoring.
  • Différents types de transformations et traitement d’un document textuel.
Travaux pratiques
Réalisation d’un traitement de données qualitatives et de données textuelles sous R.


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.

Avis clients
4,2 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ANNE SOPHIE V.
09/09/24
4 / 5

J’ai beaucoup apprécié cette formation. C’est un domaine très intéressant que j’aurais bien aimé approfondir dans le cadre professionnel (ce qui était mon but il y a deux ans). Cependant, je pense que je vais essayer de ne pas tout perdre en travaillant à titre personnel sur R et quand je pourrai dans le cadre de mon travail.J’ai été gênée par les nombreuses fautes d’orthographe dans le support et je suis à disposition du formateur pour essayer d’en corriger un cert
FABIEN A.
09/09/24
5 / 5

Pas assez de pratique. Manque une partie sur comment savoir ce que l’on ne sait pas.
HUI-GUAN T.
09/09/24
4 / 5

Le support de cours est très complet et permet de l’utiliser comme document de référence.Il manquait un peu de temps de pratique par rapport à la présentation du support.Les exercices sont bien faits et sont source d’inspiration pour approfondir les sujets abordés.




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance