Data scientist

Autre titre inscrit sur demande au RNCP (niveau 7)

[Code Certif Info N°108013]
Avertissement : cette fiche est en état archivé
Niveau de qualification
7 - Savoirs hautement spécialisés
Sortie
Bac + 5 et plus
Descriptif

L'accroissement des données disponibles et la multiplication des technologies permettant de les produire font de la valorisation des données un enjeu économique majeur et croissant.

La valorisation de ces données constitue, tant pour le secteur marchand que pour le secteur non marchand, un enjeu économique important, ouvrant pour les entreprises des perspectives de développement, de qualité et de compétitivité accrues. Les Big Data constituent un enjeu particulièrement stratégique dans les secteurs du numérique, de l'industrie ou de la santé.

Objectif

Activités visées :

Le Data scientist est en mesure d'exercer les missions suivantes :

  • agréger un ensemble de données pour ensuite les nettoyer et les structurer ;
  • explorer ces données afin d'en déterminer la valeur et y repérer des motifs récurrents ou des irrégularités significatives ;
  • produire de la valeur à partir des données par la création de modèles prédictifs ;
  • modéliser le phénomène à l'origine des données pour répondre à un problème de l'entreprise ;
  • évaluer et améliorer les performances d'un modèle d'apprentissage automatique (machine learning) ;
  • rendre les données visuelles pour communiquer ses résultats ;
  • établir des recommandations pour orienter les décisions stratégiques de l'entreprise.
Programme

La certification permet d'attester l'acquisition des compétences suivantes :

BLOC 1 - Prétraiter et analyser des données structurées pour répondre à un problème métier.

  • Déterminer les objectifs d'une analyse de données à partir d'un problème métier.
  • Effectuer des opérations de nettoyage sur des données structurées.
  • Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.
  • Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.
  • Représenter des données grâce à des graphiques clairs et pertinents.

Formuler des préconisations pour un traitement automatisé des données.

BLOC 2 - Entraîner un modèle d'apprentissage automatique supervisé pour réaliser une analyse prédictive.

  • Sélectionner et/ ou transformer les variables pertinentes pour la modélisation (feature engineering).
  • Sélectionner et mettre en place un modèle d'apprentissage supervisé adapté à une problématique métier.
  • Évaluer les performances d'un modèle d'apprentissage supervisé.
  • Adapter les paramètres d'un modèle d'apprentissage supervisé afin de l'améliorer.

BLOC 3 - Entraîner un modèle d'apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.

  • Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).
  • Sélectionner et mettre en place un modèle d'apprentissage non supervisé adapté une problématique métier.
  •  Évaluer les performances d'un modèle d'apprentissage non supervisé.
  • Adapter les paramètres d'un modèle d'apprentissage non supervisé afin de l'améliorer.

BLOC 4 - Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.

  • Collecter des données répondant à des critères définis via une interface de programmation (API).
  • Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.
  • Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.
  • Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul.
  • Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire.

BLOC 5 - Présenter et déployer un modèle d'apprentissage automatique auprès de ses utilisateurs finaux.

  • Déployer un modèle via une interface de programmation (API) dans le web.
  • Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.
  • Réaliser la présentation orale d'une démarche de modélisation à un client interne/ externe.
  • Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.
  • Assurer l'intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.

BLOC 6 - Déployer un modèle d'apprentissage automatique à l'échelle en utilisant les technologies du Big data.

  • Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data.
  • Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.
  • Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.
Débouchés

Type d'emplois accessibles

  • Data scientist ;
  • Chef de projet Data ;
  • Consultant Data ;
  • Chief Data scientist ;
  • Ingénieur data ;
  • Ingénieur Big data
Répertoire National des Certifications Professionnelles (RNCP)
Code RNCP Date Fin Enregistrement Type Enregistrement Actif / Inactif
RNCP34545 30/03/2023 Enregistrement sur demande Inactif
Code scolarité
16X32641
Certificateur
  • OpenClassrooms
Valideur
  • OpenClassrooms
    1ère habilitation Début validité Fin validité
    30/03/2020 30/03/2023
Ce titre est remplacé par
Domaine de formation (Formacode® V13)
  • 31052 : Data Warehouse
Domaine de spécialité (NSF)
326 : Informatique, traitement de l'information, réseaux de transmission des données
Accessibilité
Formation initiale Formation continue Apprentissage Contrat de pro VAE ou par expérience Demande individuelle
Textes officiels
Publication : 30/03/2020
Descriptif : Décisions d'enregistrement aux répertoires nationaux (Mars 2020) - Lundi 30 mars 2020 - Suite aux avis conformes de la Commission de certification professionnelle portant sur des demandes d'enregistrement aux répertoires nationaux, avis produits lors de la séance du 27 mars 2020, le Directeur général de France compétences a procédé à des décisions d'enregistrement aux répertoires nationaux. Ces décisions sont publiées sur le site de France compétences et seront ultérieurement publiées au journal officiel de la République française.
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Publication : 21/03/2021
Descriptif : Décision du 4 mars 2021 portant enregistrement au Répertoire national des certifications professionnelles et au répertoire spécifique
Code NOR : MTRP2107189S
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Informations mises à jour le 06/10/2023 par Certif Info.