L'essentiel

Icon de certification

Certification
remplacée par

RNCP37431 - Expert en data science

Icon de la nomenclature

Nomenclature
du niveau de qualification

Niveau 7

Icon NSF

Code(s) NSF

326 : Informatique, traitement de l'information, réseaux de transmission

Icon formacode

Formacode(s)

31026 : Data science

Icon date

Date d’échéance
de l’enregistrement

30-03-2023

RNCP37431 - Expert en data science

Niveau 7

326 : Informatique, traitement de l'information, réseaux de transmission

31026 : Data science

30-03-2023

Nom légal Siret Nom commercial Site internet
OPENCLASSROOMS 49386136300080 OpenClassrooms https://openclassrooms.com/fr/

Objectifs et contexte de la certification :

  L’accroissement des données disponibles et la multiplication des technologies permettant de les produire font de la valorisation des données un enjeu économique majeur et croissant.    

La valorisation de ces données constitue, tant pour le secteur marchand que pour le secteur non marchand, un enjeu économique important, ouvrant pour les entreprises des perspectives de développement, de qualité et de compétitivité accrues. Les Big Data constituent un enjeu particulièrement stratégique dans les secteurs du numérique, de l’industrie ou de la santé.    

L’essor des Big data entraîne des besoins en compétences expertes et fait émerger des nouveaux métiers.     

Autour des data, et plus particulièrement des Big data, de nouveaux métiers émergent et se structurent.  A l’appui de nos partenaires, nous avons identifié les contours des emplois les plus recherchés autour des data et fait le choix de les structurer autour de 4 certifications : data analyst, data architect, data scientist et ingénieur machine learning.    

Cette certification vise à qualifier des Data scientists disposant des compétences expertes et transverses nécessaires à leur insertion immédiate sur le marché du travail. 

Activités visées :

 Le Data scientist est en mesure d’exercer les missions suivantes : 

- agréger un ensemble de données pour ensuite les nettoyer et les structurer ; 

- explorer ces données afin d’en déterminer la valeur et y repérer des motifs récurrents ou des irrégularités significatives ;

- produire de la valeur à partir des données par la création de modèles prédictifs ; 

- modéliser le phénomène à l’origine des données pour répondre à un problème de l’entreprise ; 

- évaluer et améliorer les performances d’un modèle d’apprentissage automatique (machine learning) ;  

- rendre les données visuelles pour communiquer ses résultats ;  

- établir des recommandations pour orienter les décisions stratégiques de l’entreprise.  

Compétences attestées :

La certification permet d'attester l'acquisition des compétences suivantes : 

BLOC 1 – Prétraiter et analyser des données structurées pour répondre à un problème métier.   

- Déterminer les objectifs d'une analyse de données à partir d’un problème métier.    

- Effectuer des opérations de nettoyage sur des données structurées.    

- Effectuer une analyse statistique univariée à partir de données structurées et nettoyées. 

- Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.    

- Représenter des données grâce à des graphiques clairs et pertinents.    

- Formuler des préconisations pour un traitement automatisé des données.    

BLOC 2 – Entraîner un modèle d’apprentissage automatique supervisé pour réaliser une analyse prédictive.    

- Sélectionner et/ ou transformer les variables pertinentes pour la modélisation (feature engineering).    

- Sélectionner et mettre en place un modèle d’apprentissage supervisé adapté à une problématique métier.    

- Évaluer les performances d’un modèle d’apprentissage supervisé.    

- Adapter les paramètres d’un modèle d’apprentissage supervisé afin de l’améliorer.    

BLOC 3 – Entraîner un modèle d’apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.    

- Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).    

- Sélectionner et mettre en place un modèle d’apprentissage non supervisé adapté une problématique métier.    

- Évaluer les performances d’un modèle d’apprentissage non supervisé.  

- Adapter les paramètres d’un modèle d’apprentissage non supervisé afin de l’améliorer.    

BLOC 4 – Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.    

- Collecter des données répondant à des critères définis via une interface de programmation (API).    

- Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.    

- Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.    

- Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul. 

- Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire. 

BLOC 5 – Présenter et déployer un modèle d’apprentissage automatique auprès de ses utilisateurs finaux.    

- Déployer un modèle via une interface de programmation (API) dans le web.  

- Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.    

- Réaliser la présentation orale d’une démarche de modélisation à un client interne/ externe.    

- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.  

- Assurer l’intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.    

BLOC 6 – Déployer un modèle d’apprentissage automatique à l’échelle en utilisant les technologies du Big data.  

- Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data. 

- Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.    

- Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.     

Modalités d'évaluation :

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor (un/e professionnel/le du métier), puis présenté au jury du titre.     

RNCP34545BC01 - Prétraiter et analyser des données structurées pour répondre à un problème métier.

Liste de compétences Modalités d'évaluation

- Déterminer les objectifs d'une analyse de données à partir d’un problème métier.  

- Effectuer des opérations de nettoyage sur des données structurées.    

- Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.      

- Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.    

- Représenter des données grâce à des graphiques clairs et pertinents.    

- Formuler des préconisations pour un traitement automatisé des données.   

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

RNCP34545BC02 - Entraîner un modèle d’apprentissage automatique supervisé pour réaliser une analyse prédictive.

Liste de compétences Modalités d'évaluation

- Sélectionner et mettre en place un modèle d’apprentissage supervisé adapté à une problématique métier.    

- Évaluer les performances d’un modèle d’apprentissage supervisé.    

- Adapter les paramètres d’un modèle d’apprentissage supervisé afin de l’améliorer.  

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

RNCP34545BC03 - Entraîner un modèle d’apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.

Liste de compétences Modalités d'évaluation

- Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).    

- Sélectionner et mettre en place un modèle d’apprentissage non supervisé adapté une problématique métier.    

- Évaluer les performances d’un modèle d’apprentissage non supervisé.  

- Adapter les paramètres d’un modèle d’apprentissage non supervisé afin de l’améliorer.   

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

RNCP34545BC04 - Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.

Liste de compétences Modalités d'évaluation

- Collecter des données répondant à des critères définis via une interface de programmation (API).  

  - Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.   

- Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.    

- Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul. 

- Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire. 

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

RNCP34545BC05 - Présenter et déployer un modèle d’apprentissage automatique auprès de ses utilisateurs.

Liste de compétences Modalités d'évaluation

- Déployer un modèle via une interface de programmation (API) dans le web.  

- Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.     

- Réaliser la présentation orale d’une démarche de modélisation à un client interne/ externe.    

- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.    

- Assurer l’intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.   

  Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

RNCP34545BC06 - Déployer un modèle d’apprentissage automatique à l’échelle en utilisant les technologies du Big data.

Liste de compétences Modalités d'évaluation

- Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data.    

- Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.    

- Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.   

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.     

Description des modalités d'acquisition de la certification par capitalisation des blocs de compétences et/ou par correspondance :

  La certification se compose de 6 blocs de compétences. La validation totale du titre s’obtient ainsi :    

 - Par la formation continue : validation des 6 blocs de compétences + soutenance des projets du candidat face au jury.  

 - Par la validation des acquis de l’expérience (VAE) : validation des 6 blocs de compétences + soutenance du dossier de preuve du candidat face au jury.  

En cas de validation partielle, les blocs validés restent acquis à vie.   

Secteurs d’activités :

Tous secteurs d'activité 

Type d'emplois accessibles :

 Data scientist ; Chef de projet Data  ; Consultant Data ; Chief Data scientist ; Ingénieur data ; Ingénieur Big data  

Code(s) ROME :

  • M1403 - Études et prospectives socio-économiques

Références juridiques des règlementations d’activité :


Le cas échant, prérequis à l’entrée en formation :

 classe préparatoire scientifique ou Bac + 3 en mathématiques ou master/ diplôme d'ingénieur en informatique. 

Le cas échant, prérequis à la validation de la certification :

Pré-requis disctincts pour les blocs de compétences :

Non

Validité des composantes acquises :

Validité des composantes acquises
Voie d’accès à la certification Oui Non Composition des jurys Date de dernière modification
Après un parcours de formation sous statut d’élève ou d’étudiant X

XXXXXXXXXX

-
En contrat d’apprentissage X

XXXXXXXXXX

-
Après un parcours de formation continue X

XXXXXXXXXX

-
En contrat de professionnalisation X

XXXXXXXXXX

-
Par candidature individuelle X - -
Par expérience X

XXXXXXXXXX

-
Validité des composantes acquises
Oui Non
Inscrite au cadre de la Nouvelle Calédonie X
Inscrite au cadre de la Polynésie française X

Statistiques :

Statistiques
Année d'obtention de la certification Nombre de certifiés Nombre de certifiés à la suite d’un parcours vae Taux d'insertion global à 6 mois (en %) Taux d'insertion dans le métier visé à 6 mois (en %) Taux d'insertion dans le métier visé à 2 ans (en %)
2019 29 0 100 83 -
2018 19 0 93 47 -

Lien internet vers le descriptif de la certification :

Liste des organismes préparant à la certification :

Historique des changements de certificateurs :

Historique des changements de certificateurs
Nom légal du certificateur Siret du certificateur Action Date de la modification
OPENCLASSROOMS 49386136300072 Est retiré 01-04-2023
OPENCLASSROOMS 49386136300080 Est ajouté 01-04-2023

Nouvelle(s) Certification(s) :

Nouvelle(s) Certification(s)
Code de la fiche Intitulé de la certification remplacée
RNCP37431 Expert en data science

Référentiel d'activité, de compétences et d'évaluation :