Description
Ce programme de formation sur le big data s'adresse aux professionnels souhaitant acquérir des compétences fondamentales dans ce domaine en pleine expansion. Il couvre l'historique, les définitions, les caractéristiques et les bénéfices du big data, ainsi que les technologies clés comme Hadoop et MongoDB. Les participants exploreront les sources de données, les techniques de data mining, et bénéficieront d'une formation pratique sur l'installation et la configuration des outils. La formation inclut également une préparation à la certification Big Data Foundation, validant les connaissances acquises.
Objectifs
- Connaître les fondamentaux du Big Data, ses origines et ses caractéristiques
- Comprendre ce qu'est le Data Mining
- Appréhender les technologies les plus populaires du Big Data
Récapitulatif
Public
Connaître les fondamentaux du Big Data, ses origines et ses caractéristiques
Comprendre ce qu'est le Data Mining
Appréhender les technologies les plus populaires du Big Data
Prérequis
Connaissances de base des architectures techniques
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction
Les fondamentaux du big data
- Un peu d'histoire…
- Définition, caractéristiques et bénéfices
- Les dimensions (volume, variété, vélocité)
- Les technologies les plus populaires (Hadoop, MongoDB)
- Ethique et vie privée
Les sources du big data
- Les données de l'entreprise (Oracle, SAP, Microsoft, Data Warehouses, données nonstructurées)
- Réseaux sociaux (Facebook, Twitter, autres)
- Données publiques (économiques, financières, comportementales, etc.)
Data mining
- Définition
- Les techniques descriptives et prédictives (Classification, association, segmentation, etc.)
- Exemples d'outils (Weka, KNIME, R)
Zoom sur Hadoop
- Présentation de Hadoop (Les principaux composants, les extensions)
- Installation et configuration
- MapReduce
- Data Processing avec Hadoop
Zoom sur MongoDB
- Présentation de MongoDB
- Réplication et sharding
- Ecosystèmes (langages, drivers, outils, intégration avec Hadoop)
- Installation et configuration
- Base de données de documents
- Modèle de données de documents
Certification Big Data Foundation
- Préparation à l'examen « Big Data Foundation »
- Passage de l'examen « Big Data Foundation »