Description
Cette formation sur l'environnement R vise à initier les participants aux fonctionnalités et à l'utilisation du logiciel R, en abordant les notions fondamentales de programmation, de gestion et de visualisation des données. Les apprenants découvriront la création et l'utilisation de différentes structures de données, ainsi que des fonctions mathématiques et de manipulation de chaînes. La formation inclut également des analyses statistiques, telles que la régression non linéaire et l'analyse en composantes principales. Elle s'adresse à des débutants souhaitant acquérir des compétences en analyse de données.
Objectifs
- Installer l'environnement d'analyse R
- Utiliser la console de R, et les environnements de travail Tinn-R et R Studio
- Créer et regrouper plusieurs types d'objets de R
- Créer des programmes d'analyse avec R
- Elaborer des graphiques avec R
- Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques
Récapitulatif
Public
Statisticiens
Analystes type Data Miner
Acteurs impliqués dans l'analyse/fouille des données
Prérequis
Connaissances de base en statistiques (régressions, analyse en composantes principales, classification) et des concepts de programmation
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Environnement R : introduction
- Présentation du logiciel R et de ses fonctionnalités
- Avantages et inconvénients
- Accès au site de téléchargement de l'outil et installation
- Environnement de base (console, script)
- Utilisation de la console
- Création et sauvegarde d'un script
- Le répertoire sous R Installation
- Aide et commentaires
- Les autres éditeurs Tinn-R et R Studio
Objets et notions de programmation R
- Les objets de type vecteurs, matrix, array, factor, dataframe, list
- Manipulation des objets, classe d'objet, fonctions spécifiques, jointure
- Sauvegarde, suppression de mémoire
- Notions de boucle (for et while), condition (if), switch
Création et utilisation de fonctions
- Structure d'une fonction
- Fonctions de type mathématique
- Fonctions de type chaîne de caractères
- Fonctions liées au temps/date
- Opérations ensemblistes
- Les tables de contingences
Génération, gestion et visualisation des données
- Les données : séquences régulières et aléatoires
- Données exemples de R
- Importation et exportation de données
- Modifier les données d'un objet
- Exemples de graphiques construits avec R
- Création des graphiques de base
- Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique
Analyses statistiques
- Présentation de la notion de package (librairie)
- Télécharger/charger des packages
- Quelques packages utiles
- Cas de la régression non linéaire multiple
- Cas de l'analyse en composantes principales ACP
- Cas de la classification CAH