Le programme de la formation

 

Langage R – Les fondamentaux de la programmation R pour la Data Science

Découverte de R
• Présentation de R
• Installation et ressources
• Le système de packages
• IDE RStudio et création d’un premier script
Les bases du langage R
• Les variables et les types
• Les formats : les vecteurs
• Les formats : les matrices
• Les formats : les DataFrame
• Les formats : les listes
• Les conditions (if … else)
• Les boucles
• Les fonctions
• Les fonctions de type apply
R et la data
• Récupérer les données d’un fichier au format CSV
• Récupérer d’autres formats de données : Excel, SQL, API
Analyses statistiques et premiers graphiques
• Analyse de variables numériques
• Analyse de variables catégorielles
• Autres méthodes d’analyses statistiques
Restitution de résultats : aperçu des possibilités
• Les graphiques

Langage R – Accédez à tous vos types de données

Quelques rappels sur R et son environnement
• Pourquoi R ?
• Installation de l’environnement
• Ressources liées à R
Données au format CSV
• Accéder à des données au format CSV
• Mise en pratique – Data Visualisation : graphique en bâtons
Données au format Excel
• Accéder à des données au format Excel
• Mise en pratique – Data Visualisation : nuage de points
Données d’une base de données SQL
• Accéder à des données provenant d’une base de données SQL
• Mise en pratique – Data Visualisation : nuage de mots
Données provenant d’une API
• Accéder à des données provenant d’une API
• Mise en pratique – Data Visualisation : graphique dynamique en bâtons pour le web
Données provenant d’une base de données NoSQL MongoDB
• Accéder à des données provenant d’une base de données NoSQL
• Mise en pratique – Data Visualisation : tableau dynamique pour le web

Langage R – Manipulez vos données avec les packages dplyr et tidyr

Rappels sur l’accès avec R à différents formats de données
• Accès à des données au format CSV
• Accès à d’autres formats de données (Excel, bases de données SQL, API…)
Manipulation à l’aide du package dplyr
• Introduction au package « dplyr » : syntaxe et « pipe »
• Manipulation d’observations (lignes)
• Manipulation de variables (colonnes)
• Création des tableaux de données résumées
• Jointures de données
Introduction au nettoyage de données avec le package tidyr
• Remodeler des données
• Compléter les valeurs manquantes

À qui s’adresse cette formation ?

Pour qui

  • Informaticiens

Prérequis

  • Aucun.

Les objectifs de la formation

  • R est un langage statistique dédié à la Data Science très riche en fonctionnalités. L’ensemble de ressources proposé s’adresse à toute personne qui souhaite apprendre à extraire des données issues de sources variées (CSV, Excel, base de données SQL, API Web) avec ce langage pour être en mesure ensuite de les manipuler et les organiser. Vous apprendrez notamment à filtrer, trier, regrouper, résumer, fusionner ou nettoyer des données à l’aide de différents packages.

Notes relatives à la formation

  • Formation 100% à distance. Accessible en tout temps de n’importe où. Un an d’accès à la formation et au manuel numérique.

Durée: E-Learning | 7 Heures

Réference FMF332EL
Prix 1 790,00 DH HT


S’INSCRIRE EN INTER

Date

Lieu E-Learning





Copyright Technologia 2025 – Tous droits réservés

Contactez-nous