Depuis le début des années 2000, un nouveau logiciel gagne en importance et s’impose progressivement comme une référence, au même titre que les trois principaux logiciels d’analyse de données qui dominent le marché.
On peut imaginer que les utilisateurs de logiciels statistiques vont progressivement converger vers R
Licence SPSS Base edition
Logiciel/Système | Windows | MacOS | Linux | BSD | Autres Unix |
---|---|---|---|---|---|
SAS | oui | terminé | oui | non | oui |
SPAD | oui | non | non | non | non |
SPSS | oui | oui | non | non | non |
Stata | oui | oui | oui | non | non |
https://fr.wikipedia.org/wiki/Comparaison_des_logiciels_de_statistiques
Ils offrent peu ou pas d’analyse de réseau, d’analyse de séquence, de léxicométrie (sauf SPAD)… Et très peu de fonctionnalités de valorisation.
La gestion centralisée induit des limites de :
C’est pour cela que l’on utilise R
Deux langages très utilisés pour l’analyse et le traitement des données.
Très souvent comparés pour leurs fonctionnalités semblables…
Le choix entre R et Python dépend surtout de
Qui je suis et de ce que je veux faire ?
différentes…
R a autant de cerveau…
Pour les utilisateurs moins avancés en programmation
spécialisés dans l’analyse de données
…que Python a du muscle !
Pour les utilisateurs avancés en programmation
spécialisés dans la science de données
R se base sur le langage de programmation S, créé en 1988
https://blog.revolutionanalytics.com/2017/10/updated-history-of-r.html
Résultat de 30 années de recherche & développement
Des acteurs économiques importants financent le développement de R : Microsoft, Google, Oracle, Esri…
Logiciel/Sytsème | Windows | MacOS | Linux | BSD | Autres Unix |
---|---|---|---|---|---|
R | oui | oui | oui | oui | oui |
R propose 2935 fonctions statistiques et graphiques standard (primitives)
Sur ce socle commun peut s’ajouter de nombreux packages, mis à disposition sur le
Comprehensive R Archive Network (CRAN). Ex :
R a une structure modulaire qui offre toute une gamme d’applications possibles. Son expansion n’est limitée que par les contributions.
Nombre de packages disponibles sur le CRAN
Les packages mises à disposition permettent d’opérer sur l’ensemble de la chaîne de traitement. De la collecte des données à la valorisation des résultats (gaphique, document, site web…)
Cette polyvalence permet à R de compléter, de concurrencer voire de remplacer toute une série de logiciels existants
L’information circule vite dans les communautés des logiciels libres.
La reproductibilité, c’est le partage et la transparence !
RStudio est une entreprise qui développe et publie des logiciels et des services basés sur le langage R. C’est l’acteur privé le plus important de la communauté R.
Rstudio (ou ses employés) a développé plusieurs packages de référence. Ex :
Rstudio propose également un Environnement de Développement Intégré (IDE), qui facilite énormément l’utilisation de R.
Interface de R sur Windows
Pas d’interface sur Linux (terminal)
L’IDE Rstudio facilite l’apprentissage de R et son utilisation
Parce que c’est simple, complet et en constante évolution…
Utilisez l’environnement RStudio!
L’installation de R et de l’IDE Rstudio se fait comme n’importe quel autre logiciel. Connectez-vous au CRAN pour télécharger R.
Téléchargez la version ‘Desktop’ sur le site de Rstudio
Lancez Rstudio (pas R) pour commencer
R version 4.1.2 (2021-11-01)
Consultation :
Code source :
De nombreuses ressources documentaires référencées sur…
Violaine Jurie (Université de Paris)
REVEAL.JS