Statistiques – M2 AGES

Introduction à l’utilisation du logiciel libre R (15h TD)

Séances 1-2

Introduction à R

  • Manipulation des objets
  • Vecteurs et matrices

Statistiques descriptives

  • Tendance centrale
  • Dispersion
  • Tables
  • Premiers graphiques

Intervalles de confiance

  • Intervalle de confiance de la moyenne sous la loi normale
  • Intervalle de confiance de la médiane
  • Intervalle de confiance d’un pourcentage
  • Intervalle de confiance par bootstrap

Comparaison de moyennes

  • Comparaison de deux moyennes (n grand ou lois normales)
  • Comparaison de deux moyennes (n grand et séries appariées)
  • Comparaison de deux moyennes (n petits et variables ne suivant pas une loi normale)
  • Comparaison de deux moyennes (échantillons appariés et ne suivant pas une loi normale)
  • Comparaison simultanée de plus de deux moyennes: l’ANOVA (n grand ou échantillons suivant une loi normale)
  • Comparaison simultanée de plus de deux moyennes: Le test de Kruskal Wallis (n petit ou échantillons ne suivant une loi normale).

 Comparaison de pourcentages

  • Comparaison d’un pourcentage observé avec un pourcentage théorique.
  • Comparaison d’une distribution observée avec une distribution théorique.
  • Comparaison entre elles de plusieurs distributions observées.

Mesure de la liaison entre variables quantitatives

  • Coefficient de corrélation de Pearson
  • Coefficient de Spearman – la monotonie
  • La régression linéaire

Séance 3

Un cas réel: prospection géochimique autour de Bibracte

  • Installation d’un package
  • Modification des fonctions implémentées
  • Transfert des graphes vers Word

Le matériel

Les fichiers a télécharger:

TD1-2

TD 3

TD4

Controle continu

Ressources et liens

R pour les statophobes par Denis Poinsot (lien ou pdf).
Statistiques pour les statophobes par Denis Poinsot (lien ou pdf).
Aide-mémoire de statistiques appliquées à la biologie (lien ou pdf)

Statistiques avec R.Un site très bien fait sur l’utilisation de R, illustré par de nombreux exemples (ici).

Le logiciel R
Le logiciel Tinn-R
Le logiciel RStudio

Bibliographie générale

Selon votre niveau, et compte tenu de la diversité des origines des M2 AGE, je ne peux que vous recommander une visite des pages dédiées aux L1 et L2 ST où les statistiques descriptives, la théorie de l’échantillonnage, les tests paramétriques et non-paramétriques, et les techniques de régression sont détaillées.

En outre, de très nombreux manuels de statistiques existent. Dans la mesure du possible, privilégiez les livres écrits pour les biologistes, qui sont souvent plus digestes que ceux publiés pour les mathématiciens.

Voici une liste non exhaustive de bons livres pour maitriser le logiciel R:

Statistiques avec R, Pierre-André Cornillon, Relié: 276 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Analyse de données avec R, François Husson, Sébastien Lê et Jérôme Pagès, Relié: 226 pages,  Editeur : Presses Universitaires de Rennes,  Langue : Français

Régression avec R, Pierre-André Cornillon et  Eric Matzner-Lober, Relié: 242 pages,  Editeur : Springer, Paris,  Langue : Français

Statistical data analysis explained. Applied Environmental Statistics with R., Clemens Reimann, Peter Fitzmoser, Robert Garrett, Rudolf Dutter, Relié: 362 pages,  Editeur : Wiley,  Langue : Anglais

Data Analysis and Graphics Using R: An Example-based Approach., John Maindonald and John Braun, Relié: 525 pages,  Editeur : Cambridge,  Langue : Anglais.

Bibliographie spécialisée

Introduction to Geological Data Analysis, A.R.H. Swan, M. Sandilands , 446 pages,  Editeur : Blackwell Sciences, Langue : Anglais

Très bon livre dédié aux géologues et environnementalistes. Les procédures sont détaillées à partir de problèmes concrets. Très utile également pour les archéologues et les étudiants issus de Vigne et Vin. Malheureusement épuisé.

Statistics and data analysis in Geology, John C. Davis, 638 pages,  Editeur : J. Wiley, Langue : Anglais

Très bon livre comme le Swan et Sandilands, excepté que celui là est disponible. Plutôt cher (aux alentours de 150$), il constitue néanmoins un bon investissement pour l’avenir.

Statistics in archaeology, Michael Baxter 291 pages,  Editeur : Arnold Applications of statistics, Langue : Anglais

Très bon livre qui montre comment des techniques de pointe (de statistiques) peuvent être appliquées à l’archéologie. Attention, les procédures ne sont pas réellement détaillées! Une connaissance préalable assez poussée est requise.

Pratique archéologique statistique et graphique, Robert Chenorkian, 140 pages,  Editeur : Errance, Langue : Français. Un livre épuisé dont on peut s’économiser la lecture. Mieux vaut privilégier les ouvrages cités au dessus.

 

Leave a Reply