www.aliquote.org [Teaching Material]

Introduction à R pour la recherche biomédicale

Ce cours vise à introduire les bases de l'analyse statistique descriptive et inférentielle avec le logiciel R. Le domaine d'application retenu est essentiellement les sciences biomédicales et la recherche clinique.

Les données et documents connexes sont à rechercher dans ce répertoire. Le code R utilisé en cours est fourni séparément pour chaque séance.

Les exercices (HW) sont disponibles en format PDF. Ils seront mis à jour au fur et à mesure de la progression du cours, et les solutions seront postées la semaine suivante. Chaque "exercice" nécessite en général entre 1 et 5 min de travail personnel.

L'ensemble des références est disponible au format HTML. Un aide mémoire des principales commandes R sera mis à jour au fil des séances.

Toutes les présentations ont été compilées dans un document HTML unique (sans images ni détails sur les modèles statistiques).

  1. Les bases du langages R. (2 séances)
    Présentation du langage et des outils indispensables • Syntaxe et Objets R • Génération de données artificielles.

    • Lectures : slides | R code
    • Jeux de données : blood.txt, cereal.csv, adl.sav, anorectic.sav, lungcancer.txt
    • Sessions d'exemple : variates.log (variates.r), blood.log (blood.r)
    • Comparaison entre SPSS et R : à partir du fichier de données adl.sav, les scripts adl.r | adl.spss (script exécuté avec pspp) permettent de fournir les résultats adl.log | adl.log.html.
    • Exercices : HW 1-5 (10/02), HW 6-10 (17/02)
  2. Analyse exploratoire des données. (2 séances)
    Distribution uni- et bi-variées • Résumé numérique et graphique • Graphiques en trellis.

  3. Mesures et tests d'association. (3 séances)
    Test de Student pour échantillons indépendants et appariés • Modèle d'ANOVA à un facteur • Corrélation • Comparaisons de proportions • Mesures de concordance.

  4. Modèle linéaire et applications. (2 séances)
    Régression linéaire simple et multiple • ANOVA à deux facteurs • Analyse de covariance • Analyse de données corrélées (ANOVA sur mesures répétées et modèle à intercept aléatoire)

  5. Régression logistique. (1 séance)
    Régression logistique simple et multiple • Interprétation des coefficients • Diagnostics • Outils graphiques

Last updated on 2012/05/31, 3:52pm