www.aliquote.org [Teaching Material]

Apprentissage artificiel et fouille de données avec le logiciel R

Ce cours consiste en une présentation du logiciel R pour l'apprentissage articificiel ("machine learning") et la fouille de données ("data mining"). Le logiciel RStudio sera utilisé pour la plupart des illustrations.

Documents de cours

  1. Le langage R
  2. Traitement avancé des données
  3. Similarités, associations
  4. Machine Learning
  5. (non traité)
  6. Text Mining

Les fichiers scripts R se trouvent dans le répertoire scripts et les jeux de données dans le répertoire data.

Projets

Les projets sont à rendre pour le 05/02. Voici le Descriptif des projets disponibles et les consignes pour le rendu électronique (m'adresser une archive zip depuis GitHub par mail). Chaque trinôme travaille sur un seul des 5 projets proposés. Les fichiers de données sont disponibles dans le répertoire projets. Vous pouvez me contacter par mail si vous avez des questions ou si vous rencontrez des difficultés avec la lecture des sources de données.

Les données et packages se trouvent dans le répertoire projects.

Ressources

  1. Matloff (2011). The Art of R Programming. No Starch Press.
  2. Wickham (2015). Advanced R.
  3. Hastie et al. (2009). The Elements of Statistical Learning. Springer.
  4. James et al. (2015). An Introduction to Statistical Learning. Springer.
  5. Leskovec et al. (2011). Mining of Massive Datasets. Cambridge University Press.
  6. Jeroen Janssens (2014). Data Science at the Command Line. O'Reilly.
Last updated on 2017/01/04, 10:12pm