Hugo Tekeng
SDD1001Automne 2024Data
← Retour au parcours universitaire

Introduction à la science des données

Vue détaillée du cours, des notions étudiées, des technologies mobilisées et des principaux travaux associés.

Code

SDD1001

Session

Automne 2024

Domaine

Data

Résumé global

Cours d’introduction à la science des données centré sur l’utilisation de langages et bibliothèques modernes pour manipuler, analyser et visualiser les données. Le cours m’a permis de développer des bases pratiques en Python et en R, de manipuler des structures de données, d’utiliser des bibliothèques spécialisées, et d’aborder des tâches de prétraitement et d’analyse comme la régression linéaire.

Technologies utilisées

PythonPandasTkinterPyCharmRRStudioOrange

Notions vues dans ce cours

  • Introduction à Python
  • Variables, transtypage et structures de contrôle en Python
  • Gestion des exceptions et docstrings
  • Structures de données en Python
  • Fonctions et objets
  • Paradigmes fonctionnel et orienté objet
  • Développement avec PyCharm
  • Interfaces avec Tkinter
  • Bibliothèques graphiques
  • Manipulation des données avec Pandas
  • Utilisation de bibliothèques complémentaires pour l’analyse
  • Introduction à Orange
  • Introduction à R et RStudio
  • Structures de contrôle et structures de données en R
  • Graphiques en R
  • Prétraitement des données
  • Régression linéaire

Travaux et éléments évalués

  • TP1 sur Python et/ou l’environnement de développement
  • TP2 sur la manipulation, l’analyse ou la visualisation de données
  • Exercices pratiques en Python, Pandas, R et RStudio
  • Examen intra
  • Examen final