Fiches de cours 2017-2018

PDF
 

Applied data analysis

CS-401

Enseignant(s) :

West Robert

Langue:

English

Summary

This course teaches the basic techniques and practical skills required to make sense out of a variety of data, with the help of the most acclaimed software tools in the data science world: pandas, scikit-learn, Spark, etc.

Content

Thanks to a new breed of software tools that allows to easily process and analyze data at scale, we are now able to extract invaluable insights from the vast amount of data generated daily. As a result, both the business and scientific world are undergoing a revolution which is fueled by one of the most sought after job profiles: the data scientist.

This course covers the fundamental steps of the data science pipeline:

Data Acquisition

Data Wrangling

Data Interpretation

Data Visualization

Reporting

The students will learn the techniques during the ex-cathedra lectures, and will then get familiar with the software tools to complete the homework assignments (which will be in part executed under the supervision of the teacher and the assistants, during the lab hours).

In parallel, the students will embark in a semester-long project, split in agile teams of 3. The outcome of such team efforts will be unified towards the end of the course, to build a project portfolio that will be made public (and available as open-source).

At the end of the semester, students will also take a 3-hour final exam in a classroom with computers, where they will be asked to complete a data analysis pipeline (both with code and extensive comments) on a dataset they have never worked with before.

Keywords

data science, data analysis, data mining, machine learning

Learning Prerequisites

Required courses

The student MUST have passed an introduction to databases course, OR a course in probability & statistics, OR two separate courses that include programming projects.

Recommended courses

Important concepts to start the course

Algorithms, object oriented programming, basic probability and statistics

Learning Outcomes

By the end of the course, the student must be able to:

Transversal skills

Teaching methods

Expected student activities

Students are expected to:

Assessment methods

Supervision

Office hours Yes
Assistants Yes
Forum Yes
Others http://ada.epfl.ch

Resources

Virtual desktop infrastructure (VDI)

No

Websites

Dans les plans d'études

  • Data Science, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Génie électrique et électronique , 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Génie électrique et électronique , 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Humanités digitales, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Informatique, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Informatique, 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Management, technologie et entrepreneuriat, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Management, technologie et entrepreneuriat, 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Science et ingénierie computationnelles, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Science et ingénierie computationnelles, 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Sciences et technologies du vivant - master, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Sciences et technologies du vivant - master, 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Systèmes de communication - master, 2017-2018, Master semestre 1
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Systèmes de communication - master, 2017-2018, Master semestre 3
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines
  • Mineur en Neurosciences computationnelles, 2017-2018, Semestre automne
    • Semestre
      Automne
    • Forme de l'examen
      Ecrit
    • Crédits
      6
    • Matière examinée
      Applied data analysis
    • Cours
      2 Heure(s) hebdo x 14 semaines
    • Projet
      2 Heure(s) hebdo x 14 semaines

Semaine de référence

LuMaMeJeVe
8-9 SG1
9-10
10-11
11-12
12-13
13-14 BCH 2201
14-15
15-16
16-17
17-18
18-19
19-20
20-21
21-22
Cours
Exercice, TP
Projet, autre

légende

  • Semestre d'automne
  • Session d'hiver
  • Semestre de printemps
  • Session d'été
  • Cours en français
  • Cours en anglais
  • Cours en allemand