# Fiches de cours

## Statistics for data science

#### Enseignant(s) :

Olhede Sofia Charlotta

English

#### Summary

Statistics lies at the foundation of data science, providing a unifying theoretical and methodological backbone for the diverse tasks enountered in this emerging field. This course rigorously develops the key notions and methods of statistics, with an emphasis on concepts rather than techniques.

#### Keywords

Data science, inference, likelihood, regression, regularisation, statistics.

#### Learning Prerequisites

##### Required courses

Real analysis, linear algebra, probability.

##### Recommended courses

A first course in statistics.

##### Important concepts to start the course

Students taking the course will need a solid grasp of notions from analysis (limits, sequences, series, continuity, differential/integral calculus) and linear algebra (linear subspaces, bases, dimension, eigendecompositions, etc). Though the course will cover a rapid review of probability, a first encounter with the subject is necessary (random variables, distributions/densities, independence, conditional probability). Familiarity with introductory level notions of statistics would be highly beneficial but not necessary.

#### Learning Outcomes

By the end of the course, the student must be able to:
• Derive properties of fundamental statistical procedures
• Estimate model parameters from empirical observations
• Test hypotheses related to the structural characteristics of a model
• Construct confidence bounds for model parameters and predictions
• Contrast competing models in terms of fit and parsimony

#### Assessment methods

Final exam.

Dans le cas de l¿art. 3 al. 5 du Règlement de section, l¿enseignant décide de la forme de l¿examen qu¿il communique aux étudiants concernés.

#### Resources

##### Bibliography

Davison, A.C. (2003). Statistical Models, Cambridge.

Panaretos, V.M. (2016). Statistics for Mathematicians. Birkhäuser.

Wasserman, L. (2004). All of Statistics. Springer.

Friedman, J., Hastie, T. and Tibshirani, R. (2010). Elements of Statistical Learning. Springer

### Dans les plans d'études

• Science et ingénierie computationnelles, 2019-2020, Master semestre 1
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Science et ingénierie computationnelles, 2019-2020, Master semestre 3
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Data Science, 2019-2020, Master semestre 1
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Data Science, 2019-2020, Master semestre 3
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Génie électrique et électronique , 2019-2020, Master semestre 1
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Génie électrique et électronique , 2019-2020, Master semestre 3
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Management, technologie et entrepreneuriat, 2019-2020, Master semestre 1
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Management, technologie et entrepreneuriat, 2019-2020, Master semestre 3
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Systèmes de communication - master, 2019-2020, Master semestre 1
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Systèmes de communication - master, 2019-2020, Master semestre 3
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Génie électrique (edoc), 2019-2020
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines
• Mineur en Data science, 2019-2020, Semestre automne
• Semestre
Automne
• Forme de l'examen
Ecrit
• Crédits
6
• Matière examinée
Statistics for data science
• Cours
4 Heure(s) hebdo x 14 semaines
• Exercices
2 Heure(s) hebdo x 14 semaines

LuMaMeJeVe
8-9
9-10
10-11
11-12
12-13
13-14
14-15
15-16
16-17
17-18
18-19
19-20
20-21
21-22
En construction
Cours
Exercice, TP
Projet, autre

### légende

• Semestre d'automne
• Session d'hiver
• Semestre de printemps
• Session d'été
• Cours en français
• Cours en anglais
• Cours en allemand