Les données en contexte: Critical Data Studies I
HUM-485 / 3 crédits
Enseignant:
Langue: Français
Remarque: Une seule inscription à un cours SHS+MGT autorisée. En cas d'inscriptions multiples elles seront toutes supprimées sans notification. S'inscrit dans le programme TILT (https://go.epfl.ch/tilt).
Résumé
Le cours "Critical Data Studies" s'inscrit dans la nouvelle offre d'enseignements TILT qui propose de croiser des savoirs provenant des SHS et des sciences de l'ingénieur afin d'aborder des thématiques complexes qui nécessitent une méthodologie interdisciplinaire.
Contenu
Une donnée n¿est jamais neutre. Elle s¿inscrit toujours dans un « assemblage de données » qui dépend d¿une multitude de facteurs contextuels, d¿agents humains, d¿institutions, ou encore de déterminations techniques. Et pourtant, les données, aujourd¿hui traitées massivement dans le domaine social, culturel, autant que dans celui de la recherche, sont souvent perçues comme des entités objectives, permettant de limiter les biais de l¿interprétation subjective. Cela dit, les débats contemporains autour de la reconnaissance faciale ou de l¿intelligence artificielle nous montrent que les données massives peuvent elles-mêmes produire des résultats problématiques, qui dépendent souvent de leur usage en société et des intentions des acteurs qui les emploient, les étudient, ou les commercialisent. DÚs lors, quels sont les a priori à partir desquels nous tirons des informations et construisons des savoirs à partir de jeux de données ? Comment comprendre cette notion englobante qui qualifie aujourd¿hui des informations provenant de l¿astrophysique, d¿interactions sociales, autant que de sources textuelles ?
Le cours UNIL/EPFL « Critical Data Studies » s¿attache à mettre en lumiÚre les défis méthodologiques autant que l¿ensemble des biais qui peuvent découler de l¿étude de données considérées, a priori, comme « objectives » et naturelles.
Durant la premiÚre partie du semestre, les étudiants se familiarisent avec un écosystÚme numérique permettant le traitement, l¿analyse et le partage de données massives (environnement Renku) tout en découvrant les travaux issus du champ contemporain des « critical data studies » qui portent sur « les défis culturels, éthiques et critiques que posent les données massives » (Iliadis et Russo 2016).
Dans le cadre du programme TILT, certaines séances du cours seront données sous la forme dâateliers collectifs visant au renforcement de compétences professionnelles (communication, travail interdisciplinaire, résolution de problÚmes ouverts, gestion de projet, etc.). Une partie de suivi sera effectuée à lâaide dâun journal de bord tenu par chaque membre des équipes de projet.
Le cours, organisé autour de projets interdisciplinaires, proposera de retracer la chaîne des données telle qu¿elle apparaît dans les dispositifs numériques contemporains (acquisition, transformation, modélisation, visualisation, etc.), afin de questionner chacune de ces étapes à partir d¿outils critiques et réflexifs. Qu¿est-ce que le traitement quantitatif fait aux données ? Comment sont-elles transformées lors de leur collecte ? Comment concilier la prise en compte du contexte et le traitement automatisé de larges ensembles de données ? A partir de quels présupposés leur donne-t-on du sens ? Quelle est l¿histoire de la notion de ¿données¿ ?
Mots-clés
Data science
Critical studies.
Social sciences
POLY-perspective :
- perspective interdisciplinaire
- perspective citoyenne
https://www.epfl.ch/schools/cdh/fr/la-vision-du-cdh-poly-perspective/
Compétences requises
Cours prérequis indicatifs
Une formation préalable dans le langage de programmation Python ou R est recommandée. Une formation courte (mise à niveau) sera disponible pendant les séances d’atelier qui suivent le cours, chaque semaine.
Des connaissances de base en programmation (Python ou R) et/ou en statistiques sont bienvenues.
Concepts importants à maîtriser
Ce cours vous permettra d’acquérir les bases techniques pour conduire et documenter une recherche à partir d’un jeu de données, en prenant en compte les enjeux éthiques, politiques et méthodologiques relatifs.
Acquis de formation
A la fin de ce cours l'étudiant doit être capable de:
- Appliquer des outils de data science
- Analyser une étude de cas
- Critiquer les hypothèses des modèles
Compétences transversales
- Accéder aux sources d'informations appropriées et les évaluer.
- Ecrire un rapport scientifique ou technique.
- Recueillir des données.
- Planifier des actions et les mener à bien de façon à faire un usage optimal du temps et des ressources à disposition.
- Dialoguer avec des professionnels d'autres disciplines.
- Faire preuve d'esprit critique
- Recevoir du feedback (une critique) et y répondre de manière appropriée.
Méthode d'enseignement
Le premier semestre sera dédié à la présentation du contenu du cours lors de séances plénières. Les considérations théoriques issues du domaine des « critical data studies » seront présentées en parallèle des outils de traitement de données. Les étudiants forment des groupes dans le courant du premier semestre pour ensuite sélectionner un jeu de données qui fera l’objet de leur projet durant le deuxième semestre. La plupart des séances du premier semestre seront données par les membres de l’équipe pédagogique, à l’exception de quelques séances assurées par des conférenciers invités.
Durant le premier semestre, la dernière heure de cours prendra la forme d’ateliers participatifs, autour de lecture ou d’exercices concrets d’analyse de data sets.
Travail attendu
- Participation active aux sessions
- Mise à niveau en SHS ou en Data Science selon le profil d'origine
- Réalisation de plusieurs projets de groupe
Méthode d'évaluation
L¿évaluation du cours porte sur les éléments suivants :
- Série d'excercices pratiques au cours du semestre sur la plateforme Renku (50%)
- Présentation en groupe du dataset et de la problématique du projet (fin du premier semestre) 30%
- Rédaction de notes réflexives au cours du semestre via le journal de bord (20%)
Encadrement
Office hours | Oui |
Assistants | Oui |
Forum électronique | Oui |
Ressources
Bibliographie
O’Neil, C. (2017). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. College & Research Libraries (Vol. 78). https://doi.org/10.5860/crl.78.3.403
Salganik, M. J. (2017). Bit by Bit: Social Research in the Digital Age. Princeton, NJ: Princeton University Press. Open review edition.
Gold, M., & Klein, L. (Eds.). (2019). Debates in the Digital Humanities 2019. Minneapolis; London: University of Minnesota Press. doi:10.5749/j.ctvg251hk
Strasser, B. (2019) Collecting Experiments: Making Big Data Biology, The university of Chicago Press.
Leonelli, S. (2019) La recherche scientifique à l’ère des Big Data: cinq façons dont les données massive nuisent à la science, et comment la sauver. Éditions Mimésis, pp. 122. ISBN: 978-8869761843.
Ressources en bibliothèque
- Gold, M., & Klein, L. (Eds.). (2019). Debates in the Digital Humanities 2019
- Salganik, M. J. (2017). Bit by Bit
- Strasser, B. (2019) Collecting Experiments: Making Big Data Biology
- Leonelli, S. (2019) La recherche scientifique à l'ère des Big Data
- O'Neil, C. (2017). Weapons of Math Destruction
Sites web
Liens Moodle
Dans les plans d'études
- Semestre: Automne
- Nombre de places: 45
- Forme de l'examen: Pendant le semestre (session d'hiver)
- Matière examinée: Les données en contexte: Critical Data Studies I
- Cours: 2 Heure(s) hebdo x 14 semaines
- Projet: 1 Heure(s) hebdo x 14 semaines
- Semestre: Automne
- Nombre de places: 45
- Forme de l'examen: Pendant le semestre (session d'hiver)
- Matière examinée: Les données en contexte: Critical Data Studies I
- Cours: 2 Heure(s) hebdo x 14 semaines
- Projet: 1 Heure(s) hebdo x 14 semaines
Semaine de référence
Lu | Ma | Me | Je | Ve | |
8-9 | |||||
9-10 | |||||
10-11 | |||||
11-12 | |||||
12-13 | |||||
13-14 | |||||
14-15 | |||||
15-16 | |||||
16-17 | |||||
17-18 | |||||
18-19 | |||||
19-20 | |||||
20-21 | |||||
21-22 |
Légendes:
Cours
Exercice, TP
Projet, autre