Atelier Digit_Hum 2023

« Manipuler des données en SHS : R, Python et les carnets interactifs »

Le CAPHÉS, AOROC et l’EUR Translitterae organisent la journée d’étude « Manipuler des données en SHS : R, Python et les carnets interactifs », le jeudi 12 octobre 2023 à l’École normale supérieure.
Elle s’inscrit dans le cycle des Ateliers Digit_Hum qui explorent depuis 9 ans, selon une thématique choisie, les pratiques et outils développés en humanités numériques.
Atelier Digit-Hum 2023
Digit_Hum 2023

En 2023, la thématique « Programmer en SHS » a été retenue.

Il s'agit de dresser un panorama des possibilités offertes par les langages R ou Python et des environnements de programmation lettrée (literate programming) interactifs (Notebooks) pour se saisir des données et faciliter la reproductibilité des travaux de recherche. Les écosystèmes de programmation qui se sont développés dans le monde scientifique permettent de relier les données et d'accompagner l’utilisateur sur une variété de tâches, tels que les traitements statistiques, l'analyse de grands corpus historiques, littéraires, philosophiques, ethnographiques (...), la collecte de données sur les réseaux sociaux ou encore la réalisation d’interfaces interactives. Représentatifs de ces outils initiés dans le monde de la recherche, les carnets numériques bénéficient d'une communauté d'utilisateurs croissante et, au-delà de leurs différences, partagent de nombreuses caractéristiques communes. Cette journée d’étude à destination d’un public non spécialiste propose d’ouvrir des perspectives, donner la possibilité de se familiariser avec les principales notions pour se repérer dans ces univers et partager des exemples de traitements possibles de données en SHS, autour de projets en cours.

Programme

9h : Accueil autour d’un café

9h15 : Ouverture Marc Bui (EPHE, AOROC, CNRS, ENS PSL – Université Paris 8)
Matinée : R, Python et les usages interactifs de la programmation
Mots d’introduction par Marie-Laure Massot (CAPHES, CNRS, ENS PSL) & Agnès Tricoche (AOROC, CNRS, ENS PSL): les chiffres marquants de l’enquête Digit_Hum issus du sondage réalisé en avril 2023

9h30 : Quelle place pour la programmation scientifique en sciences humaines et sociales ? Petit panorama des usages de Python. Emilien Schultz (SESSTIM) et Matthias Bussonnier (Quansight).

10h15 : R en archéologie : la révolution n’aura pas lieu. Nicolas Frerebeau (Archéosciences Bordeaux, CNRS, Univ. Bordeaux Montaigne, Univ. Bordeaux)

10h45 : Pause

11h15 : Des langages, des ressources, des formats et des logiciels libres pour la lexicométrie : IRaMuTeQ , python, R et tous les autres. Pierre Ratinaud (LERASS, Univ. Toulouse)

11h45 : Table ronde : R, Python et quoi d’autre encore ? Le choix des outils pour le traitement des données en SHS animée par Mariannig Le Béchec (URFIST de Lyon) et Matthieu Viry (RIATE, CNRS, Univ. Paris Cité).

12h30-13h30 : Buffet en Rotonde

Après-midi : Quelle place pour les carnets interactifs dans la recherche ?

13h30 : Carnets numériques et Jupyter : un bref panorama Nicolas M. Thiéry (Laboratoire Interdisciplinaire des Sciences du Numérique, Université Paris-Saclay)

14h15 : Bonnes pratiques autour des carnets interactifs Maxime Popineau (CESR, Université de Tours) et Emilien Schultz (SESSTIM), résultat du stage Digit_Hum 2023.

14h45 : Explorer des réseaux dans un carnet interactif avec ipysigma Béatrice Mazoyer et Guillaume Plique (médialab, Sciences Po)

15h15 : Pause

15h30 : Garder trace de son travail et le partager en traitement automatique des langues Caroline Koudoro-Parfait (ObTIC, STIH, SCAI, Sorbonne Université)

16h00 : Le groupe de travail Notebooks d’Huma-Num : Présentation de l’initiative, retour d’expérience et perspectives du GT Notebook (2021-2024) Membres du GT Notebook

16h30 : Retours sur la journée et discussions Avec Emile Gayoso (Guichet d’Assistance aux Projets Numériques, Bibliothèque Ulm-Lettres ENS PSL), président de séance



Note

(1) IRAMUTEQ est un logiciel d’analyse de textes et de tableaux de données, une Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Il s’appuie sur le logiciel de statistique R et sur le langage python.

 

 

 

Mis à jour le 18/9/2023