Oupoco, kesaco ?
Quand les humanités digitales et l’intelligence artificielle machinent la poésie et interrogent le lien entre arts et sciences
La prochaine séance du séminaire DHAI (Digital Humanities and Artificial Intelligence) aura lieu le 5 novembre 2019 à l’ENS avec deux conférences de Thierry Poibeau, Directeur adjoint du Laboratoire LATTICE (CNRS ENS, PSL, Université Sorbonne nouvelle et USPC) et de Tim Van De Cruys chercheur CNRS à l'Institut de Recherche en Informatique de Toulouse. Une double perspective qui fait de ce nouveau séminaire du DHAI un événement à ne pas manquer !
Oupoco, l’ouvroir de poésie potentielle
Le projet Oupoco est largement inspiré de l’ouvrage de Raymond Queneau Cent mille milliards de poèmes, paru en 1961. Dans cet ouvrage, Queneau propose 10 sonnets dont tous les vers riment, ce qui permet de les combiner librement pour composer des poèmes respectant la forme du sonnet. Dans le cadre d’Oupoco, les poèmes de Queneau ont été remplacés par des sonnets du 19e siècle, qui sont à la fois libres de droit et plus variés quant à leur forme et leur structure. Un module d’analyse (structure globale, type de rimes, etc.) a été mis en place et les informations ainsi obtenues servent de base au générateur produisant des sonnets respectant les règles propres à ce genre.
Au-delà de l’aspect ludique du projet, celui-ci pose des questions quant au statut de l’auteur, et quant à la cohérence et la pertinence des poèmes produits. Il suscite aussi la curiosité, et amène par exemple souvent le lecteur à revenir aux sonnets source pour vérifier quel est le sens original d'un vers donné. A la fin de l’intervention, certaines extensions récentes du projet seront présentées, comme la « boîte à poésie », une version portative du générateur Oupoco.
Le projet sera présenté par Thierry Poibeau, directeur de recherche au CNRS et directeur adjoint du laboratoire LATTICE (Langues, Textes, Traitements informatiques et Cognition). Le Pr Poibeau est également titulaire d’une chaire PrAIRIe (Paris Artificial Intelligence Research Institute) une chaire dédiée au traitement des langues naturelles et aux humanités numériques.
A propos du laboratoire LATTICE Unité mixte de recherche du CNRS créée en 2000 et dont les deux tutelles universitaires sont l’École normale supérieure (ENS) au sein de PSL et l’Université Sorbonne nouvelle au sein de USPC, le LATTICE est un laboratoire de linguistique et de traitement automatique des langues. Il est composé d’une quarantaine de membres, dont une moitié de doctorants et de post-doctorants, et une autre moitié de chercheurs CNRS, d’enseignants-chercheurs et de personnel de support à la recherche. Le laboratoire participe à de nombreux projets de recherche nationaux et européens, qui portent sur des thèmes tantôt théoriques, tantôt pratiques, en lien avec des acteurs majeurs du domaine (institutionnels, grandes et moyennes entreprises). |
La génération automatique de poésie à l'aide de réseaux de neurones
La génération automatique de poésie est une tâche ardue pour un système informatique. Pour qu'un poème ait du sens, il est important de prendre en compte à la fois des aspects linguistiques et littéraires. Les modèles de langue basés sur les réseaux de neurones ont amélioré l'état de l'art par rapport à la modélisation prédictive de langage, mais quand ils sont entraînés sur des corpus de texte généraux, ils ne génèrent évidemment pas de poésie en soi.
Cette conférence de Tim Van De Cruys (chercheur CNRS à l’Institut de recherche en informatique de Toulouse) explore ces modèles - entraînés sur des textes généraux – qui peuvent être adaptés afin de modéliser les aspects linguistiques et littéraires nécessaires pour la génération de poésie. Le cadre présenté est appliqué à la génération de poèmes en français, et évalué à l'aide d'une évaluation humaine.
Bon à savoir : une nouvelle chaire Intelligence Artificielle et Justice de l’ENS inaugurée en septembre 2019 |
A propos des Humanités digitales et de l’intelligence artificielle
L’étude croisée de l’intelligence artificielle et des humanités numériques, davantage qu’une tendance, est une transformation profonde du monde scientifique. Ce séminaire DHIA est l’un des lieux scientifiques où ce couplage est formé, encouragé et analysé. Il offre un espace de discussion où les deux communautés, comprises de manière très inclusive, échangent sur des problèmes émergents, les projets en cours ou les expériences passées afin de créer un langage commun, un espace partagé pour une coopération novatrice à long terme.
Le comité scientifique du séminaire est composé de Mathieu Aubry (Imagine, LIGM lab, ENPC, École des Ponts ParisTech), Jean-Baptiste Camps (Ecole nationale des Chartes), Matthieu Husson (CNRS, Observatoire de Paris), Béatrice Joyeux-Prunel (Université de Genève), Gabriel Peyré (CNRS), Léa Saint-Raymond (CNRS, ENS) et Galla Topalian (Université Paris 1). |
Rappelons que pour approfondir ses méthodologies et élargir son champ d'applications scientifiques, l’intelligence artificielle (IA) doit constamment faire face à de nouvelles problématiques et évolutions : création de nouveaux algorithmes, augmentation de la puissance de calcul, développement de techniques d’apprentissage de pointe…
Tout comme l’intelligence artificielle, les Humanités numériques (DI) sont sans cesse à la recherche de nouveaux outils pour explorer des ensembles de données de plus en plus complexes et diversifiés. Pour elles qui utilisent les approches critiques des Humanités dans l'analyse des « révolutions numériques » le développement des méthodologies scientifiques numériques au service de l'étude des humanités est essentiel.