Projets

ALAVAL

ALAVAL.pngAtlas linguistique audiovisuel des dialectes francoprovençaux du Valais romand

L’Atlas linguistique audiovisuel des dialectes francoprovençaux du Valais romand (ALAVAL) s’est fixé comme objectif de sauvegarder sous forme cartographique informatisée un corpus représentatif de documents audiovisuels – comparables d’un village à l’autre – dans une des dernières régions de Suisse romande où les dialectes francoprovençaux traditionnels se portent encore relativement bien : dans la plupart des communes montagnardes du Valais romand, les dialectes sont encore parlés, du moins par les personnes âgées. Il s’agit pourtant d’un travail de collectage d’urgence: la majorité de nos témoins a plus de 60 ans; d’ici peu de temps, une entreprise comparable deviendra très difficile, voire impossible.

Base de données du Glossaire des patois de la Suisse romande

Depuis 1998, grâce au soutien financier de l'Académie suisse des sciences humaines et sociales (ASSH), une base de données a été développée pour faciliter la consultation du Glossaire des patois de la Suisse romande, qui compte plus de 7'000 pages à ce jour.

Exploitable à l'interne par les collaborateurs du GPSR, la base de données est rapidement devenue une précieuse aide à la rédaction du dictionnaire. Elle contient les éléments-clés de chaque article publié, parfaitement ordonnés et décrits, ainsi que des informations succinctes sur les articles encore à rédiger. On peut y faire des recherches par étymons, préfixes, suffixes et, pour les lettres D- à G-, par sens. Pour les lettres E- à G-, on peut en outre utiliser des critères de tri géographiques et flexionnels afin d'effectuer des recherches dans un corpus de plus de 60'000 formes dialectales et régionales, précisément localisées et analysées.

En 2013, la base de données a été utilisée pour la confection et la mise en page automatiques des index du volume VII (fascicule 118, imprimé en janvier 2014) du GPSR.

La mise au point technique de cet outil a été assurée par l'École supérieure du canton de Neuchâtel, filière informatique de gestion (1998-2003 et 2006-2007), puis par la Haute école de gestion Arc (dès 2013). Parmi les informaticiens qui ont contribué au projet, il faut tout particulièrement mentionner les Prof. Pierre-André Sunier, Gérard Lambert et Fabrice Camus.

Corpus oral de français de Suisse romande (base de données OFROM)

OFROM constitue la première archive comprenant uniquement des enregistrements de français parlé en Suisse romande aligné Logotexte/son. Les enregistrements que la base contient sont pour la plupart extraits d’entretiens guidés, à dominante monologique, dans lesquels l’interviewé-e (un locuteur-trice né en Suisse, et vivant en Suisse romande) était sollicité pour répondre à des questions nécessitant des réponses plus ou moins longues posées par l’intervieweur-euse (responsable de l’enquête).

Une plus petite partie des enregistrements ressemblent davantage à des interactions, puisqu’ils impliquent au moins deux personnes qui parlent à bâtons rompus. Les thèmes abordés concernent aussi bien les métiers, les voyages, les passe-temps des locutrices et locuteurs, que leurs relations de voisinage, leurs projets ou les situations incongrues auxquelles ces personnes ont été confrontées dans leur vie. Elles peuvent également être en rapport avec le système politique ou la situation linguistique de la Suisse, etc.

Les enregistrements actuellement mis à disposition ont été réalisés à partir de 2008 par des étudiant-e-s dans le cadre d'enseignements des Universités de Neuchâtel et de Fribourg. En moyenne, les entretiens enregistrés durent entre 30 et 40 minutes, mais seules une dizaine de minutes sont transcrites pour chacune des locutrices ou locuteurs de la base. Les transcriptions associées aux fichiers sons ont été faites par les étudiant-e-s responsables de l’enquête. Elles ont toutes été vérifiées, anonymisées et uniformisées par un-e étudiant-e de master avant leur mise en ligne.

Le projet OFROM vise à mettre à disposition de la communauté une base de données comprenant des enregistrements et les fichiers de transcription correspondants, sur laquelle il est possible de procéder à des requêtes simples à l’aide d’un concordancier mis en ligne sur un site web convivial.

Les Énigmes de Mercure

Base de données des énigmes, logogriphes et charades du Mercure galant et du Mercure de France, 1673-1799

enigmes_mercure.jpgLa base de données en ligne Les Énigmes de Mercure rassemble les énigmes, logogriphes et charades versifiés du Mercure galant, périodique fondé en 1672, et du Mercure de France qui lui succède au XVIIIe siècle. Faisant les délices des amateurs de jeux littéraires, ces poésies contribuent à la vitalité économique du mensuel. Composées le plus souvent par les lecteurs, elles mettent en évidence les modalités interactive et collaborative du journalisme d’Ancien Régime, et constituent une ressource pour l’étude sociologique du public. Sur le plan littéraire, elles ouvrent une perspective sur les dimensions ludique et expérimentale de la versification classique. Elles intéressent également l’histoire de la sociabilité littéraire et des représentations culturelles.

Poésies de salon, exercices de collège ou pièces journalistiques, les genres énigmatiques mobilisent des codes littéraires qui ne nous sont plus familiers. S’inscrivant dans un projet de recherche sur les jeux poétiques du XVIIIe siècle, le présent site a pour mission de faciliter l’accès à cette littérature en réunissant les textes éparpillés dans les pages du Mercure, en fournissant des clefs de lecture et en multipliant les possibilités de circulation au sein d’un corpus de 6800 poésies.

Héritages botaniques des Lumières

Exploration de sources et d’herbiers historiques à l’intersection des lettres et des sciences

botanical_legacies.pngSoutenu par le Fonds national suisse de la recherche scientifique (instrument « Sinergia »), le projet porte sur les collections botaniques de Jean-Jacques Rousseau (1712-1778), Jean-Baptiste-Christophe Fusée-Aublet (1723-1778), Jean-Frédéric Chaillet (1747-1839) et plusieurs de leurs contemporains. Il envisage la botanique du XVIIIe siècle comme un ensemble de savoirs qui mobilisent différents types d’acteurs et de pratiques à diverses échelles géographiques. L’équipe de chercheurs interroge la valeur historique et scientifique des herbiers anciens, et les possibilités de présenter en ligne ces collections.

Nos recherches recourent aux humanités numériques pour l’analyse et la publication de sources textuelles et de collections de plantes séchées du XVIIIe siècle. Conçue par une équipe pluridisciplinaire (informatique, botanique, histoire des sciences et de la littérature), une base de données relationnelle permettra de reconstituer les herbiers de Jean-Jacques Rousseau dont les planches sont aujourd’hui dispersées dans plusieurs institutions suisses et françaises. L’enjeu consiste à explorer, en dialogue avec les écrits botaniques de Rousseau, ces collections complexes et à les éditer en ligne sous la forme d’un herbier virtuel. Un autre pan du projet mobilise l’outil informatique pour étudier les méthodes de travail de Jean-Baptiste-Christophe Fusée-Aublet, découvreur de la flore de la Guyane, depuis la récolte des spécimens sur le terrain jusqu’à la publication d’une flore illustrée.

La représentation du sens modal et de ses tendances évolutives dans deux langues romanes : le français et l’italien

La comparaison des langues de même souche fait ressortir des différences sensibles quant à l’usage des sens modaux. Précisément, dans les cas où une forme pourvue d’un sens modal et factuel a un équivalent dans l’autre langue, ce dernier est toujours plus proche du sens factuel que du sens modal. Le sens temporel du futur italien et français ne fait pas ressortir de différences entre les deux langues, alors que le sens épistémique est exploité de façon bien différente, notamment à cause du fait que l’italien y recourt nettement plus fréquemment que le français. Notre propos est de comprendre pourquoi il en est ainsi. Pourquoi, alors que deux langues ont les mêmes outils pour exprimer un concept (par exemple le futur pour exprimer la postériorité), pourquoi ces deux langues se différencient-elles sensiblement quand il s’agit d’employer les sens modaux de ces formes. Nous appuierons nos hypothèses sur la linguistique outillée de corpus en relation avec le projet. Notre méthodologie de recherche exploite les ressources des humanités numériques en adoptant une approche corpus based utilisant des méthodes et calculs statistiques.Ces outils nous permettent d’identifier les patterns argumentatifs concernés en les délimitant en tant que séquences dotées d’un marquage linguistique spécifique selon leur fonction (concession, justification, etc.) et de calculer, au moyen de statistiques, leur association avec les formes modales sélectionnées.

Républicanismes méridionaux. Ressources pour une histoire polycentrée du républicanisme moderne

L’ambition de ce projet est de constituer une bibliothèque républicaine virtuelle européenne et latino-américaine. Financée par le Fonds National Suisse, dans le cadre d’un projet sur les Républicanismes méridionaux, cette bibliothèque se situe donc à la croisée de préoccupations venues des humanités numériques, de l’histoire conceptuelle, de la philosophie politique, de l’histoire de la langue, mais aussi d’une réflexion sur la diversification des ressources destinées à l’enseignement et à la recherche.

Rétrodigitalisation du Glossaire des patois de la Suisse romande

Initié en 2014 grâce au soutien financier de l'Académie suisse des sciences humaines et sociales (ASSH), ce projet a pour objectif de créer une version rétrodigitalisée du Glossaire des patois de la Suisse romande (GPSR) qui puisse être publiée sur Internet et ainsi être accessible à un vaste public.

La production de fichiers informatisés à partir des fascicules imprimés du dictionnaire est en phase d'achèvement à l'Université de Trèves - Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften.

La mise en ligne du Glossaire des patois de la Suisse romande est prévue en deux temps:

  • Février 2017: mise à la disposition des internautes d'une version scannée du dictionnaire dans laquelle il est possible de consulter près de 7000 pages du Glossaire publié (fichiers images). Par ailleurs, des recherches avancées — par lemmes, étymons, suffixes et préfixes — sont possibles et peuvent être effectuées grâce à une base de données (BDD) élaborée et alimentée depuis 1998.
  • 12 septembre 2018: ouverture au public d'une nouvelle version du portail entièrement rétrodigitalisée, dans laquelle les internautes pourront procéder à des recherches «plein texte».

La mise au point des aspects informatiques du projet est assurée par le Prof. Fabrice Camus et son équipe (Haute école de gestion Arc, Neuchâtel).

SERMO

Sermo.pngMéthode d’annotation et d’exploitation de corpus paralittéraires pour l’analyse en linguistique diachronique

Le projet SERMO I  a pour but de développer une approche scientifique pour l’analyse et l’exploitation semi-automatique de corpus de textes de français préclassique et classique, dans une perspective de linguistique diachronique, d’histoire des genres paralittéraires et d’analyse du discours en diachronie. Il se base sur la constitution d’un corpus annoté de sermons protestants en langue française de 1550 à 1750 imprimés à Genève. Ces textes seront lemmatisés, et étiquetés à différents niveaux : morpho-syntaxique, discursif, rhétorique, historique ou théologique. Un site internet permettra la consultation du corpus et son exploitation selon les intérêts du chercheur.Toute la procédure sera documentée et une méthode pratique sera publiée qui permettra de poser les bases d’une approche partageable et reproductible pour l’analyse diachronique des corpus annotés.

WoPoss

A World of Possibilities – Modal pathways over an extra-long period of time: the diachrony of modality in the Latin language

The SNSF-funded project A World of Possibilities. Modal pathways over an extra-long period of time: the diachrony of modality in the Latin language (WoPoss) aims at reconstructing the evolution of modal meanings from the prehistory of the Latin language up to the 7th century CE. The WoPoss team is working on the linguistic annotation of a selection of modal markers in a diachronic corpus of Latin literary and documentary texts. As annotation progresses, data will be made available during the project lifespan (February 2019–January 2023).