Format PDF

Axe 2 Langues, textes et documents

picto journal [ Actualités de l'axe ]

Avec le soutien du FEDER.

Porteur de l'axe

Jean-Marie Pierrel (Université Nancy 2 et CNRS)
ATILF (UMR 7118) et CNRTL
44 avenue de libération-BP 30687
54063 NANCY Cedex
Téléphone : 03 83 96 86 85
Fax : 03 83 97 24 56

Ingénieure correspondant de l'axe

Frédérique Bey
MSH Lorraine
91 Avenue de la Libération 54000 Nancy.
03 54 50 42 44

Mots clés : Corpus, ressources informatisées, langues, textes, plateforme commune.

Enjeux et objectifs

Dans le cadre des recherches menées en Sciences humaines et scociales, l'utilisation d'archives documentaires et le recours à des corpus d'étude sont essentiels. Dans ce contexte, cet axe Langues, textes et documents de la MSH Lorraine et le Centre National de Ressources Textuelles et Lexicales peut se résumer sous la forme de trois objectifs complémentaires :

  • une réflexion épistémologique, méthodologique et juridique sur l'exploitation intelligente de corpus et de documents pour la recherche en SHS ;
  • la définition, la mise en place et l'enrichissement d'une plate forme commune (CNRTL) de codage, structuration, gestion, exploitation et valorisation de ressources informatiques (corpus, dictionnaires et lexiques) et d'un certain nombre d'outils indispensables pour mener à bien des projets inter-équipes et mieux valoriser leurs résultats. Cette plateforme peut être comparée à un grand équipement dans d'autres sciences. Elle a comme objectifs :

- la mise à disposition d'une chaîne de numération au sein de la MSH;
- la mutualisation de moyens techniques et logiciels ;
- la mise en commun de méthodologies, d'expériences et d'acquis sur le balisage XML et son exploitation, la définition de DTD (Document Type Definition), la gestion de ressources textuelles informatisées, l'accès au contenu textuel.

  • des projets de recherche inter-équipes se proposant, autour de matériaux et documents communs, de décrire et/ou modéliser des langues et des cultures.

 

Collaborations nationales, européennes et internationales

Au niveau national

Le CNRTL structure un réseau de compétences nationales à travers un ensemble de partenaires à compétences spécifiques. A ce titre nous sommes aujourd'hui partenaire au sein de deux des TGIR (Très Grandes Infrastructure de Recherche) dont la mise en place fut officialisée en décembre 2008 par le ministère, à savoir :

  • Le TGIR / TGE CNRS ADONIS dont le CNRTL est aujourd'hui opérateur pour le champ de compétences qui est le sien : Corpus textuels, Lexiques et dictionnaires ;
  • Le TGIR CORPUS à propos duquel le ministère pointe explicitement, comme site web, le réseau des MSH et le CNRTL.

 

Au niveau européen ou international

L'expertise scientifique reconnue de l'ATILF ainsi que les nombreux projets coopératifs nationaux et internationaux des laboratoires auxquels il s'adosse, ont permis au CNRTL de se positionner au niveau européen à travers :

  • La participation au projet européen CLARIN (Common Language Resources and Technology Infrastructure) et la nomination de J.M. Pierrel en tant que représentant français auprès de CLARIN. Ce projet vise à définir une infrastructure européenne partagée par les grands centres de recherche européens et s'appuyant sur des centres régionaux « certifiés » dans leurs domaines respectifs.
  • La fonction de centre européen support de la TEI (Text Encoding Initiative) : issue d'un partenariat entre l'ATILF, l'INIST et le LORIA, cette fonction de centre européen support de la TEI trouve sa place naturellement au sein du CNRTL. Elle s'instancie par la mise en place en 2008 d'un réseau national d'experts TEI grâce au soutien du TGE (Très Grand Equipement) ADONIS pour les SHS.
  • Des collaborations directes avec des centres partenaires, en Grande-Bretagne (Université d'Oxford), en Allemagne (Centres de compétence de Trèves et de Würzburg, Université de Sarrebruck, MPI Berlin) et aux Pays Bas (Université de Nimègue). En particulier le projet est l'occasion d'organiser une réflexion commune sur la gestion d'une plateforme ouverte de gestion et d'archivage de documents numériques avec nos collègues du Max Planck Institut qui travaillent actuellement sur le même sujet. Cette collaboration devrait permettre de converger vers des plateformes s'appuyant sur des technologies et plateformes open-source autour de Federa offrant une architecture flexible pour la gestion et la distribution de documents numériques.

 

Partenaires de l'axe 2

  • Académie Française
  • Afnor
  • Centres de compétence de Trèves et de Würzburg
  • CLARIN (Common Language and Technology Infrastructure)
  • DEAF d'Heidelberg et Stuttgart
  • Dpace www.dpace.org
  • ERSS Équipe de Recherche en Syntaxe et Sémantique de Toulouse
  • Federa www.fedora.info
  • INIST
  • L'Est Républicain
  • Lingway
  • L'IRIT, Institut de Recherche en Informatique de Toulouse
  • Max Planck Institut
  • Mozilla Firefox
  • MPI Berlin
  • Saint Gobain-PAM
  • Softissimo
  • Synapse
  • TEI (Text Encoding Initiative)
  • TGE Très Grand Equipement ADONIS
  • TGIR Très Grande Infrastructure de Recherche SHS CORPUS
  • Université d'Oxford
  • Université de Caen
  • Université de Chicago (ARTFL)
  • Université de Laval (Québec)
  • Université de Nimègue
  • Université de Sarrebruck
  • Université de Scherbrooke

Principaux résultats visés

  • Structurer les recherches SHS en Lorraine dans la thématique du projet : « Langues, Textes et Documents »
  • Augmenter le nombre de projets SHS coopératifs pluridisciplinaires entre les équipes Lorraines de Nancy et de Metz
  • Augmenter le nombre de projets validés par des appels d'offre nationaux (ANR) ou internationaux
  • Faire du CNRTL le centre de ressources de référence sur les corpus, dictionnaires, lexiques et outils de traitement d'informations textuelles, nœud français du projet d'infrastructure européenne CLARIN.

Quelques publications

Communication colloques

  • Pierrel Jean-Marie Quels outils au service de la connaissance de la langue française au XXe siècle, journée d'étude « Société de l'information - partage de connaissance », Nancy 26 novembre 2008
  • Pierrel Jean-Marie, De la nécessité et de l'intérêt d'une mutualisation informatique de connaissances sur le lexique de notre langue. Contribution à la table ronde « Lexique », 1er Congrès Mondial de Linguistique Française, Paris, 9-12 juillet 2008, article disponible sous : www.linguistiquefrancaise.org et dx.doi.org/10.1051/cmlf08330
  • Pierrel Jean-Marie, Informatisation et valorisation sur le Net : une deuxième vie pour le TLF, Colloque LEXICOGRAPHIE ET INFORMATIQUE : Bilan et perspectives, Colloque international à l'occasion du 50e anniversaire du lancement du projet, du Trésor de la Langue Française, 23-25 janvier 2008, Nancy, www.atilf.fr/atilf/evenement/Colloques/Tlf2008/Pre-actes_colloque_TLF2008.pdf
  • Pierrel Jean-Marie et Petitjean Etienne Valorisation et exploitation scientifiques de documents numériques pour la recherche en linguistique : l'exemple du CNRTL, Actes de CIDE 2007 Congrès International sur le Document Numérique, Nancy, 2-4 juillet 2007 (Conférence invitée plénière d'ouverture), p13-24, Europia 2007, ISBN 978-2-909285-38-2
  • Pierrel Jean-Marie & Petitjean Etienne Le CNRTL, Centre National de Ressources Textuelles et Lexicales, un outil de mutualisation de ressources linguistiques, Actes de TALN 2007, Vol 2, Toulouse, IRIT Press, 12-15 juin 2007, p. 327- 330, Texte de présentation de démonstration, IRIT Press 2007, ISBN 2-9520326-9-6

Publications et communications liées aux aspects "plateforme CNRTL"

  • Del Mancino William, Pierrel Jean-Marie Du trésor de la langue française à l'ATILF et au CNRTL : 50 ans au service de l'étude et de la connaissance de la langue française , Revue pour l'histoire du CNRS, N° 24 automne 2009
  • Pierrel Jean-Marie & Buchi Eva, Research and Resource Enhancement in French Lexicography: the ATILF Laboratory's computerized resources in "Lexicography in Italy and in Europe", Silvia Bruti, Roberta Cella and Marina Foschi, editors, Cambridge Scholars Publishing, p 79-118, 2009
  • Pierrel Jean-Marie, Potentialités et usages en recherche et enseignement d'une mutualisation de connaissances sur le lexique français : l'exemple des ressources de l'ATILF, Colloque 25 ans DoRif « Recherches, didactiques, politiques linguistiques : perspectives pour l'enseignement du français en Italie », Milan, 1-2 octobre 2009 (Conférence Invitée)
  • Pierrel Jean-Marie, The French activities in LRT and their connection with CLARIN, CLARIN (A European Research Infrastructure) Newsletter, N) 5, March 2009
  • Pierrel Jean-Marie Le CNRTL, Centre National de Ressources Textuelles et Lexicales, journée Etudes de cas sur les systèmes numériques de recherche, Ministère de l'enseignement supérieur et de le Recherche (MISTRID), 8 décembre 2010, 20 pages
  • Pierrel Jean-Marie, Recherche et valorisation en lexicographie française : les ressources informatisées du laboratoire ATILF, Conférence invitée à l'Académie de Roumanie, Bucarest, 5 juin 2009

 

Et en ligne :

En plus des publications "classiques", le travail mené au sein de l'axe 2 est aussi très visible sur le web et passe à travers la structuration de sites web permettant de valoriser des ressources informatisées. Parmi eux, il convient de noter plus particulièrement :

 

Autres projets, partenariats et soutiens (non exhaustif)

  • Représentant français du projet d'infrastructure européenne de gestion de données numériques en SHS : CLARIN - Common language Resources and Technology Infrastructure  fédérant des centres de gestion de ressources et de technologies linguistiques
  • Centre européen, support de la TEI, Text encoding Initiative.

 

Actions de culture scientifique et technique

  • Participation à l'émission « Heureux qui communique les sciences », FR3, 12 Septembre 2009,
  • Journées CNRS Jeunes « Société de l'information, partage de connaissances » organisées par l'ATILF et le CNRS à Pont à Mousson les 27-29 novembre 2009,
  • Organisation d'une journée d'étude « Société de l'information - partage de connaissance » à Nancy le jeudi 26 novembre 2009 avec la participation entre autres de partenaires industriels tels EDF, l'Est républicain et Pont à Mousson SA,
  • Participation à l'exposition "homme - femme : de quel sexe êtes-vous?" (Muséum-Aquarium de Nancy, du 7 mars 2009 au 3 janvier 2010) avec entre autre une contribution de M.J. Mathieu et J.M. Pierrel « La féminisation dans la langue », dans le catalogue de l'exposition en mars 2009.
  • Conférence publique de C. Bertrand-Dagenbach le 24 mars 2009 à l'Hôtel de Ville de Nancy : « Vitae Caesarum sive tyrannorum sive principum : biographie impériale et enjeux du pouvoir dans l'Histoire Auguste. » Le texte de cette conférence est paru dans le Bulletin de l'ALPLA 2009, p. 11-22, publication papier et électronique. (N. B. : ALPLA : Association Lorraine des Professeurs de Langues Anciennes).

 

picto remonter vers le haut de la page Remonter en haut de la page