Agence universitaire de la Francophonie

Infothèque francophone
RESSOURCES EN LIGNE ET ACTUALITÉS
SCIENTIFIQUES FRANCOPHONES


10200 - Conception, réalisation et exploitation des corpus

Ressource pédagogique

Description bibliographique

Auteur :
Volanschi, Alexandra (Université Denis-Diderot, Paris 7. EILA. Études interculturelles de langues appliquées. France)
Éditeur :
Université Denis-Diderot, Paris 7. EILA. Études interculturelles de langues appliquées. France
Page source :
Page personnelle d'Alexandra Volanschi, http://www.eila.univ-paris-diderot.fr/~avolansk/
Langue :
français
Date de publication :
2005

Description du contenu

Spécialité :
Electronique, informatique et télécommunications - Applications informatiques spécifiques - Traitement automatique de la langue
Mots clés :
texte ; comparaison ; méthodologie ; corpus aligné ; corpus parallèle ; TAL ; UNITEX
Table des matières :
1. Où chercher des textes source pour constituer votre corpus ?
2. Quelles considérations prendre en compte pour choisir un texte source ?
3. Comment faire des requêtes plus pertinentes et plus pointues ?
4. Quelles consignes respecter pour que le corpus soit homogène et facilement utilisable ?
5. Bref rappel sur la typologie des corpus et courte introduction à leur utilisation
6. Qu'est-ce qu'un concordancier et à quoi il sert ?
7. Exemples de concordanciers
8. Corpus parallèles et comparables pour la séance du 2/11/2005
9. Première séance de travail sur Unitex
10. Modalités d'évaluation
Résumé :
L'objectif de ce cours est de présenter les aspects appliqués, techniques, de la constitution, compilation, annotation, et utilisation des corpus. Il explique comment constituer un corpus comparable de langue spécialisée (français et anglais|espagnol|allemand) dans un micro-domaine donné (ici, en sciences de la terre). En effet, ce corpus est nécessaire par la suite pour l'extraction terminologique (validation de termes, extraction de définitions, collocations, notes techniques, etc.), pour la constitution de bases de données en vue d'applications telles l'aide à la rédaction en langue de spécialité et la traduction spécialisée, et pour illustrer le processus de conception et réalisation d'un corpus, ainsi que les outils d'annotation, d'indexation et requête de corpus. (d’après l’auteur)

Informations pédagogiques

Niveau d'études :
2e cycle
Objectifs pédagogiques :
Savoir constituer un corpus comparable de langue spécialisée.

Accès à la ressource

gratuit
Alexandra VOLANSCHI©, Copyright 2004-2008.
Format :
HTML
Notes :
Le document consacré à UNITEX (outil d'analyse de corpus) est proposé au format Word (21,2 ko, 4 pages). Les corpus sont téléchargeables dans des fichiers compressés.
URL de référence :
http://www.eila.univ-paris-diderot.fr/~avolansk/COURS-IL/Cours1.shtml

Ressource copiée dans le cache de l'Infothèque le 26/06/2008

URL de référence :
/cache/10200/www.eila.univ-paris-diderot.fr/~avolansk/COURS-IL/Cours1.shtml.html

Notice mise en ligne le 25/06/2008