10200 - Conception, réalisation et exploitation des corpus
Ressource pédagogique
Description bibliographique
- Auteur :
- Volanschi, Alexandra (Université Denis-Diderot, Paris 7. EILA. Études interculturelles de langues appliquées. France)
- Éditeur :
- Université Denis-Diderot, Paris 7. EILA. Études interculturelles de langues appliquées. France
- Page source :
- Page personnelle d'Alexandra Volanschi, http://www.eila.univ-paris-diderot.fr/~avolansk/
- Langue :
- français
- Date de publication :
- 2005
Description du contenu
- Spécialité :
- Electronique, informatique et télécommunications - Applications informatiques spécifiques - Traitement automatique de la langue
- Mots clés :
- texte ; comparaison ; méthodologie ; corpus aligné ; corpus parallèle ; TAL ; UNITEX
- Table des matières :
- 1. Où chercher des textes source pour constituer votre corpus ?
2. Quelles considérations prendre en compte pour choisir un texte source ?
3. Comment faire des requêtes plus pertinentes et plus pointues ?
4. Quelles consignes respecter pour que le corpus soit homogène et facilement utilisable ?
5. Bref rappel sur la typologie des corpus et courte introduction à leur utilisation
6. Qu'est-ce qu'un concordancier et à quoi il sert ?
7. Exemples de concordanciers
8. Corpus parallèles et comparables pour la séance du 2/11/2005
9. Première séance de travail sur Unitex
10. Modalités d'évaluation
- Résumé :
- L'objectif de ce cours est de présenter les aspects appliqués, techniques, de la constitution, compilation, annotation, et utilisation des corpus. Il explique comment constituer un corpus comparable de langue spécialisée (français et anglais|espagnol|allemand) dans un micro-domaine donné (ici, en sciences de la terre). En effet, ce corpus est nécessaire par la suite pour l'extraction terminologique (validation de termes, extraction de définitions, collocations, notes techniques, etc.), pour la constitution de bases de données en vue d'applications telles l'aide à la rédaction en langue de spécialité et la traduction spécialisée, et pour illustrer le processus de conception et réalisation d'un corpus, ainsi que les outils d'annotation, d'indexation et requête de corpus. (d’après l’auteur)
Informations pédagogiques
- Niveau d'études :
- 2e cycle
- Objectifs pédagogiques :
- Savoir constituer un corpus comparable de langue spécialisée.
Accès à la ressource
gratuit
Alexandra VOLANSCHI©, Copyright 2004-2008.
- Format :
- HTML
- Notes :
- Le document consacré à UNITEX (outil d'analyse de corpus) est proposé au format Word (21,2 ko, 4 pages). Les corpus sont téléchargeables dans des fichiers compressés.
- URL de référence :
- http://www.eila.univ-paris-diderot.fr/~avolansk/COURS-IL/Cours1.shtml
Ressource copiée dans le cache de l'Infothèque le 26/06/2008
- URL de référence :
- /cache/10200/www.eila.univ-paris-diderot.fr/~avolansk/COURS-IL/Cours1.shtml.html
Notice mise en ligne le 25/06/2008 |