Lexique
Le Fonds de données linguistiques du Québec est composé (pour l'instant!) de plus de 95 millions de mots
Dans le contexte de la plateforme FDLQ, mot n’est pas utilisé dans le sens d’« unité lexicale » qu’il prend en linguistique, mais plutôt comme synonyme de mot-forme (mot séparé par des espaces) ou encore de token. Les mots faisant partie du lexique d’un document ou d’un corpus correspondent ainsi à l’ensemble des tokens qu’on y trouve; suivant cette logique, pomme de terre correspond à trois tokens., dont plus de 435 000 mots uniques, répartis dans plus de 33 000 documents
Unité de base d’un corpus (qui se définit comme une collection de documents), par exemple une œuvre littéraire, une chanson, une bande dessinée, un article de journal, une fiche dialectologique ou encore une entrevue. Dans le cadre du Fonds, une distinction est faite entre le contenu textuel du document (transcription) et le contenu binaire (version numérisée de l’original : image ou enregistrement audio). provenant de 24 corpus
Ensemble de textes établi selon un principe de documentation exhaustive, un critère thématique ou exemplaire en vue de leur étude linguistique (définition tirée d'Usito)..
Sommaire
Lexique du Fonds
La page Lexique du Fonds montre la liste de tous les mots du Fonds de données linguistiques du Québec, tels qu'attestés dans les documents de tous les corpus. Quelques statistiques générales sont également affichées.
On accède à la page Lexique du Fonds par la page d'accueil du FDLQ, en cliquant sur les liens ou le bouton vert à droite de la page. On peut aussi y accéder à partir de n'importe quelle page du FDLQ en cliquant sur l'onglet Lexique qui se trouve tout juste en dessous du logo du Fonds.
Lexique du corpus
L'onglet Lexique du corpus affiche tous les mots attestés dans un corpus. Tous les mots d'un lexique sont cliquables. Lorsqu'on clique sur un des mots, on lance une recherche dont les résultats s'affichent dans la concordance
Liste des résultats d’une requête textuelle où les éléments recherchés sont affichés dans leur contexte. qui comprend toutes les attestations du mot en question dans le corpus (un filtre rapide est appliqué sur le corpus).
Lexique du document
L'onglet Lexique du document affiche tous les mots attestés dans un document. Tous les mots d'un lexique sont cliquables. Lorsqu'on clique sur un des mots, on lance une recherche dont les résultats s'affichent dans la concordance qui comprend toutes les attestations du mot en question dans le document (un filtre rapide est appliqué sur le document).
Voir aussi
Dernière modification : 27 mai, 2025



