Moteur de recherche
Le moteur de recherche est un aspect central du Fonds de données linguistiques du Québec. Il permet de chercher un mot
Dans le contexte de la plateforme FDLQ, mot n’est pas utilisé dans le sens d’« unité lexicale » qu’il prend en linguistique, mais plutôt comme synonyme de mot-forme (mot séparé par des espaces) ou encore de token. Les mots faisant partie du lexique d’un document ou d’un corpus correspondent ainsi à l’ensemble des tokens qu’on y trouve; suivant cette logique, pomme de terre correspond à trois tokens. ou une suite de mots dans les corpus
Ensemble de textes établi selon un principe de documentation exhaustive, un critère thématique ou exemplaire en vue de leur étude linguistique (définition tirée d'Usito). versés au Fonds. On peut effectuer divers types de recherche et ajuster les paramètres de recherche.
Sommaire
Type de recherche
Le moteur de recherche permet d'effectuer trois types de recherche : il est possible de chercher des occurrences
Apparition d'une unité linguistique dans le discours; par métonymie, cette unité (définition tirée d'Usito)., des cooccurrences
Ensemble d'unités lexicales qui apparaissent fréquemment en combinaison dans un énoncé, et qui sont liées par un rapport de proximité syntaxique et de relative dépendance (définition tirée d'Usito). et des lemmes
Forme canonique d’un mot variable (au masculin singulier pour les noms et les adjectifs, à l’infinitif pour les verbes) (définition tirée d'Usito).. Pour changer le type de recherche, cliquez sur la petite flèche qui se trouve à droite du champ et sélectionnez la valeur de votre choix.
Occurrences
Une occurrence est l'attestation d'une unité linguistique dans un corpus (définition tirée de Usito).
C'est le type de recherche qui est sélectionné par défaut, il permet d'effectuer une recherche sur toutes les occurrences du mot (ou de la suite de mots) saisi dans le champ de recherche.
Cooccurrences
Une cooccurrence est l'ensemble des unités lexicales qui apparaissent fréquemment en combinaison dans un énoncé, et qui sont liées par un rapport de proximité syntaxique et de relative dépendance (définition tirée de Usito).
Le moteur de recherche permet de trouver des mots qui ne sont pas utilisés les uns après les autres, mais qui sont utilisés dans un voisinage donné.
Comment faire une recherche par cooccurrences
- Saisissez un terme dans le premier champ de recherche. Il est à noter qu'on peut saisir une suite de mots dans le champ de recherche.
- Indiquez le sens de la recherche. Par défaut, la flèche bidirectionnelle est choisie (la flèche bidirectionnelle indique que les deux termes peuvent apparaître dans n'importe quel ordre).
- Saisissez le second terme à rechercher.
- Indiquez la distance maximale entre les mots. Par défaut, la distance est réglée à 10 mots, mais on peut régler la distance à 40 mots au maximum.
- Pressez sur la touche Entrée du clavier ou cliquez sur l'icône Rechercher.
Dans l'exemple ci-dessus, puisque la flèche bidirectionnelle est choisie, « panier » et « fruits » peuvent arriver en premier dans la séquence. Il peut y avoir au maximum 10 tokens
Unité textuelle minimale qui résulte de la segmentation automatique du texte d’un document. Il peut s’agir de mots ou de formes de mots (bleuetière, jouaient, vingt-cinq, tire-bouchon, etc.), de chiffres (500.000, 1608, etc.) ou d’abréviations (2e « deuxième », M. « monsieur », av. « avant », etc.)., y compris la ponctuation, entre les termes de recherche. Voici des exemples de résultats :
- La flèche vers la gauche indique que le terme saisi à droite doit apparaître en premier dans les résultats;
- La flèche bidirectionnelle indique que les deux termes peuvent apparaître dans n'importe quel ordre;
- La flèche vers la droite indique que le terme saisi à gauche doit apparaître en premier dans les résultats.
Lemmes
Un lemme est la forme canonique d’un mot variable (au masculin singulier pour les noms et les adjectifs, à l’infinitif pour les verbes) (définition tirée de Usito).
Par exemple, si on inscrit "blanc" dans le champ de recherche, le système retournera les résultats suivants : blanc, blancs, blanche et blanches.
Champ de recherche
Inscrivez un mot ou une suite de mots dans le champ de recherche et cliquez sur l'icône Rechercher (ou pressez la touche Entrée du clavier). Au besoin, modifiez les options de recherche.
Si vous cherchez un mot unique, le système proposera des orthographes alternatives.
Si vous cherchez une suite de mots, il n'est pas permis d'utiliser d'opérateurs logiques (+, " " (guillemets), -, *, ET, OU, etc.). La recherche s'effectue sur la suite de mots, telle que saisie. À noter que le système ne propose pas d'orthographes alternatives.
Tous les signes de ponctuation sont traités comme des tokens. Ils peuvent faire l'objet d'une requête. Par exemple, la requête « bleu! » ne retourne pas les mêmes résultats que « bleu ».
Options de recherche
On accède aux options de recherche en cliquant sur l'icône qui se trouve tout juste à droite du champ de recherche. Ce faisant, une fenêtre contextuelle surgit.
| Option | Description |
|---|---|
|
Sensible à la casse |
Si cette option est activée, le moteur de recherche tiendra compte des majuscules et des minuscules. Par défaut, cette option n'est pas activée. Par exemple, la recherche sur le mot « Espagnol » ne retournera pas les mêmes résultats que « espagnol ». |
|
Sensible aux diacritiques |
Si cette option est activée, le moteur de recherche tiendra compte des signes diacritiques (accents aigu, grave et circonflexe, trémas et cédilles). Par défaut, cette option n'est pas activée. Par exemple, la recherche sur le mot « aigue » ne retournera pas les mêmes résultats que « aiguë » ou « aigüe ». |
|
Sensible aux expressions régulières |
Si cette option est activée, le moteur de recherche tiendra compte des expressions régulières. Par défaut, cette option n'est pas activée. Consultez le lien suivant pour en apprendre plus sur les expressions régulières (aussi appelées regex). Par exemple, la requête « (panier|casseau) de fraises » retournera les résultats « panier de fraises » et « casseau de fraises » |
|
Sensible aux jokers |
Si cette option est activée, le moteur de recherche tiendra compte des jokers
|
Les options d'affichage sont définies à la section Résultats de recherche.
Voir aussi
Dernière modification : 21 mai, 2025






