Rechercher des suites de mots dans les corpus

18 octobre 2022

Le moteur de recherche qui permet d’interroger les corpus diffusés sur la plateforme du Fonds de données linguistiques du Québec vient d’être doté d’une nouvelle fonction de recherche. À partir de maintenant, il est possible de chercher des suites de deux ou de plusieurs mots. Cette nouvelle fonctionnalité permet entre autres de repérer des mots composés (pensons à des noms ou à des adjectifs comme blé d’Inde, bleu poudre, soupe au lait), des groupes de mots (les adverbes complexes à tort et à travers ou ad nauseam, par exemple) ou encore des proverbes (l’habit ne fait pas le moine).

Il s’agit d’une illustration de la méthode agile adoptée pour le développement informatique du Fonds de données linguistiques du Québec. Au lieu d’attendre le développement complet de la plateforme du Fonds avant sa diffusion en ligne, nous avons plutôt choisi de rendre accessible dès le lancement du projet une première version du moteur de recherche et de continuer à le développer de manière soutenue par la suite. D’autres améliorations suivront.

N’hésitez pas à nous faire part de vos observations et de vos suggestions. Bonne découverte !