Corpus CLIQ-Jeunesse : corpus de littérature jeunesse québécoise

Vidéo

Accéder à la transcription textuelle de la vidéo

https://www.youtube-nocookie.com/embed/_z_roqIy-Bo

Transcription textuelle de la vidéo

[Générique d'ouverture : Logo UdS, en partenariat avec le gouvernement du Québec. En texte apparaît : Corpus CLIQ-Jeunesse, littérature jeunesse québécoise, ainsi que les logos du CRIFUQ et du Fonds de données linguistiques du Québec.]

[Paméla Vachon, Coordonnatrice à la recherche, Université de Sherbrooke] :

Le corpus de littérature jeunesse, c'est un corpus de littérature québécoise qui comprend, entre autres, des albums, des contes, de la poésie, des romans de littérature jeunesse, donc de préscolaire, primaire, secondaire. Tout ça ensemble, ça fait partie du corpus. 

Les sujets sont extrêmement variés, des sujets aussi dramatiques que des séparations, des deuils, aux sujets très, très joyeux ou des sujets plus anxiogènes comme la rentrée scolaire ou toutes sortes de situations. L'intimidation est traitée évidemment tout plein, mais il y en a beaucoup d'autres.

[Hélène Cajolet-Laganière, professeure associée et coauteure du dictionnaire Usito, Université de Sherbrooke] :

Un corpus ça répond toujours à un besoin, à un objectif précis. Et dans ce cas-ci, c'est un mandat qui nous avait été donné du ministère de l'Éducation qui voulait offrir aux professeurs du Québec, une liste de mots qu'on voulait recommander pour chaque année du primaire. Et un autre corpus plus ouvert pour le secondaire.

Donc la question se posait : comment on choisit ces mots ? Et nous on a décidé de choisir un corpus de littérature de jeunesse pour aller sélectionner les mots.

On travaillait avec une équipe de conseillères pédagogiques du ministère de l'Éducation. Ce sont des spécialistes de la littérature de jeunesse et nous, on voulait qu'elles nous fournissent des ouvrages qui étaient lus dans les écoles, des ouvrages qui étaient bien rédigés, qui présentaient une cohérence dans le récit ou dans la narration, des valeurs intéressantes, des thèmes différents. 

On a numérisé ces ouvrages, etc., et on a constitué un corpus. 

[Paméla Vachon] : Par la suite, on passe à l'étape d'océrisation. Donc on prend le texte, on met ça dans un logiciel et ça nous fait ressortir les mots, donc le texte tel quel. On regarde pour ce que nous on a obtenu comme transcription, soit le plus le plus fidèle possible à l’œuvre originale.

J'ai participé à l'élaboration de quelques-uns des protocoles pour la révision des œuvres et le corpus jeunesse a son propre protocole.

C'est très créatif dans les livres pour enfants, il y a des choses qui ressortent totalement, ne serait-ce que la façon dont les pages sont faites, des fois le texte est totalement à l'envers parce que le personnage parle à un miroir. Comment est-ce qu'on fait pour respecter l'essence de l'œuvre mais que le contenu soit facilement consultable en ligne ?

Donc il y a ces petits défis-là qui n'apparaissent pas dans d'autres corpus parfois.

[Hélène Cajolet-Laganière] : Et le corpus a été, ces dernières années, remis à jour complètement et versé dans le Fonds de données linguistiques, ce qui donnera une possibilité d'utilisation encore plus grande.

C'est un corpus extraordinaire parce que la littérature de jeunesse est un fleuron de la littérature au Québec. Cette littérature a connu un essor incroyable et est reconnue à l'échelle internationale.

Description

CLIQ-Jeunesse offre une vitrine sur plus de 350 œuvres littéraires rédigées par des autrices et auteurs du Québec et publiées depuis les années 1980. Les œuvres versées dans ce corpus peuvent être filtrées sur la base du type d’ouvrage (roman, poésie, conte, etc.) et du niveau scolaire ciblé pour la lecture du texte (cycles du primaire et du secondaire). Les critères utilisés pour le choix des titres retenus dans ce corpus s’inspirent de ceux préconisés pour l'élaboration, en 2014, de l'interface et de la Liste orthographique du ministère de l’Éducation et de l’Enseignement supérieur du Québec, auxquelles a participé le CRIFUQ.