Corpus ChroQué : chroniques québécoises de langage

Vidéo

Accéder à la transcription textuelle de la vidéo

https://www.youtube-nocookie.com/embed/AQvbD1BLsU8

Transcription textuelle de la vidéo

[Générique d'ouverture : Logo UdS, en partenariat avec le gouvernement du Québec. En texte apparaît : Corpus ChroQué, chroniques québécoises de langage, ainsi que les logos du CRIFUQ et du Fonds de données linguistiques du Québec.]

[Wim Remysen, professeur et responsable du Fonds, Université de Sherbrooke] :

ChroQué pour chroniques de langage.

Donc c'est un corpus qui comprend des articles de journaux qui traitent de la question de la langue. On parle d'articles publiés depuis, je dirais les années 1860 à peu près.

C'est pendant cette décennie-là que le genre chronique de langage est apparu dans la presse au Québec. C'est une période qui est vraiment marquée par une prise de conscience que la langue qu'on parle au Québec et la langue qu'on parle en France n'est pas exactement la même, qu'il y a des différences lexicales par exemple, qu'il y a des différences dans la prononciation.

Et donc il y a des gens qui vont commencer à commenter ces différences-là dans des articles, le plus souvent pour critiquer, pour corriger la langue telle qu'on pouvait l'utiliser à l'époque.

Et puis ce genre-là a connu vraiment un essor assez important à la fin du XIXe siècle jusque dans les années 60 je dirais. Et donc comme c'est un genre qui a été très important dans le développement des idées sur la langue au Québec, on a ressenti le besoin de créer un corpus pour faciliter l'accès à ces articles-là.

Le corpus a été constitué à partir de la fin des années 90 et on y a travaillé pendant une bonne quinzaine d'années.

Et j'ai aussi collaboré comme étudiant à l'époque, comme doctorant à l'époque, à la constitution de ce corpus.

Et c'était effectivement un travail relativement complexe, parce qu'il fallait premièrement faire la liste de tous les articles en consultant les archives.

Donc ça c'était une étape importante, on avait un certain nombre d'indications générales sur les périodes de publication mais les articles, il fallait les répertorier, puis ensuite, il fallait aussi les retranscrire.

Bon maintenant, de nos jours, on a des logiciels qui permettent de faire des extractions de textes avec quand même un résultat relativement acceptable et ça permet de traiter ces données-là relativement facilement.

Mais à l'époque, quand on a commencé à préparer ce corpus-là, on retapait les articles à la main parce que souvent la qualité des archives n'était pas assez bonne.

En fait, les microfilms qu'on a utilisés pour faire le corpus, c'est un peu la matière brute si on veut parce que c'est là-dessus que les journaux étaient archivés.

Donc on a passé beaucoup de temps dans les salles d'archives à consulter les microfilms sur des machines qui permettaient de défiler les différents microfilms.

Et là, on faisait l'inventaire des articles qui étaient publiés dans la cadre d'une chronique de langue, on en faisait une copie, et puis par la suite, c'est ça qui a servi à la transcription manuelle qu'on en faisait.

Le corpus permet vraiment de voir un peu comment les discours à propos de certains mots typiques du français au Québec ont pu évoluer à travers le temps.

Donc des gens qui s'intéressent à l'évolution du discours sur la norme au Québec peuvent trouver vraiment une mine d'informations dans ce corpus-là.

Description

Le corpus ChroQué est constitué de chroniques de langage parues dans la presse québécoise depuis le milieu, et surtout la fin, du 19e siècle. Le mot chronique de langage désigne ici un ensemble de textes relativement brefs et homogènes, produits par une même personne (physique ou morale) reconnue pour sa compétence en matière de langue, diffusés périodiquement dans la presse et portant sur la langue, plus spécialement sur les bons et les mauvais usages qu’on en fait.