Présentation générale du Fonds de données linguistiques du Québec

Vidéo

Accéder à la transcription textuelle de la vidéo

https://www.youtube-nocookie.com/embed/5GcDaDM-oZc

Transcription textuelle de la vidéo

[Générique d'ouverture : Logo UdS, en partenariat avec le gouvernement du Québec. En texte apparaît : FDLQ, Fonds de données linguistiques du Québec, ainsi que les logos du CRIFUQ et du Fonds de données linguistiques du Québec.]

[Personne 1] : Un corpus c'est un ensemble de données,

[Personne 2] : organisées, recueillies dans un but précis,

[Personne 3] : répertoriées au même endroit pour faire de l'analyse.

[Personne 4] : Un corpus ça répond toujours à un besoin, à un objectif précis,

[Personne 5] : ça permet de faire comme une photo dans le temps, par exemple de la langue parlée ici.

[Personne 6] : Cet ensemble-là sera étudié en fonction d'une méthodologie adaptée à la recherche qu'on veut mener.

[Personne 7] : Un corpus ne sera jamais complet, parce que c'est toujours quelque chose de fini à l'intérieur d'un ensemble infini.

[Personne 8 : Wim Remysen, professeur et responsable du Fonds, Université de Sherbrooke] : 

Quand on fait de la linguistique, ce qui nous intéresse, c'est de savoir comment les gens parlent.

En fait, ce qui nous intéresse surtout, c'est de savoir comment les gens parlent spontanément quand ils ne sont pas surveillés ou observés.

Et l'objectif du projet, c'est de réunir toutes sortes de collectes de données qui ont été faites au Québec depuis les années 70 à peu près et qui témoignent justement de l'évolution de la langue au Québec et de la façon dont on utilise le français en contexte québécois.

La nature des documents va varier selon le type de corpus dont il est question. 

Donc dans le cadre d'un corpus écrit, les documents, ce sera des textes, des œuvres littéraires par exemple, ou encore des articles de journal. Dans le cadre de corpus oraux, chaque document, ce sera plutôt des entrevues, donc des enregistrements faits avec des gens.

Le défi, c'est vraiment de trouver pour tous les corpus, la meilleure approche pour les rendre plus pérennes, les préserver sur notre plateforme et puis faciliter l'accès aux données parce que ultimement, évidemment, c'est ça qu'on veut faire. L'idée, c'est que ça nous permet de faire des comparaisons entre autres entre la langue écrite et la langue orale.

Donc on a différents registres de langue, parce qu'évidemment, quand on travaille sur la langue, il faut garder en tête que la langue se module différemment en fonction du contexte dans lequel on prend la parole ou le contexte dans lequel on écrit.

Les manifestations de notre langue dans le passé, ça fait partie de notre histoire et ça fait partie de notre patrimoine. Donc le but du projet, c'est de contribuer aussi à préserver ce patrimoine et de contribuer à le valoriser.

Le projet est réalisé au Centre de recherche  interuniversitaire sur le français en usage au Québec, le CRIFUQ. Donc c'est un centre de recherche qui existe ici même à l'Université de Sherbrooke, un centre qui existe je dois dire depuis les années 70. Il y a une tradition assez importante à l'Université de Sherbrooke de faire des travaux sur le français au Québec. Et on s'inscrit vraiment dans cette tradition-là.

Donc pour nous en tant que linguistes, c'est la recherche sur la langue évidemment qui est importante mais on souhaite aussi que, je souhaite aussi que ces données-là puissent intéresser d'autres personnes, et que ça puisse sortir un peu des murs de l’Université.