Mon dieu que les technologies ont changé depuis !

5 décembre 2022

Nous plongeons aujourd’hui dans l’histoire de la sociolinguistique québécoise grâce à une capsule vidéo préparée il y a une dizaine d’années par Pierrette Thibault. La vidéo a été diffusée à l’occasion d’un panel thématique organisé en hommage à Gillian Sankoff, coauteure du corpus Montréal 1971, dans le cadre du colloque NWAV 41 (New Ways of Analyzing Variation, un colloque annuel consacré à l’étude de la variation des langues). Nous y voyons Pierrette Thibault, elle-même coauteure du corpus Montréal 1984, rendre visite au local de recherche occupé à l’Université de Montréal par les équipes qui ont travaillé à la constitution des corpus montréalais de 1971 et 1984.

En plus de mettre un visage sur le nom de plusieurs chercheuses qui ont participé à la constitution des corpus sociolinguistiques montréalais, cette vidéo permet de prendre toute l’ampleur des avancées technologiques faites dans notre discipline au cours des dernières décennies. Avant que les outils informatiques deviennent plus accessibles, le papier et le travail manuel prenaient bien sûr une place importante. À preuve, les fiches manuscrites et les concordances qui passent en revue dans la vidéo et qui font dire à Pierrette Thibault « Mon dieu que les technologies ont changé depuis ! ».

La notion de « concordance » demande quelques explications. Dans le domaine de la linguistique de corpus, les concordances désignent des extraits de corpus qui contiennent tous le même mot, permettant ainsi de voir les contextes et les conditions d’utilisation qui le caractérisent. Ce type de présentation est très utile lorsqu’on tente d’étudier les sens d’un mot, d’observer son comportement grammatical dans la phrase ou encore de faire l’inventaire des autres mots avec lesquels il se combine souvent. Lorsqu’on tape un mot dans le moteur de recherche qui est disponible sur la plateforme du Fonds, les résultats de cette recherche se présentent sous la forme d’une concordance où l’on voit le mot cherché (appelé pivot) ainsi que le contexte qui le précède (contexte gauche) ou qui le suit (contexte droit).

Pierrette Thibault montre aussi dans sa capsule une carte du grand Montréal où est identifiée la localisation géographique de chacune des personnes ayant participé à la collecte de données en 1971 (première couche) et en 1984 (deuxième couche). L’observateur attentif remarquera qu’il y a une dispersion géographique plus grande qui caractérise l’échantillon réalisé dans les années 1980. En effet, parmi les 60 personnes enregistrées en 1971 et réinterviewées en 1984, plusieurs ont déménagé à l’extérieur de l’île, sur les rives nord et sud (sans compter que certaines personnes ont quitté la région de Montréal). Cette carte, que l’on voit ci-dessous, a été reproduite dans l’ouvrage Un corpus de français parlé, publié en 1990 au Département de langues et linguistique de l’Université Laval par Pierrette Thibault et Diane Vincent.

Carte Montréal 1984 - Localisation des informateurs.

En terminant, revenons sur la citation du célèbre linguiste français Émile Benveniste que l’on voit au début de la vidéo : « Nihil est in lingua quod non prius fuerit in oratione », c’est-à-dire « rien n’est dans la langue qui ne soit d’abord dans le discours ». Autrement dit, c’est par la prise en compte du discours que l’on peut analyser la langue. Cette approche résolument empirique de l’étude de la langue, ancrée dans l’observation de l’usage, est essentielle lorsque les linguistes analysent et décrivent une langue ou une variété de langue. Elle explique le besoin de constituer des corpus.

Merci à Pierrette Thibault (pour l’autorisation de diffuser la capsule vidéo) et à Michael Friesner (pour avoir attiré mon attention sur l’existence de cette vidéo). Bonne écoute !

Wim Remysen