Introduction
Texte intégral
1Il a toujours été possible pour un linguiste de chercher ses données de travail dans un corpus (Laks 2010) ; cependant, à partir des années 1980, la linguistique de corpus, originaire des pays anglophones mais très largement acceptée désormais en France, a connu son essor, s’appuyant sur les progrès de l’informatique. Son but est de contrebalancer les faiblesses de la linguistique introspective, travaillant à partir d’exemples construits et de jugements d’acceptabilité émis par le linguiste lui-même ou par des « locuteurs compétents » ; la linguistique chomskyenne, une des principales représentantes de cette linguistique introspective, n’a d’ailleurs pas été épargnée par les critiques méthodologiques (Jacques 2005, p. 22). Face à cela, la linguistique de corpus voulait revenir à une appréhension plus directe et dynamique du langage : le corpus permet alors d’étudier des occurrences attestées et contextualisées, produites par des locuteurs réels dans un but de communication certain, et d’appréhender leur légitimité non en termes d’acceptabilité, mais de statistique. La notion d’usage remplace alors celle de norme ou de système abstrait, ou du moins la complète dans une relation dialectique. Le chercheur est alors censé prendre en compte des éléments qui sont extérieurs à sa conscience et qui ne relèvent pas de son seul sentiment linguistique ; cela lui permet d’appréhender la langue de façon a priori plus objective, plus dynamique et plus vaste, puisque le chercheur n’est plus limité ni par son idiolecte ni par sa seule intuition, qui ne peut produire tous les énoncés attestés en langue. Cette approche, nécessitant l’analyse de données à grande échelle, n’était possible qu’avec l’apport de l’informatique et grâce à la multiplication des logiciels de traitement de données textuelles.
2Ainsi, comme le soulignent les travaux épistémologiques de François Rastier (2011, p. 14-18 et 36-39), une certaine vision de la linguistique de corpus implique de redéfinir l’opposition entre langue et parole ; le linguiste « introspectif », avec ses exemples construits, ne se soucie que du code normatif et génératif de la langue, sans s’occuper de l’actualisation de cette langue dans son utilisation réelle, la parole. À l’inverse, la linguistique de corpus tend à considérer qu’il y a une interaction entre les deux, un va-et-vient constant entre le pôle des instances et le pôle des performances (la distinction instance / performance recoupant celle entre système et corpus, et langue et parole) ; ainsi, la linguistique permet d’analyser un espace intermédiaire entre langue et parole. François Rastier considère que cet espace est celui des normes, qu’il faut décrire sans ériger des lois d’acceptabilité. Cette définition de l’objet de la linguistique de corpus permet d’éviter un des écueils qu’elle porte en elle ; celle-ci, poussée dans ses retranchements, pourrait marquer la fin de toute théorie de la langue et borner la linguistique à une description de sommes d’usages jamais extrapolés à la langue, ce qui est contestable (Mayaffre 2005).
3Enfin, ce que permet la linguistique de corpus, et c’est là un apport essentiel, c’est de penser la variation (Jacques 2005) ; selon la constitution du corpus, il est alors possible de décrire la langue comme un système ouvert, ou en tout cas évolutif ; les deux articles qui suivent en témoignent, puisque Catherine Pinon essaie de décrire un état actuel et contemporain de l’arabe, que les grammaires traditionnelles ne rendent qu’imparfaitement, et Soufiane Lanseur essaie de saisir de façon contemporaine l’évolution du système lexical du français d’Algérie, et notamment la néologie, appréhendée au sein d’un vocabulaire spécialisé.
4Le rabattement sur l’attesté et sur l’étude d’une somme de paroles ne permet toutefois pas à lui seul d’asseoir la scientificité de la linguistique de corpus : la constitution d’un corpus ne peut pas écarter d’emblée toute manipulation de la réalité (Mellet 2002). L’objectivité totale d’un corpus ne peut en effet pas être atteinte, dans la mesure où le corpus est construit et, pour ce qui est des auteurs des articles qui vont suivre, il a été constitué par le chercheur dans un but précis, qui oriente les critères de choix : le corpus dépend donc d’un besoin qui détermine sa nature et son existence (Rastier 2011, p. 34). À chaque chercheur de justifier la constitution de son corpus, déterminée par un certain nombre de critères qui ont déjà été évoqués en introduction générale (tableau). Parmi ces critères, celui de représentativité permet de faire le lien entre la somme de paroles et le système de la langue : par le choix des textes qui le constituent et par l’atteinte d’une certaine taille, déterminée selon des critères statistiques, le corpus peut espérer être un représentant fidèle d’une partie au moins du système de la langue. Enfin, il s’agit de déterminer aussi la manière dont le corpus sera employé : on peut globalement opposer l’approche corpus-based, utilisant le corpus comme outil de vérification ou d’infirmation d’hypothèses a priori, à l’approche corpus-driven, qui veut faire émerger du corpus des éléments qui seront théorisés a posteriori (Williams 2005, p. 13 ; la distinction se retrouve chez Mayaffre 2005). Nos auteurs semblent plutôt pratiquer la seconde approche, même s’ils témoignent d’une réflexion a priori qui oriente la constitution du corpus. Autre critère d’opposition, en présence de deux corpus hétérogènes, l’étude peut se révéler essentiellement unitaire (Soufiane Lanseur dégage une liste de néologismes qui traversent les disparités du corpus) ou au contraire contrastive (Catherine Pinon, à plusieurs reprises, dégage des variations génériques au sein de son corpus).
5Les deux communications linguistiques se sont focalisées sur la question même du corpus, et notamment sa nature et les modalités de sa constitution, orientée par le but que se propose le chercheur. Ainsi, Catherine Pinon a préféré, pour l’étude du verbe kâna en arabe contemporain, constituer un corpus moderne plutôt que de se situer dans la lignée de grammaires fondées sur le même matériel roulant depuis des siècles. La syntaxe descriptive que propose de faire l’auteure repose ainsi sur un corpus récent (2002-2011) et constitué afin de rendre compte au mieux de variations diatopiques et génériques ; les critères de choix du corpus sont ainsi exposés, et l’on voit se juxtaposer à la fois de précises exigences épistémologiques (répartition géographique des dialectes, nature et spécificité des genres pris en compte) et les nécessités pratiques, notamment en termes d’accessibilité de corpus. L’entrecroisement de ces contraintes a permis de construire un corpus à la fois vaste et varié, et satisfaisant aux exigences de représentativité. Les résultats obtenus permettent ainsi, outre de donner une typologie d’emploi du verbe, d’observer les conséquences des choix initiaux ; ainsi, autant le critère générique s’avère pertinent au plan des statistiques d’emploi, autant le critère diatopique ne permet pas de dégager de tendances notables, ce qui est peut-être dû à la nature syntaxique de l’objet d’étude.
6Soufiane Lanseur, pour sa part, étudie le vocabulaire économique en Algérie, dans le but de fonder un lexique. Ici aussi, le choix du corpus est déterminant selon l’objet d’étude, assez spécifique ; il est donc récent (2007) et spécifique, puisqu’il ne concerne que des documents de vulgarisation économique, à savoir l’émission radiophonique Le rendez-vous de l’économie et le supplément économique hebdomadaire au journalEl Watan. La grande majorité des locuteurs apparaissent donc comme des acteurs ou des spécialistes du domaine économique, mais le contexte de parole implique une forme de vulgarisation. Le corpus permet ainsi de faire coexister de l’écrit et de l’oral et différents genres de discours. Il a permis de dégager, par des moyens à la fois contextuels et lexicographiques, le vocabulaire économique, dont les néologismes ont été étudiés à partir de critères morphologiques et sémantiques. L’auteur conclut donc à une spécificité du vocabulaire économique algérien, qu’il faut décrire en tant que tel afin de pallier aux insuffisances des lexiques existants et ramener à la réalité de l’économie algérienne, dont la nature oriente évidemment le vocabulaire qui la décrit.
Bibliographie
Des DOI sont automatiquement ajoutés aux références bibliographiques par Bilbo, l’outil d’annotation bibliographique d’OpenEdition. Ces références bibliographiques peuvent être téléchargées dans les formats APA, Chicago et MLA.
Format
- APA
- Chicago
- MLA
Jacques Marie-Paule, 2005, « Pourquoi une linguistique de corpus ? », La linguistique de corpus, G. Williams éd., Rennes, Presses universitaires de Rennes (Rivages linguistiques), p. 21-30.
Laks Bernard, 2010, « La linguistique des usages : de l’exemplum au datum », L’exemple et le corpus. Quel statut ?, P. Cappeau et al. éd., Rennes, Presses universitaires de Rennes, p. 13-28.
Mayaffre Damon, 2005, « Rôle et place des corpus en linguistique : réflexions introductives », Texto !, nº 10. En ligne : [http://www.revue-texto.net/Reperes/Themes/Mayaffre_Corpus.html] (consulté le 29 octobre 2014).
Mellet Sylvie, 2002, « Corpus et recherches linguistiques », Corpus, nº 1. En ligne : [http://corpus.revues.org/7] (consulté le 23 février 2015).
10.4000/corpus.7 :Pincemin Bénédicte, 1999, « Construire et utiliser un corpus : le point de vue d’une sémantique textuelle interprétative », Atelier Corpus et TAL : pour une réflexion méthodologique, conférence TALN 99, 12-17 juillet 1999, A. Condamines, M.-P. Péry-Woodley et C. Fabre dir., Cargèse, TALN, p. 26-36. En ligne : [http://icar.univ-lyon2.fr/membres/bpincemin/biblio/pincemin_taln99.pdf] (consulté le 29 octobre 2014).
Rastier François, 2011, La mesure et le grain. Sémantique de corpus, Paris, Champion.
Williams Geoffrey, 2005, « Introduction », La linguistique de corpus, G. Williams éd., Rennes, Presses universitaires de Rennes (Rivages linguistiques), p. 13-18.
10.1163/9789004463851 :Auteur
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Acteurs et territoires du Sahel
Rôle des mises en relation dans la recomposition des territoires
Abdoul Hameth Ba
2007
Les arabisants et la France coloniale. 1780-1930
Savants, conseillers, médiateurs
Alain Messaoudi
2015
L'école républicaine et l'étranger
Une histoire internationale des réformes scolaires en France. 1870-1914
Damiano Matasci
2015
Le sexe de l'enquête
Approches sociologiques et anthropologiques
Anne Monjaret et Catherine Pugeault (dir.)
2014
Réinventer les campagnes en Allemagne
Paysage, patrimoine et développement rural
Guillaume Lacquement, Karl Martin Born et Béatrice von Hirschhausen (dir.)
2013