1. Présentation générale de la théorie de Chomsky
p. 29-59
Texte intégral
1Ce premier chapitre introductif consiste en une présentation générale de la théorie linguistique de Chomsky. Dans les années 1950, Chomsky définit un nouveau programme de recherche pour la linguistique, qui prend le nom de « grammaire générative ». Si les théories linguistiques élaborées dans le cadre de ce programme de recherche ont assez considérablement évolué depuis une soixantaine d’années, le modèle général est resté, quant à lui, inchangé. Il repose sur trois principes fondamentaux.
1. Les trois principes fondamentaux du modèle de Chomsky
1. Le mentalisme
2Chomsky propose d’étudier le langage dans l’esprit du locuteur1. Cette approche cognitive du langage définit le premier pilier sur lequel repose son modèle, le mentalisme.
A. La critique du behaviorisme ou la nécessité d’une approche mentaliste
3C’est par sa critique du behaviorisme, ou comportementalisme, qui a dominé la psychologie et la linguistique américaines des années vingt aux années cinquante, que Chomsky s’est fait connaître en dehors des cercles de linguistes.
4Pour la psychologie behavioriste, seule peut être scientifique une étude du comportement, qui ne prend en compte que ce qui est observable et quantifiable. Cette étude du comportement en termes de stimuli et de réponses, c’est-à-dire de réactions de l’organisme à des stimulations externes ou environnementales, fait volontairement abstraction des états mentaux, de l’esprit, considéré comme une « boîte noire » : c’est là le domaine vague et non quantifiable de l’intériorité et de l’introspection contre laquelle les behavioristes réagissent. L’influence du behaviorisme, se prévalant d’une méthodologie rigoureuse et scientifique, a été grande en psychologie, surtout aux États-Unis, et son aura a attiré des chercheurs d’autres domaines. Ainsi le linguiste américain Bloomfield se réclame-t-il du behaviorisme2, qui, s’il n’a pas de conséquences directes sur ses travaux linguistiques proprement dits3, sera du moins associé au courant structuraliste américain en linguistique par son intermédiaire.
5En 1959, Chomsky publie un compte rendu critique de Verbal Behavior de Skinner, chef de file de la psychologie behavioriste américaine. C’est cette critique, plus lue et commentée que l’ouvrage dont elle rend compte, qui fait connaître Chomsky. Dans son livre, Skinner applique au comportement verbal humain le cadre et les instruments d’analyse du behaviorisme, pour en faire, à l’instar des autres comportements, le produit d’un conditionnement. Si Skinner a connu des succès en psychologie animale, sa tentative pour analyser le comportement humain et notamment les fonctions supérieures comme le langage dans un cadre strictement behavioriste est un échec. L’argumentation de Chomsky montre en détail que l’analyse de Skinner, en termes de dispositions au comportement verbal, d’habitudes acquises durant l’enfance, est incapable de prendre en compte la complexité du langage. On considère que son compte rendu sonne définitivement le glas du behaviorisme.
6Il y a évidemment d’abord tout un versant critique et négatif dans la revue de Chomsky : celui-ci critique l’emploi des concepts behavioristes dans l’étude des comportements humains et montre qu’ils sont inappropriés si on les emploie littéralement ou inutiles à la compréhension si on les emploie métaphoriquement. Pris en un sens littéral, ils laissent de côté la majeure partie du comportement verbal. Les notions de stimulus, de réponse, de renforcement n’ont de définition précise que dans le cadre de procédures expérimentales particulières, comme les expériences de pression de levier. Hors de ce cadre, ces notions n’ont plus rien d’objectif (voir Chomsky 1959, trad. p. 20). Parce qu’en réalité ils ne peuvent pas prendre en compte la complexité du comportement humain, les concepts behavioristes sont condamnés à un usage métaphorique. Cet usage ne fait alors que masquer une description qui n’a plus rien de scientifique, mais n’est autre que la description du sens commun, c’est-à-dire de la psychologie ordinaire.
7Cependant, le revers positif de cette critique est la démonstration en creux de la nécessité pour l’étude du comportement verbal d’une prise en compte de l’esprit et des états mentaux, de la nécessité d’une approche mentaliste des processus de compréhension linguistique. Chomsky souligne que les concepts du behaviorisme achoppent précisément sur les états mentaux. Comme ils ne permettent pas d’expliquer scientifiquement ces états mentaux, ils n’en sont que des paraphrases. Chomsky pointe ainsi, par exemple, les difficultés liées à l’usage de la notion de « stimulus régissant » : en supposant que le comportement verbal soit sous le contrôle de propriétés physiques de l’environnement du locuteur, on n’est en réalité en mesure d’identifier le stimulus qu’une fois que le locuteur a parlé. Par exemple, l’énoncé « hollandais » devant un tableau serait, selon Skinner, typique d’un comportement verbal sous le contrôle du stimulus. Mais, remarque Chomsky, le locuteur aurait pu tout aussi bien dire : « Accroché trop bas », « Beau » ou encore « Tu te rappelles notre expédition de l’été dernier ? » (ibid., trad. p. 22). En fait, ce qui détermine sa réponse, ou sa réaction, c’est son état mental ; c’est parce qu’il pense à telle chose et non à telle autre, que le locuteur prononce tels mots et non tels autres. Cela amène Chomsky à conclure ironiquement : « […] cette histoire de contrôle par le stimulus cache simplement un retour complet à la psychologie mentaliste » (id.).
8Pour montrer que la conception behavioriste du langage ne tient pas, Chomsky s’appuie sur des faits simples mais révélateurs de la nature du langage. Ainsi souligne-t-il l’aspect créateur ou productif du langage : tout locuteur est capable de comprendre et de produire des phrases nouvelles, qu’il n’a jamais entendues ou prononcées. Qui plus est, les innovations constamment constatées dans le comportement linguistique se conforment à des règles. En décrivant le comportement verbal en termes de réaction et en ignorant les régularités qui lui sont sous-jacentes parce qu’il s’agit de processus non directement observables, Skinner en sous-estime ainsi systématiquement la complexité. Dans la formation d’une phrase, bien d’autres processus sont en jeu que la réponse aux stimuli. Chomsky conclut sur la nécessité d’au moins s’interroger sur ces processus.
9Le mentalisme est donc établi ici en réaction au behaviorisme. Tournons-nous maintenant vers le contenu positif que Chomsky donne au mentalisme.
B. L’étude de la compétence linguistique
10Par mentalisme, Chomsky entend une approche qui cherche à « découvrir une réalité mentale sous-jacente au comportement effectif » (Chomsky 1965, trad. p. 13). Cette réalité mentale sous-jacente est ce qu’il appelle « la compétence ». Dans le premier chapitre d’Aspects de la théorie syntaxique, Chomsky introduit la distinction fondamentale entre « compétence » et « performance » précisément pour s’opposer au behaviorisme qui prend le comportement comme seul objet d’étude. La performance renvoie au comportement du locuteur, à « l’emploi effectif de la langue dans des situations concrètes » (id.), alors que la compétence décrit « la connaissance que le locuteur-auditeur a de sa langue » (id.). Il faut noter que cette distinction a pour Chomsky une valeur générale, dirigée contre la méthodologie même du behaviorisme : dans le domaine du langage comme dans d’autres domaines, elle est un préalable nécessaire à l’étude du comportement, dans la mesure où on ne saurait étudier le comportement sans prendre en compte les capacités qui le guident et qui consistent en certaines structures cognitives. L’étude de la compétence prime sur celle de la performance et doit la précéder. Chomsky pose comme hypothèse de travail qu’il n’y a pas de théorie de la performance sans une compréhension de la compétence sous-jacente.
11Le langage considéré sous cet angle est une « capacité cognitive » (Chomsky 1975), et l’objet de la linguistique est d’étudier les capacités mentales du locuteur qui constituent à proprement parler sa maîtrise de la langue. Tel est le sens positif du mentalisme prôné par Chomsky : la linguistique est conçue comme une partie de la psychologie (voir par exemple Chomsky 1975, trad. p. 49). Chomsky a coutume de présenter le type de recherche qu’il propose sous la forme de trois questions fondamentales4 :
quelle est la connaissance de sa langue maternelle acquise par un locuteur-auditeur natif ?
comment cette connaissance a-t-elle été acquise ?
comment cette connaissance est-elle utilisée par le locuteur ?
12Les deux premières questions, renvoyant respectivement à la description de la compétence et au problème de l’acquisition du langage, sont, depuis le début des années soixante, au cœur du programme de recherche chomskyen. La dernière question est en revanche considérée par Chomsky comme hors de portée de la science. Chomsky distingue en effet ce qu’il appelle les « problèmes » des « mystères » (Chomsky 1975) : les « problèmes » peuvent être abordés scientifiquement, alors que les « mystères » sont des questions que la science n’a pas, ou du moins pas encore, les moyens de traiter. Si la question de l’usage du langage, ou de la performance, est un mystère, c’est qu’elle fait intervenir une forme de créativité, de liberté, qui n’est pas modélisable.5
13La perspective mentaliste de Chomsky, qui accorde la priorité à la connaissance individuelle qu’a tout locuteur de la grammaire de sa langue, s’oppose non seulement au behaviorisme mais à tout un courant de la philosophie contemporaine qui accorde la priorité au langage conçu comme un fait public, un fait social, qui existe d’abord dans la communauté linguistique ou collectivement, avant d’exister pour l’individu. Pour Chomsky au contraire, il y a de bonnes raisons de penser que la réalité sociale d’une langue dépend des mécanismes psychologiques grâce auxquels un locuteur compétent produit et interprète les phrases de la langue.
14Chomsky propose donc d’étudier les structures mentales sur lesquelles repose le comportement linguistique. Mais comment accéder à la compétence du locuteur ?
15Jusqu’alors, la linguistique est essentiellement fondée sur les études de corpus. La linguistique structuraliste américaine post-bloomfieldienne retient de la méthodologie behavioriste l’idée qu’il faut s’appuyer sur des faits observables, en l’occurrence les énoncés prononcés, suivant la définition du langage proposée par Bloomfield : « La totalité des énoncés qui peuvent être produits dans une communauté linguistique est le langage de cette communauté linguistique » (Bloomfield 1933, p. 155. Ma traduction). Que ces corpus soient constitués par des énoncés ou par des textes, ils représentent la source des données utilisées par les linguistes (voir par exemple Harris 1951, p. 12, ou Hockett 1947, p. 322).
16En même temps qu’il propose d’adopter une nouvelle perspective sur la nature du langage, Chomsky introduit une nouvelle source de données pour l’étudier. Il s’agit de recourir aux intuitions des locuteurs (à commencer par celles du linguiste lui-même) sur des phrases de leur langue maternelle, et plus précisément aux jugements qu’ils peuvent produire sur l’acceptabilité de certaines phrases6.
17Pour autant, il ne s’agit pas de revenir à l’introspection, que Chomsky critique comme méthodologie en science (Chomsky 1968, trad. p. 65 ; 1980, trad. p. 227). En effet, les intuitions des locuteurs natifs ne constituent pas l’explication, comme c’était le cas dans la psychologie introspective, où les principes d’explication sont tenus pour être immédiatement accessibles. Ces intuitions constituent au contraire ce qu’il y a à expliquer, la matière même de la linguistique (Chomsky 1964, p. 79). Du point de vue de Chomsky, les jugements des locuteurs natifs sur l’acceptabilité des phrases de leur langue ne constituent pas en eux-mêmes une connaissance objective fiable de la structure syntaxique et sémantique de la langue. Comme le souligne Newmeyer (1983, p. 51sq), un jugement d’acceptabilité sur une phrase d’une langue soulève toujours la question empirique de savoir s’il reflète la compétence grammaticale d’un locuteur ou d’autres facteurs cognitifs (dont la compétence pragmatique ou les ressources attentionnelles).
18Ces intuitions ne sont pas non plus toujours « à la disposition immédiate de l’utilisateur de la langue » (Chomsky 1965, trad. p. 38). Par exemple, un locuteur peut ne pas se rendre compte immédiatement qu’une phrase est ambiguë, si, en l’écoutant, il l’interprète implicitement dans un certain contexte et ne pense pas aux autres contextes où elle peut prendre un autre sens. C’est le travail du linguiste de « guider et de dégager l’intuition du sujet parlant de façon parfois assez minutieuse avant de déterminer ce qu’est effectivement sa connaissance de la langue » (ibid., trad. p. 42).
19De même que les grammaires traditionnelles présupposent la connaissance de la langue que la perspective mentaliste de Chomsky prend pour objet d’étude, de même l’étude du langage fondée sur les corpus présuppose le jugement intuitif du locuteur : par exemple, on ne peut utiliser des phrases non grammaticales du corpus sans disposer de l’information qu’elles sont non grammaticales. Il faut donc recourir aux jugements intuitifs pour déterminer le statut des exemples trouvés dans le corpus (voir Chomsky 1980a, p. 188).
20Chomsky a bien sûr conscience de la nouveauté que représente son approche mentaliste du langage7. Il souligne que le programme de recherche ou le champ d’études défini par la grammaire générative a contribué au développement des sciences cognitives au tournant des années 1950 (cf. Chomsky 1986, p. 5). C’est devenu un lieu commun de parler du rôle prépondérant joué par Chomsky dans ce qu’on a appelé la « révolution cognitive »8. Le mentalisme, qui rompt définitivement avec le behaviorisme, en est une composante, mais ce n’est pas la seule.
2. Le computationnalisme
21Ce qui a également compté dans la révolution cognitive est la manière dont Chomsky a proposé d’étudier les aspects de l’esprit/cerveau impliqués dans le langage : il a appliqué au langage le modèle des systèmes computationnels de règles qui forment et modifient des représentations. L’expression de « grammaire générative » désigne ainsi l’élaboration de modèles computationnels explicites des mécanismes grammaticaux grâce auxquels une phrase est dérivée de structures syntaxiques sous-jacentes. Souscrire au computationnalisme, c’est admettre que les processus mentaux sont des processus de traitement de l’information ; ces processus sont des calculs sur des symboles en fonction de leurs caractéristiques formelles ou syntaxiques. On peut voir encore l’influence de Chomsky sur la « révolution cognitive » dans le fait que le computationnalisme est devenu un élément fondamental du paradigme cognitiviste classique9. C’est le deuxième grand principe fondateur du modèle chomskyen pour le langage.
A. Générativité et récursivité.
22Dans Structures syntaxiques, Chomsky part d’une définition générale et abstraite de ce qu’est un langage, qui inclut non seulement les langues naturelles mais aussi les langages artificiels, comme « un ensemble (fini ou infini) de phrases, chacune de longueur finie, et construite à partir d’un ensemble fini d’éléments » (Chomsky 1957, trad. p. 13). Il propose de considérer les grammaires comme des mécanismes ou des machines qui appliquent des opérations à des symboles de manière mécanique, indépendamment de leur signification, et qui engendrent à partir de règles en nombre fini les phrases du langage en question. Ainsi, il oppose aux grammaires traditionnelles descriptives la notion de grammaire générative (voir Chomsky 1964). Pour comprendre l’enjeu de la notion de grammaire générative, il faut prendre en compte deux propriétés fondamentales du langage, que Chomsky met au cœur de sa réflexion.
23La première de ces propriétés est la créativité linguistique. Rappelons que Chomsky entend par là le fait qu’un locuteur compétent est capable de comprendre et de produire des phrases nouvelles, qu’il n’a jamais entendues auparavant. Chomsky souligne le fait que pour rendre compte de cette créativité, la grammaire doit être conçue non comme un inventaire d’éléments mais comme un système de règles10. La créativité dont il s’agit ici est, comme le dit Chomsky (1964), « gouvernée par des règles » : c’est la grammaire elle-même, en tant que système génératif, qui confère au langage cette propriété de créativité11.
24La seconde propriété considérée par Chomsky est le caractère infini du langage : l’ensemble des phrases grammaticales d’une langue est infini. Pour le montrer, on peut reprendre un argument utilisé par Chomsky. L’argument s’appuie sur le fait qu’il n’y a pas de limite grammaticale à la longueur des phrases. À partir d’une phrase comme :
Marie aime un grand pianiste.
25on peut construire les phrases suivantes :
Marie aime un très grand pianiste.
Marie aime un très très grand pianiste.
26sans qu’il existe une limite grammaticale ou syntaxique à l’itération de l’adverbe très. De même, à partir de la phrase :
Il est trop tard.
27on peut construire des phrases contenant un nombre indéfiniment grand de propositions enchâssées, comme dans l’exemple suivant :
Marie croit que Pierre pense que Jean croit qu’il est trop tard.
28Le fait que la grammaire d’une langue autorise la construction de phrases infiniment longues conduit à affirmer que l’ensemble des phrases grammaticales d’une langue est lui-même infini. Si la longueur des phrases est limitée de fait, notamment à cause des limites de notre mémoire, les langues naturelles n’en possèdent pas moins, en leur principe, ce caractère infini.
29Chomsky emprunte aux travaux mathématiques et logiques de Turing et Church et à la théorie des fonctions récursives, issue, à l’origine, de la théorie de la calculabilité, les concepts et les outils nécessaires à la grammaire générative. Il introduit la notion centrale de récursivité dans la définition des grammaires génératives. La récursivité désigne la propriété d’une règle de pouvoir se ré-appliquer indéfiniment à son propre résultat. Selon Chomsky, une grammaire d’une langue naturelle ou formelle est un système de règles récursives, c’est-à-dire de procédures récursives d’engendrement des phrases. Pour le dire autrement, on peut définir la grammaire d’une langue naturelle par une fonction générative dotée de propriétés récursives. On rend ainsi compte de la langue non pas en énumérant exhaustivement les structures qu’elle autorise, mais de manière générative, parce qu’on peut engendrer à partir des règles de la grammaire toutes les phrases bien formées dans cette langue et seulement elles. La langue est davantage un « processus génératif » qu’un « ensemble d’objets générés » (Chomsky 2000a, trad. p. 172).12
30Le générativisme, qui utilise les outils développés dans l’étude des langues formelles et logiques pour étudier la syntaxe et la sémantique des langues naturelles, est un des éléments qui, pour Chomsky, doivent contribuer à rendre la linguistique scientifique.
B. Le formalisme et le traitement scientifique du langage
31La formalisation et la mathématisation contribuent à rendre pour Chomsky le traitement du langage qu’il propose scientifique. La volonté de faire de la linguistique une science n’est cependant pas nouvelle, pas plus que ne l’est la tentative de formalisation des grammaires naturelles qui accompagne cette ambition.13 Il n’est que de se référer à la conclusion du livre de Bloomfield pour s’en rendre compte (même si le souci de scientificité en linguistique remonte bien sûr plus loin, au moins au 19e siècle). L’apport essentiel de Bloomfield est d’avoir généralisé l’analyse en constituants immédiats, reprise à sa suite par les linguistes structuralistes américains. Il s’agit d’assigner aux phrases, mais aussi aux autres niveaux de l’analyse linguistique, une structure hiérarchique de constituants ou d’unités minimales. Les successeurs de Bloomfield cherchent le moyen de systématiser, c’est-à-dire de formaliser et d’axiomatiser, cette procédure d’analyse. Zellig Harris, le maître de Chomsky, est le premier à tenter d’appliquer les mathématiques à la linguistique.
32Chomsky propose cependant une étude mathématique des propriétés formelles des grammaires qui va plus loin que tout ce qui a été fait précédemment (voir Chomsky 1956 et 1957). Il s’agit pour lui de formaliser les types de grammaires existants pour montrer leurs limites intrinsèques et dégager ainsi quels types de grammaires sont ou ne sont pas adéquats pour décrire (ou engendrer) les phrases des langues naturelles. Dans Structures syntaxiques, il s’intéresse à deux types de grammaires dont il montre le caractère inadéquat de ce point de vue.
33Le premier est dit « à états finis » ou « de type markovien », parce qu’il correspond à ce qu’on appelle en mathématiques un « processus de Markov à nombre fini d’états ». Comme le dit Chomsky, « [l]a grammaire à états finis est le type le plus simple de la grammaire qui, avec un appareil fini, peut engendrer un nombre infini de phrases » (ibid., trad. p. 27). Ce genre d’automates14 est la formalisation d’un modèle grammatical linéaire, inspiré par la théorie de la communication développée par Shannon et proposé notamment par Hockett, ainsi que le mentionne Chomsky (1957, note 4, trad. p. 23)15.
34Chomsky démontre l’inadéquation de ce modèle du langage. Son argument consiste à montrer qu’il y a des structures syntaxiques de l’anglais dont la construction requiert un modèle à états non finis, du type anbn par exemple (langage engendrant toutes les suites ab, aabb, etc.) ; ces constructions sont impossibles à engendrer à partir d’un automate à états finis.16 Ainsi, les langues naturelles ne sont pas à états finis, et un automate à états finis ne peut pas engendrer toutes les phrases grammaticales d’une langue naturelle et elles seules.
35Le second type examiné par Chomsky dans Structures syntaxiques est celui des grammaires à structure syntagmatique, c’est-à-dire fondées sur l’analyse en constituants immédiats. On reconnaît là le type de modèle proposé par les structuralistes américains. Ce modèle n’est plus linéaire mais hiérarchique, la structure d’une phrase pouvant être représentée par un arbre. Les grammaires de ce type sont appelées « grammaires non contextuelles » : il s’agit de systèmes de réécriture, composés de règles de réécriture comme X→ Y (lire : « réécrire X par Y »), où l’application des règles n’est pas contrainte par le contexte. La production, ou « dérivation », d’une phrase peut être illustrée par un exemple adapté de Chomsky (1957) :
Règle I : P → SN + SV
Règle II : SN → Art + N
Règle III : SV → V + SN
Règle IV : Art → The
Règle V : N → man, ball, etc.
Règle VI : V → hit, took, etc.17
36De cet ensemble de règles, on peut dériver la phrase « The man hit the ball » de la manière représentée par l’arbre suivant :
37Chomsky ne démontre jamais l’inadéquation du modèle syntagmatique pour décrire les langues naturelles, mais il souligne qu’il ne peut s’y appliquer qu’au moyen d’une analyse complexe, ad hoc et non révélatrice (Chomsky 1957, trad. p. 39).
38J’ai bien sûr présenté ici les différents modèles de grammaires de manière très simplifiée. Mais ce qu’il importe de retenir, c’est que les outils mathématiques formels introduits par Chomsky permettent une clarification des tâches de la linguistique.18
C. L’autonomie de la syntaxe
39Le formalisme de l’approche chomskyenne est associé à
la thèse de l’autonomie de la grammaire formelle, selon laquelle la faculté de langage construit une structure formelle abstraite, dotée de sens par des règles interprétatives, une structure intégrée qui s’insère de manière définie dans un système d’utilisation du langage. (Chomsky 1975, trad. p. 71).
40La thèse de l’autonomie de la syntaxe19, comme elle est souvent appelée, consiste à affirmer que le cœur de la faculté de langage est constitué par un système computationnel, qui fonctionne sur une base formelle, indépendamment des interprétations et du sens qui sont ensuite donnés aux phrases dans la conversation et l’utilisation effective du langage.
41Si l’expression d’« autonomie de la syntaxe » est absente de Structures syntaxiques, Chomsky y défend l’idée qu’il est nécessaire de fonder la grammaire sur l’étude de la structure, de la forme, indépendamment du sens. Il l’illustre par un exemple fameux :
Colorless green ideas sleep furiously
*Furiously sleep ideas green colorless (Chomsky 1957, trad. p. 17)20
42Comme peut le reconnaître tout locuteur anglophone, des deux suites de mots précédentes, seule la première est une phrase grammaticale, même si son interprétation sémantique est problématique. En cela, Chomsky s’oppose à de nombreux linguistes structuralistes ou à des philosophes, comme Quine, qui considèrent que les concepts grammaticaux ne peuvent être définis qu’à partir de notions sémantiques (voir Chomsky 1977, p. 143).
43Chomsky distingue ainsi la part du sens qui est déterminée par la structure syntaxique de la phrase de la signification au sens le plus large du terme. Cela le conduit ultérieurement à remplacer la notion d’interprétation sémantique par celle de forme logique :
J’ai proposé l’expression « forme logique » pour l’opposer à « représentation sémantique ». J’ai utilisé l’expression traditionnelle de forme logique pour désigner les aspects sémantiques qui sont déterminés strictement par des principes linguistiques. (Chomsky 1977, p. 150)
44La relation entre la forme logique et la représentation sémantique au sens large implique d’autres systèmes cognitifs que la faculté de langage proprement dite.
45Pour ce qui est de ses conceptions sémantiques au sens large, Chomsky se dit influencé par Goodman, Quine et d’autres philosophes logiciens, ainsi que par Wittgenstein et par la philosophie d’Oxford (Chomsky 1977, p. 142). Il tient ainsi la notion de signification pour quasi synonyme de la notion d’usage. Et cela explique en partie que l’étude du sens au sens large ne relève pas, selon lui, d’une étude scientifique ; l’usage du langage, comme on l’a vu, est un mystère qui n’est pas formalisable en termes scientifiques. Comme le fait remarquer Newmeyer (2007), l’affirmation de l’autonomie de la syntaxe est à relier de ce point de vue à la distinction entre compétence et performance : c’est parce que les représentations sémantiques au sens large du locuteur engagent ses croyances sur le monde et varient en fonction de l’intention du locuteur qu’elles relèvent, selon Chomsky, du domaine de la performance et échappent, comme telles, à toute modélisation.
3. L’innéisme
46L’innéisme linguistique représente le troisième pilier du modèle chomskyen. L’hypothèse de l’innéité de la faculté de langage est évoquée pour la première fois par Chomsky (1959) comme une hypothèse plausible, apte à remplacer avantageusement du point de vue explicatif les présupposés behavioristes. De quoi s’agit-il ?
A. Le problème de l’acquisition du langage et l’hypothèse de la Grammaire universelle
47L’« hypothèse de l’innéité », comme Putnam l’appellera21, est avancée en réponse au problème de l’acquisition du langage. Ce problème occupe une place centrale dans le modèle chomskyen. Pour comprendre comment il s’insère dans ce modèle, il faut l’inscrire dans son contexte, celui du problème de la justification des grammaires. Chomsky distingue entre l’« adéquation descriptive »» et l’« adéquation explicative » d’une grammaire. Une grammaire est dite descriptivement adéquate si elle engendre correctement les phrases grammaticales d’une langue donnée. Une grammaire est dite adéquate d’un point de vue explicatif si, de surcroît, elle contribue à expliquer comment l’enfant humain acquiert la connaissance de la grammaire de sa langue à partir des données linguistiques mises à sa disposition par les membres de sa communauté.22 Cette distinction reflète la dualité entre deux tâches assignées à une grammaire générative. D’une part, une grammaire générative a pour tâche de constituer une théorie du savoir tacite (la compétence) d’un locuteur d’une langue donnée. D’autre part, elle a pour tâche de contribuer à expliquer comment un enfant humain acquiert sa compétence. Comme toute hypothèse scientifique, une grammaire d’une langue naturelle est sous-déterminée par les faits linguistiques qui servent à la confirmer. Pour trancher entre deux (ou plusieurs) grammaires descriptivement adéquates, il convient de savoir laquelle possède la meilleure adéquation explicative. Il faut donc se poser à chaque étape du travail de description des langues la question de l’adéquation explicative, c’est-à-dire de la possibilité que certaines propriétés d’une langue soient expliquées en référence à des propriétés plus générales et plus profondes de la faculté de langage (voir Chomsky 1965, trad. p. 56-57).
48La notion de grammaire, telle que Chomsky l’utilise, est donc ambiguë (ibid., trad. p. 44)23. Elle désigne à la fois la description ou la théorie d’une langue particulière, et la théorie du langage. En ce dernier sens, elle renvoie aux principes biologiques de l’esprit humain qui contraignent la forme des langues humaines possibles. La grammaire en ce sens correspond à ce que Chomsky appelle la « grammaire universelle ».
49Le terme est repris de la grammaire philosophique de l’âge classique (Chomsky 1966, trad. p. 86sq ; 1965, trad. p. 16-17). Chomsky se réfère à la tradition de ce qu’il appelle la « linguistique cartésienne », qui s’est intéressée, au-delà de l’élaboration de grammaires particulières, à la « grammaire générale », ou « grammaire explicative », « c’est-à-dire aux principes universels de la structure du langage » (Chomsky 1966, trad. p. 86).24 La grammaire universelle en ce sens, parce qu’elle « formule les régularités profondes qui, étant universelles, sont omises dans la grammaire elle-même » (Chomsky 1965, trad. p. 17), permet de parvenir à l’adéquation explicative, de justifier la préférence d’un système grammatical par rapport à tels autres dans la mesure où ses propriétés concordent avec les régularités universelles du langage.
50La grammaire universelle est non seulement l’ensemble des principes universels auxquels sont soumises toutes les langues humaines, mais aussi la base innée à partir de laquelle se développe l’acquisition du langage chez l’enfant. C’est pourquoi Chomsky caractérise la grammaire universelle comme un « mécanisme d’apprentissage du langage », « Language Acquisition Device » ou « LAD » en anglais (voir, par exemple, Chomsky 1986, p. 3) :
[…] on peut supposer l’existence d’un état mental initial, fixe et génétiquement déterminé, commun à l’espèce, sauf pour quelques variations mineures (pathologie mise à part). L’esprit passe alors par une série d’étapes, à l’intérieur des conditions limitatives posées par l’expérience, pour parvenir finalement à un « état stationnaire », à un âge relativement fixe, état qui ne se modifie plus dès lors que marginalement. La propriété fondamentale de l’état initial est donc que, étant donné l’expérience, il se développe en un état stationnaire. Par suite, on peut considérer cet état initial comme une fonction, caractéristique de l’espèce, qui transpose l’expérience en un état stationnaire. La grammaire universelle constitue une caractérisation partielle de cette fonction ; la grammaire particulière d’une langue qui s’est développée dans l’esprit constitue, quant à elle, une caractérisation partielle de l’état stationnaire atteint. (Chomsky 1980a, trad. p. 177)
51La grammaire universelle n’est donc pas seulement « l’état initial » de la faculté de langage, mais également la fonction qui caractérise le passage de cet état initial à l’état stable. Il s’agit bien, à proprement parler, d’un mécanisme d’apprentissage.
52Le fait que Chomsky donne à l’universalité un fondement biologique distingue ce qu’il entend par grammaire universelle d’une grammaire générale qui aurait « pour objet les propriétés logiquement ou conceptuellement nécessaires » (Chomsky 1980a, trad. p. 30) pour définir le langage en soi. Les propriétés universelles qu’il assigne pour tâche à la linguistique de découvrir ne sont pas des a priori logiques, mais elles « représentent un a priori de l’espèce » (Chomsky 1971, trad. p. 69). Il définit ainsi la grammaire universelle comme
le système des principes, des conditions et des règles qui sont des éléments ou des propriétés de toutes les langues humaines, pas simplement par accident, mais par nécessité – nécessité biologique et non logique, évidemment. (Chomsky 1975, trad. p. 40)
53Il faut souligner qu’en avançant l’hypothèse de l’existence d’une grammaire universelle, Chomsky reformule la question de l’inné et de l’acquis en termes d’état initial et d’état stable de la faculté de langage. Il y a un état initial de la faculté de langage, et cette configuration initiale consiste dans les principes universels de la syntaxe : c’est la grammaire universelle, ou encore le « mécanisme d’apprentissage du langage » qui guide l’enfant dans son apprentissage de sa langue maternelle. Une fois que l’enfant a appris à parler, qu’il maîtrise sa langue maternelle, il possède une compétence linguistique, qui est l’état stable de la faculté de langage. Cette reformulation n’est évidemment pas seulement terminologique ; elle a des conséquences sur la manière de comprendre l’innéité biologique et le rapport inné/acquis. J’y reviendrai au chapitre 6.
B. Innéité, modularité et domaine-spécificité
54Au-delà de cette reformulation, la notion d’innéité de la faculté de langage engage également une certaine conception de l’esprit. En effet, l’idée qu’il existe une faculté de langage comme telle implique que le langage est un système cognitif bien délimité, avec son fonctionnement propre, distinct de celui d’autres systèmes cognitifs. Chomsky considère ainsi le langage comme « un « module » de l’esprit » (voir, par exemple, Chomsky 1986, p. 13), ou encore un « organe mental » (par exemple encore, Chomsky 1980a, trad. p. 61 et 226). Cette question engage l’architecture de l’esprit/cerveau et Chomsky la discute notamment dans Règles et Représentations :
[…] il s’agit de savoir si l’esprit est organisé en facultés cognitives distinctes dotées chacune de sa structure et de ses principes spécifiques, ou bien s’il existe des principes uniformes d’apprentissage, d’accommodation, d’assimilation, d’abstraction, d’induction, de stratégie, ou quoi que ce soit du même genre, qui n’ont qu’à s’appliquer à différents stimuli pour produire notre connaissance du comportement des objets physiques dans l’espace, de la signification qu’ont ou n’ont pas certaines suites de mots, etc. (Chomsky 1980a, trad. p. 49)
55Ce passage montre clairement que la notion de modularité est utilisée pour s’opposer à une conception de l’esprit comme indifférencié, comme système général de traitement de l’information, ou encore à la notion d’intelligence générale qui implique que les mêmes mécanismes d’apprentissage, des mécanismes généraux, permettent d’acquérir des connaissances dans différents domaines, en fonction des stimuli traités.
56C’est sur point que les notions de modularité et d’innéité sont liées, bien que conceptuellement distinctes :
A propos […] des facultés cognitives, il est généralement admis […] que leur développement est uniforme dans tous les domaines, et que les propriétés intrinsèques de l’état initial sont à la fois homogènes et indifférenciées. A noter qu’il y a là deux problèmes : celui de la structure innée et celui de la modularité ; et qu’on pourrait fort bien accepter l’existence de la première tout en niant ou en limitant fortement la seconde. Les deux problèmes n’en sont pas moins liés, en partie conceptuellement. Car, s’il y a peu de structure innée, ce qui se développera dans l’esprit de chacun ne pourra être qu’un système homogène produit par l’application à l’environnement des principes généraux qui constitueront alors l’équipement inné ; et s’il y a une différenciation, ce sera par reflet de l’environnement. Réciproquement, penser que les divers systèmes mentaux sont organisés selon des principes très différents conduit naturellement à conclure qu’ils sont intrinsèquement déterminés et non pas simplement le résultat de quelque mécanisme général d’apprentissage ou de croissance. (Chomsky 1980a, trad. p. 41-42).
57Chomsky défend une vision de la modularité comme une propriété innée du cerveau, renvoyant à des systèmes physiquement, neurologiquement distincts. Si les systèmes cognitifs ne sont pas « physiquement isolable[s] » (Chomsky 1980a, trad. p. 61), au sens où ils ne peuvent fonctionner qu’intégrés au cerveau tout entier, de la même façon que les organes physiques, comme le cœur ou le foie, ne fonctionnent qu’intégrés à l’organisme, ils possèdent néanmoins chacun leur fonctionnement propre dont on peut tenter de décrire isolément les principes.25
58En quoi consiste le « module » cognitif ou l’« organe mental » qu’est le langage ? Chomsky le décrit comme une « structure mentale consistant en un système de règles et de principes qui engendrent et mettent en rapport des représentations mentales de divers types » (ibid., trad. p. 50 ; voir aussi p. 61). Il est caractérisé par un certain contenu, un corps de connaissances. Il est « propre à un domaine », ou « domaine-spécifique »26 en ce sens : la faculté de langage est constituée par des « connaissances »27 spécifiques, propres au langage.
59Bien que la notion de modularité soit antérieure au travail du philosophe des sciences cognitives Jerry Fodor (ainsi d’ailleurs qu’à Chomsky lui-même)28, c’est lui qui, dans son ouvrage de 1983, The Modularity of Mind, a donné à cette notion sa définition canonique. Fodor définit la modularité en termes de traitement de l’information : les modules sont des mécanismes computationnels, qui font des inférences et produisent des représentations mentales. Ils ne sont donc pas caractérisés par leur contenu mais fonctionnellement. Il définit les modules comme des mécanismes computationnels « propres à un domaine, innés, câblés, autonomes et non construits » (Fodor, 1983, trad. p. 55). De manière plus précise, les systèmes cognitifs modulaires, c’est-à-dire pour Fodor les systèmes périphériques comprenant les systèmes perceptifs (et moteurs) et le langage, possèdent les neuf propriétés suivantes, à un degré plus ou moins élevé (id.) : ils sont propres à un domaine ; leur opération est obligatoire ; ils sont d’accès limité ; ils sont rapides ; ils sont informationnellement cloisonnés ; leur sortie est superficielle ; ils sont associés à une architecture neuronale fixe ; ils présentent des défaillances caractéristiques ; leur ontogenèse suit un rythme et une séquence d’étapes caractéristiques.
60Chomsky s’explique dans une note sur son rapport à la notion fodorienne de modularité (cf. Chomsky 1986, note 10, p. 14). Cette note souligne les limites d’un traitement du langage en termes de module fodorien. Pour comprendre les réticences de Chomsky, il faut rappeler que Fodor, en distinguant les processus modulaires périphériques des processus qu’il dit centraux, a en vue l’opposition entre les processus perceptifs, auxquels il joint le langage, et les processus de pensée et de raisonnement. Quand Chomsky dit que le langage ne saurait se réduire à un « système périphérique » parce qu’il est impliqué dans la parole (la production du langage) et dans la pensée (un processus central selon Fodor), il faut comprendre que le langage n’est pas un simple système de traitement perceptif des sons linguistiques. Il ne suffit pas d’ajouter à la perception la production pour rendre compte du langage. Chomsky fait valoir que perception et production ne peuvent fonctionner qu’en lien à un même système de connaissance ; c’est au sens où le langage ne se limite pas aux systèmes d’entrée et de sortie, mais est aussi et fondamentalement un système cognitif qu’il n’est pas modulaire au sens de Fodor (Chomsky 2000a, trad. p. 256).
61Chomsky remet en cause la distinction centrale chez Fodor entre processus modulaires et processus centraux en affirmant que ce système de connaissances, qui constitue le cœur de la faculté de langage, a les propriétés d’un système central au sens de Fodor (voir aussi sur ce point Chomsky 2000a, p. 20). Comment le comprendre ? Il suffit de dire ici, en suivant les suggestions de Jacob (1989, p. 85sq), que le locuteur peut utiliser la connaissance qu’il a de sa langue pour produire des jugements sur la grammaticalité ou l’acceptabilité29 de certaines phrases, ce qui implique des inférences et une réflexion qui sont le propre des processus centraux de Fodor. Cette dimension réflexive et délibérative de la compétence linguistique peut aussi expliquer que le traitement linguistique ne soit pas aussi « rapide » que Fodor le voudrait en faisant du langage un processus modulaire.
62Il faut donc voir dans l’affirmation chomskyenne que la faculté de langage est modulaire essentiellement l’affirmation de son autonomie et de son indépendance par rapport aux autres facultés cognitives, autonomie et indépendance qui reposent elles-mêmes sur la domaine-spécificité, c’est-à-dire sur des principes propres de fonctionnement.
C. Les universaux du langage
63Venons-en enfin plus précisément aux propriétés universelles que Chomsky attribue à la faculté de langage innée. Bien sûr, l’universalité comme telle n’implique pas l’innéité, mais elle peut en être un bon indice.
64Comme le souligne Egré (2011), les universaux linguistiques n’ont pas tous le même statut épistémologique, puisque certains peuvent être relatifs à des sous-domaines de la linguistique, comme la phonologie par exemple, et tous n’ont pas le même intérêt du point de vue théorique. Un énoncé comme : « toutes les langues parlées ont des consonnes et des voyelles » désigne un fait universel qui n’a pas nécessairement de portée théorique30. Dans Aspects de la théorie syntaxique, Chomsky distingue les universaux de substance et les universaux de forme. Les premiers concernent les éléments de toute langue, ou, comme dit Chomsky, « le vocabulaire de la description linguistique » (Chomsky 1965, trad. p. 48) ; ce sont par exemple ses éléments phonétiques et l’on peut dans ce cas penser à la théorie de Jakobson sur les traits phonétiques universaux. Les universaux formels sont plus abstraits, et concernent les conditions formelles que doit remplir toute grammaire. C’est essentiellement les universaux de forme ou syntaxiques qui sont l’objet des recherches en grammaire générative. La grammaire universelle se présente ainsi comme « un ensemble de schèmes déterminant la forme et le caractère des grammaires, ainsi que les principes selon lesquels elles opèrent » (Chomsky 1975, trad. p. 261).
65Chomsky distingue sa propre conception des universaux linguistiques de celle proposée par l’approche typologique, qui cherche à faire une typologie des langues en regardant ce qu’elles ont en commun, et notamment des travaux de Greenberg qui sont associés à cette dernière31. Greenberg (1963) pose les bases d’une classification des langues fondée sur les propriétés structurales, indépendamment de l’histoire. Etudiant un échantillon de trente langues, parlées, chacune, par un grand nombre d’individus et réparties sur toute la planète, il en tire quarante-cinq universaux potentiels. Ce sont pour la plupart des universaux statistiques et non absolus, qui ne s’appliquent pas de manière obligatoire à toutes les langues. Ces universaux prennent le plus souvent la forme suivante : si telle langue a la propriété x, elle a toujours aussi la propriété y ; c’est pourquoi ils sont dits aussi implicationnels. Par exemple, si une langue présente un ordre de base des mots du type Sujet-Verbe-Objet, alors les mots interrogatifs sont au début de la phrase, et il y a des prépositions ; inversement, si une langue présente l’ordre Sujet-Objet-Verbe, les mots interrogatifs sont à la fin de la phrase et il y a des postpositions.32 Les universaux proposés sont donc des universaux dérivés des données. Les universaux de la grammaire universelle sont au contraire dérivés de la théorie.33
66Une conséquence notable de la différence entre l’approche chomskyenne des universaux et une approche typologique est qu’il n’est pas nécessaire pour la première de s’appuyer sur l’étude de multiples langues pour dériver un principe général. Il suffit qu’un principe puisse être assigné à la faculté de langage plutôt qu’à l’expérience pour faire l’hypothèse qu’il est lié à un principe de la grammaire universelle. D’une certaine manière, ce que Chomsky propose est d’étudier les propriétés d’une langue donnée, et d’examiner ensuite si elles s’appliquent à une autre langue (Chomsky 1965, trad. p. 44)34. S’il ne s’agit pas de dire que l’étude d’une seule langue suffit, elle n’est pas non plus entièrement inutile pour l’étude de la grammaire universelle :
[… La discussion] s’est restreinte, jusqu’à présent, à l’anglais, ce qui est une sérieuse limitation. […] En admettant une uniformité de la capacité de langage à travers l’espèce, si un principe général est confirmé empiriquement pour une langue donnée, et si, de plus, il y a des raisons d’admettre qu’elle n’a pas été apprise (donc pas enseignée), alors il est plausible de postuler que ce principe appartient à la grammaire universelle, comme un partie du « système de connaissance préexistant » qui rend l’apprentissage possible. (Chomsky 1975, trad. p. 147-148)
67La mise au jour d’universaux linguistiques n’élude pas cependant la question de leur origine ou de leur explication, et il existe des types d’explication rivaux des universaux formels proposés par la linguistique générative. On peut penser ainsi à une explication historique des universaux comme évidente : les ressemblances entre les langues seraient dues à leur origine commune. Cependant, Pinker (1994, trad. p. 232) remarque qu’il y a, semble-t-il, des régularités qui ne peuvent pas se transmettre historiquement, par exemple l’universel mentionné précédemment qui relie l’ordre de base des mots et la présence de pré- ou de postpositions ; en effet, les enfants apprennent des phénomènes propres à leur langue, mais non pas des implications générales. Il reste donc à expliquer ces régularités. Pour montrer qu’elles relèvent de contraintes imposées par le système computationnel qu’est la grammaire universelle, il faut éliminer les explications rivales possibles. Sur ce point, le débat est encore ouvert aujourd’hui, opposant les tenants d’une approche formelle et les tenants d’une approche fonctionnaliste. Le fonctionnalisme en linguistique, tout en étant un terme large englobant différents courants, renvoie couramment aux adversaires de l’approche formaliste chomskyenne qui mettent en avant des explications s’appuyant sur la fonction du langage.
68Un exemple d’explication fonctionnelle d’un universel implicationnel est fourni par Comrie (2003). Il concerne la distinction entre pronoms réfléchis et pronoms non réfléchis à travers les langues. Comrie remarque que cette distinction existe dans certaines langues (en anglais moderne, en russe, en français par exemple), mais pas dans d’autres (en vieil anglais par exemple). De plus, des langues comme le français ne possèdent la distinction qu’à la 3e personne : alors que l’anglais moderne distingue aussi bien « myself » et « me », « yourself » et « you » que « himself » et « him », le français ne distingue que « se » et « le ». En outre, Comrie souligne qu’il n’y a vraisemblablement pas de langue symétrique du français, qui distinguerait les pronoms réfléchis et non réfléchis aux première et deuxième personnes, mais pas à la troisième. Si la distinction existe, il faut donc qu’elle existe au moins à la troisième personne. Selon Comrie, cet universel implicationnel ne peut trouver une explication que sur le plan fonctionnel : parce que la première et la deuxième personnes désignent le locuteur et son interlocuteur et que leur référence respective n’est en général pas ambiguë, alors que ce n’est pas le cas à la troisième personne, la distinction entre les pronoms réfléchis et non réfléchis est plus utile en termes de communication à la troisième personne qu’aux première et deuxième personnes.35
69Le programme de recherche de Chomsky, que j’ai circonscrit au moyen de trois principes fondamentaux, a été considéré, en lui-même, comme révolutionnaire par beaucoup parce qu’il prétend conférer à la linguistique, par son ambition, son objet et ses méthodes, le statut d’une science naturelle36. Cependant, le contenu des théories linguistiques proposées dans ce cadre général a considérablement évolué depuis les débuts de la grammaire générative. Il nous faut maintenant comprendre pourquoi et examiner comment Chomsky donne corps à l’idée que la maîtrise du langage est régie par des principes universels innés.
2. L’évolution de la grammaire générative
70On peut se représenter le modèle chomskyen du langage comme un modèle à deux niveaux : au niveau de ce qu’on a appelé le programme de recherche, ce modèle veut enraciner la linguistique dans les sciences cognitives, et plus généralement dans la science ; au niveau de la théorie linguistique, il repose sur un parti pris formaliste, ou structuraliste, si on donne ici à ce mot un sens large, et il est en compétition avec d’autres modélisations des phénomènes linguistiques, notamment dans une perspective fonctionnaliste. L’évolution du modèle chomskyen depuis soixante ans s’est faite pour des raisons qui relèvent de ces deux niveaux : parvenir à répondre aux ambitions du programme de recherche ; parvenir à des descriptions adéquates des phénomènes linguistiques, les deux ordres de motivations n’étant, bien entendu, pas séparés mais interagissant sans cesse.
71Ma présentation de cette évolution sera davantage guidée par les questions et les problèmes qui se sont posés aux linguistes générativistes au premier niveau. La recherche de réponses satisfaisantes à ces questions a en partie motivé les changements apportés par Chomsky à son modèle depuis les années 1950, et c’est sous cet angle que je rendrai compte de l’évolution de la grammaire générative. Outre qu’il ne s’agit pas ici de redoubler les présentations existantes en cherchant à donner un exposé techniquement et historiquement complet de la grammaire générative et de son évolution37, et n’étant pas une linguiste de surcroît, mon souci est de prendre comme fil conducteur l’éclaircissement de la notion d’innéité qui constitue le problème central de ce livre. Cela soulève en particulier les questions suivantes : comment Chomsky conçoit le système computationnel inné qui permet l’acquisition du langage, autrement dit la grammaire universelle ? Comment les rapports entre l’inné et l’acquis, pour ce qui est du langage, sont-ils conceptualisés dans le modèle chomskyen ?
1. La caractérisation de la Grammaire universelle : des règles aux principes
72C’est d’abord la manière de concevoir la grammaire universelle qui a évolué au cours des années. Chomsky est passé d’une formulation en termes de règles à une formulation en termes de principes.
A. La « Théorie Standard » et la « Théorie Standard Étendue » : la Grammaire universelle comme un ensemble de règles
73Dans la première version du modèle chomskyen, qu’on appelle la « Théorie Standard », la grammaire universelle est conçue comme un ensemble de contraintes sur la forme des règles linguistiques possibles.
74L’une des contraintes principales est que le composant syntaxique d’une grammaire doit contenir ce que Chomsky appelle des règles transformationnelles. La « Théorie Standard » est en effet caractérisée par l’introduction de l’approche transformationnelle. C’est une approche supérieure à l’analyse en constituants immédiats, proposée notamment par les structuralistes américains, dans la mesure où elle permet de simplifier considérablement la grammaire en décrivant plus simplement un certain nombre de structures grammaticales. La notion de transformation est héritée de Zellig Harris, chez qui elle désigne des correspondances régulières entre des phrases (Harris 1951). Chez Chomsky, cette notion s’applique à une seule et même phrase (ou séquence) : il s’agit de transformer une phrase (ou une séquence) dotée d’une structure syntagmatique en une phrase (ou une séquence) dérivée possédant une autre structure syntagmatique (Chomsky 1957, trad. p. 50). Reprenons l’exemple du passif anglais proposé par Chomsky dans Structures syntaxiques. On peut en donner la règle de formation suivante :
Si S1 est une phrase grammaticale de la forme :
SN1 – Aux – V – SN2,
alors, la séquence correspondante de la forme :
SN2 – Aux + be + en – V – by + SN1
est aussi une phrase grammaticale. (Chomsky 1957, trad. p. 49)
75Cette règle est une transformation. Les transformations sont donc des types de règles grammaticales qui s’appliquent aux séquences produites par l’application des règles de réécriture pour en dériver d’autres séquences grammaticales. On parle de dérivation d’une séquence pour caractériser les différentes étapes par lesquelles passe une séquence ou une phrase avant de trouver sa forme définitive comme phrase ou séquence de mots.
76L’approche transformationnelle présuppose ainsi la distinction de différents niveaux linguistiques, à l’intérieur même du composant syntaxique de la grammaire (Chomsky 1957, §3). Chomsky introduit les notions de « structure profonde » et de « structure de surface » pour caractériser ces différents niveaux (Chomsky 1965, trad. p. 31-32). La structure profonde est la base sur laquelle opèrent les transformations. L’approche structuraliste, elle, ne distingue pas des niveaux différents (structure profonde et structure de surface sont identiques), et pour cela, elle n’est pas capable d’expliquer certains faits linguistiques.
77Prenons d’abord l’exemple du traitement d’un cas d’ambiguïté syntaxique. Soit l’expression « the shooting of the hunters » (« le tir des chasseurs »)38, qui est ambiguë puisqu’elle peut signifier le tir qui a atteint les chasseurs (« hunters » est alors l’objet) ou le tir qui provient des chasseurs (« hunters » est alors le sujet). Comme le remarque Chomsky (1957, trad. p. 101), au niveau syntagmatique, l’ambiguïté n’est pas expliquée puisque l’expression est représentée par the – V + ing – of + SN, quel que soit son sens. Dans une analyse transformationnelle au contraire, les deux sens de l’expression ont des histoires dérivationnelles différentes et correspondent à des « phrases-noyaux »39 distinctes (ibid., p. 102) : dans un cas, quand « hunters » est objet, on a la structure SN (du type « des hommes tirent sur les chasseurs »), – Verbe – SN 12 alors que dans l’autre cas, quand « hunters » est sujet, on a SN – Verbe (du type « les chasseurs tirent »).
78Un autre type de cas est laissé inexpliqué par l’analyse structuraliste ; il concerne les constructions illustrées par les deux phrases suivantes :
John is easy to please. [Jean est facile à contenter.]
John is eager to please. [Jean est enclin à faire plaisir.]
79Du point de vue de la structure de surface et de l’analyse en constituants qu’on peut en donner à ce niveau, les deux phrases sont indiscernables. Pourtant il s’agit de deux constructions syntaxiques distinctes, puisque, dans un cas, John est l’objet du verbe « please » (1), alors que dans l’autre il en est le sujet (2). L’introduction de règles transformationnelles qui dérivent la structure de surface à partir de la structure profonde permet de rendre compte de cette différence.
80Dans le modèle Standard, la grammaire universelle est assez peu développée. Comme le résume Pollock (1997, p. 201sq), elle est constituée par un ensemble d’universaux de substance comprenant la liste des traits phonologiques distinctifs et des catégories syntaxiques majeures, et un ensemble d’universaux formels comprenant la caractérisation formelle des différents types de règles linguistiques possibles, parmi lesquelles les règles de réécriture, les transformations, etc., et la spécification de leur mode d’application. Le choix entre plusieurs descriptions possibles, pour une langue donnée, est peu contraint par la grammaire universelle et se fait par un critère de simplicité (ibid., p. 202).
81Le modèle Standard va subir assez vite des modifications importantes qui vont conduire à la « Théorie Standard Étendue ». C’est notamment la caractérisation de la grammaire universelle qui évolue. De nombreux travaux dans les années 1960 tentent de découvrir des contraintes générales portant sur les transformations et les règles grammaticales. Chomsky synthétise ces travaux dans un article de 1973 intitulé « Conditions on Transformations ». Il met en avant la nécessité de proposer des contraintes pour restreindre la « variété trop grande de grammaires potentielles » (Chomsky 1973, trad. p. 103). Chomsky attribue les contraintes découvertes à la grammaire universelle.
82Le premier exemple que Chomsky (1973) donne est en réalité plus ancien et reprend une des toutes premières suggestions allant dans ce sens (voir Chomsky 1964). Il s’agit du « principe de A sur A », qui énonce une condition sur l’application des transformations dans le cadre de la Théorie Standard Étendue :
Si une transformation s’applique à une structure de la forme
[α…[A…]…]
où α est un nœud cyclique, elle doit être interprétée de façon qu’elle s’applique au syntagme maximal de type A. (Chomsky 1973, trad. p. 105. Voir aussi Chomsky 1968.)
83Le « nœud cyclique » doit être interprété ici comme un syntagme nominal ou une phrase. Ce passage généralise la contrainte énoncée auparavant uniquement pour les syntagmes nominaux (voir Chomsky 1968, trad. p. 111). Soit la phrase suivante :
He read the book that interested the boy. [Il a lu le livre qui a intéressé le garçon.] (Chomsky 1968, trad. p. 109)
84La contrainte dite de « A sur A » explique qu’on ne peut former à partir de la phrase (a) l’interrogative (a’) :
85(a’)*Who did he read the book that interested ? [*Qui a-t-il lu le livre qui a intéressé ?]
86alors que l’interrogative (a’’) est correcte :
87(a’’) Which book that interested the boy did he read ? [Quel livre qui a intéressé le garçon a-t-il lu ?]
88Dans le premier cas (a’), la transformation interrogative s’applique à un syntagme nominal qui n’est pas le syntagme nominal maximal de la phrase, en violation avec le principe énoncé : pour former la question, on déplace le syntagme « the boy » alors que celui-ci appartient à un syntagme nominal plus large, à savoir « the book that interested the boy ». Dans le second cas (a’’), la transformation interrogative porte bien sur ce syntagme nominal plus large, de sorte que la phrase est cette fois correcte. La contrainte de « A sur A », qu’on peut appliquer à de nombreux autres exemples, définit donc une condition générale pour l’application des règles transformationnelles.
89Il s’agit explicitement d’enrichir la grammaire universelle pour contraindre davantage la forme des grammaires possibles. C’est que la motivation fondamentale de l’hypothèse de la grammaire universelle est d’expliquer l’acquisition du langage. Moins la grammaire universelle est contraignante, moins l’hypothèse est utile de ce point de vue, puisque, si la variété des grammaires possibles reste très importante, la tâche de l’enfant qui doit sélectionner la grammaire de sa langue reste difficile à expliquer. Mais, tout en étoffant la grammaire universelle, la « Théorie Standard Étendue » ne change pas la manière de concevoir celle-ci, comme un ensemble de restrictions sur le format des règles et les types de catégories linguistiques.
B. L’approche des « Principes & Paramètres » : la Grammaire universelle comme un ensemble de principes
90À la fin des années 1970, Chomsky propose un changement conceptuel majeur, qui conduit à un modèle plus plausible et plus réaliste de la grammaire universelle, le modèle dit des « Principes et Paramètres » (souvent abrégé par « P & P »).
91Il s’agit de décrire toutes les langues à partir de principes universels caractérisant la faculté humaine de langage et de paramètres dont les valeurs varient dans chaque langue particulière40. Alors que dans la « Théorie Standard », chaque langue particulière possède son propre ensemble de règles dont chacune décrit une construction, l’approche des « Principes et Paramètres » formule des contraintes qui ne sont jamais spécifiques à une langue ou à une construction, mais qui appartiennent à la grammaire universelle. La notion de règle devient inutile41. Dans son ambition, cette approche vise à remplacer toutes les grammaires des langues particulières, qui deviennent inutiles si l’on peut rendre compte de la grammaire de chaque langue par l’interaction des principes universels et par les valeurs prises dans cette langue par les paramètres de la faculté de langage.
92Les principes sont innés ; par conséquent ils sont universels et doivent posséder des corrélats neurophysiologiques, même si ceux-ci restent encore inconnus. Les paramètres définissent des espaces de variation entre les différentes langues humaines. Ils correspondent dans la faculté de langage à ce qui n’est pas totalement déterminé par la grammaire universelle mais varie selon les langues ; ce sont des propriétés pour lesquelles le choix se fait entre des options possibles (les paramètres étant en général binaires, ils définissent deux options possibles). Les options possibles (autrement dit le paramètre) sont fixées par la grammaire universelle. Le choix dépend du milieu linguistique dans lequel l’enfant grandit, ce sont les données linguistiques auxquelles est confronté l’enfant qui déterminent le paramétrage sélectionné.
93Caractérisons un peu plus précisément ces deux aspects de la grammaire universelle, les principes et les paramètres.42
94En ce qui concerne les principes d’abord, l’architecture générale de la faculté de langage est modulaire. Soulignons que la modularité dont il est question ici n’a pas le même sens que la modularité évoquée dans la première section du chapitre, qui renvoie à la domaine-spécificité. Dans le cadre des « Principes et Paramètres », Chomsky applique cette notion à l’organisation de la faculté de langage elle-même (et non plus à son rapport aux autres facultés cognitives) ; elle signifie que la faculté de langage est composée de plusieurs sous-systèmes en interaction.
95La grammaire universelle est ainsi structurée dans ce modèle d’une part en sous-composants : le lexique, la syntaxe, le composant FP (pour forme phonétique), c’est-à-dire l’interprétation phonologique des phrases, et le composant FL (pour forme logique), qui concerne l’interprétation sémantique des phrases, et d’autre part en sous-systèmes, qui correspondent aux principes universels.
96Parmi les sous-composants, pour ce qui est de la syntaxe, on peut noter les changements par rapport aux modèles précédents. Les règles de réécriture sont supprimées et remplacées par une sous-théorie, dite théorie X-barre, qui est une théorie de la combinaison et de la composition des syntagmes. Toutes les transformations se réduisent désormais à une règle de mouvement unique, dite Déplacer α. La « théorie des traces » dit que tout mouvement laisse une trace qui est co-indexée avec son antécédent, c’est-à-dire avec le syntagme déplacé dont la trace occupe l’ancienne place, et formule des contraintes sur la structure qui résulte du mouvement.
97Parmi les sous-systèmes de principes, on trouve la théorie du gouvernement et la théorie du liage, qui donnent parfois leur nom à la nouvelle approche, mais qui font appel en réalité à des notions techniques dont il faut tester empiriquement la validité. On peut en donner une idée en prenant comme exemple la théorie du liage qui définit les relations de co-référence pour les expressions référentielles, les pronoms et les anaphores. Cette théorie définit ainsi « les configurations structurales dans lesquelles ces éléments admettent, requièrent ou excluent un terme de même référence. Ces configurations structurales sont définies grâce à la notion de domaine syntaxique, qui utilise elle-même la notion de c-commande » (Pollock 1997, p. 91). Dans un arbre syntaxique, un nœud est dit c-commander un autre nœud si ce nœud est sa sœur ou le descendant de sa sœur. Soit l’arbre suivant :
98On dira que B c-commande C et tous les éléments dominés par C (en l’occurrence D et E).
99On trouve également la théorie du Cas, qui définit les règles régissant les phénomènes d’accord. La théorie-thêta, quant à elle, concerne les relations dites thématiques, c’est-à-dire les relations entre un prédicat et ses arguments. Chaque item lexical possède en effet une grille thématique, constituée par le nombre de ses arguments et leurs fonctions (ou leurs rôles) thématiques. Par exemple, le verbe « donner » requiert un agent, un objet et un récepteur. À ces rôles correspondent des positions syntaxiques (pour l’agent, ce sera la position sujet, etc.). La théorie-thêta formule ainsi des critères régissant l’interface entre le lexique et la syntaxe.
100Venons-en maintenant plus en détail aux paramètres.
101La notion de paramètre a émergé d’une comparaison entre le français et l’italien, résultat des travaux de Richard Kayne et de Luigi Rizzi (voir Kayne 1984 et Rizzi 1982).43 Bien que paraissant très semblables au premier abord, ces deux langues présentent des différences notables. La première concerne l’ordre sujet-verbe : l’italien autorise le sujet à venir après le verbe, ce qui n’est pas le cas du français. La deuxième différence concerne la référence à un sujet qui a déjà été mentionné dans le contexte. En français, on utilise un pronom en position de sujet. En italien, on peut omettre le sujet. Une troisième différence concerne la formation des questions. Les deux langues possèdent une même règle selon laquelle, lorsque l’expression nominale questionnée est l’objet du verbe, elle est remplacée par un mot interrogatif adéquat et ce mot interrogatif est déplacé en tête de phrase :
(2) a Jean verra quelqu’un dans le parc.
b Qui Jean verra-t-il dans le parc ?
102Cependant, lorsque la question porte sur le sujet d’une proposition subordonnée, les deux langues diffèrent :
(3) a Tu crois que Jean va venir.
b Qui crois-tu qui va venir ?
(*Qui crois-tu que va venir ?)
(4) a Credi che Gianni verrà. b Chi credi che verrà ?
103En français, il faut changer le mot interrogatif « que » en « qui », ce qui n’est pas le cas en italien.
104Il y a au moins trois raisons pour lesquelles Kayne et Rizzi ont considéré que ces différences n’étaient pas dues au hasard. La première raison invoque une comparaison avec d’autres langues romanes, comme l’espagnol ou le roumain. L’espagnol est semblable à l’italien sur les trois points que nous avons mentionnés, bien que l’espagnol soit plus proche du français du point de vue de la linguistique historique. De même le roumain se comporte systématiquement comme l’italien, plutôt que comme le français. Si les trois propriétés n’étaient pas liées, on trouverait toutes sortes de combinaisons de ces propriétés dans les langues romanes, ce qui n’est pas le cas. La deuxième raison relève de la linguistique historique. L’ancien français se comportait comme l’italien moderne pour les trois propriétés concernées. Le fait que les trois propriétés aient changé ensemble et à peu près à la même époque est encore un argument pour dire qu’elles sont liées. Enfin, troisième raison, ces trois propriétés concernent le sujet. Le français requiert que toute proposition avec un verbe conjugué possède un sujet explicite. Ce n’est pas le cas de l’italien ou de l’espagnol. C’est particulièrement notable dans des phrases comme :
(5) Il pleut.
(6) Piove. (italien)
(7) Llueve. (espagnol)
105Cette dernière différence subsume les précédentes. Dans les langues du type « français » (le français, l’anglais, la langue nigériane Edo…), toute proposition contenant un verbe conjugué doit avoir une position sujet remplie, alors que dans les langues du type « italien » (l’italien, l’espagnol, le latin, le japonais, le navajo…), les propositions avec un verbe conjugué n’ont pas besoin d’avoir une position sujet remplie.
106C’est cette comparaison entre l’italien et l’espagnol d’un côté et le français de l’autre qui a conduit Chomsky à proposer la notion de paramètre. Il s’agit ici du paramètre du sujet nul : s’il est positif (comme en italien), alors le sujet du verbe peut être omis ; s’il est négatif (comme en français), alors le sujet du verbe ne peut pas être omis. De la fixation du paramètre découle un ensemble complexe de propriétés (appelé « parametric cluster »), comme on l’a vu dans l’exemple précédent. Chomsky fait l’hypothèse en 1981 que toutes les différences entre les langues sont sur le même modèle paramétrique.
107Cependant, la caractérisation précise des paramètres est sujette à des controverses. Outre le fait que la détermination des principes et des paramètres a évolué depuis le début des années 1980 en fonction des remaniements théoriques qu’a connus la grammaire générative, il ne semble pas y avoir de réel consensus à l’heure actuelle sur la nature des paramètres.44 Un point de discussion consiste à savoir si certains, voire tous les paramètres, ont des valeurs fixées par défaut à la naissance et éventuellement modifiées lors de l’acquisition du langage. La recherche des valeurs par défaut s’est appuyée sur la psycholinguistique. On peut prendre comme exemple les travaux de Hyams (1986) sur les sujets nuls. Il a été rapporté que les enfants anglais d’environ deux ans produisent des phrases avec des sujets nuls du type suivant :
a. want more apples.
b. Yes, is toys in there. (“Yes there are toys in there.”)
108Les enfants n’emploient pas en revanche d’explétifs. Dans des langues comme l’italien ou l’espagnol, les constructions à sujets nuls sont autorisées mais pas en anglais. Hyams explique ces observations en les reliant au paramètre du sujet nul. Elle fait l’hypothèse que la valeur positive du paramètre, celle autorisant les sujets nuls, est la valeur par défaut. Cela expliquerait qu’on trouve des constructions sans sujet chez les enfants anglophones. Son hypothèse reste cependant controversée.
109Un autre point de discussion important porte sur la nature des paramètres : certains linguistes générativistes opposent à ce qu’ils appellent les « macro-paramètres » des « micro-paramètres ». Baker (2001) illustre bien le type de paramètres qui ont été mis au jour le plus fréquemment par les générativistes : il s’agit de « macro-paramètres » qui reposent sur des différences visibles importantes et couvrent un grand nombre de langues de familles différentes. Certains linguistes générativistes se sont cependant montrés très sceptiques à l’égard de tels paramètres. Ainsi, Kayne refuse une telle conception et soutient que tous les paramètres sont des micro-paramètres, tels que la micro-syntaxe, qui étudie des langues ou des dialectes étroitement liés, permet de les découvrir (voir Kayne 2003).45
110Quels que soient les débats qui existent encore, l’approche des « Principes et Paramètres » est apparue féconde parce qu’elle permet de résoudre un certain nombre de tensions qui existaient dans les modèles antérieurs, comme on va le voir.
2. L’inné et l’acquis dans l’approche « P & P »
111Une conséquence notable de l’approche des « Principes et Paramètres » est qu’elle propose une nouvelle conceptualisation des rapports entre l’inné et l’acquis, entre les aspects universaux de la faculté de langage et la diversité des langues acquises par les enfants humains.
112La grammaire universelle doit obéir, nous l’avons vu, à une double contrainte que Chomsky décrit de la manière suivante :
[La grammaire universelle] doit d’une part être compatible avec la diversité des grammaires qui existent (en fait, avec la diversité des grammaires possibles), et, en même temps, être suffisamment contrainte et restrictive dans les choix qu’elle permet pour pouvoir rendre compte du fait que chacune de ces grammaires se développe dans le cerveau sur la base de données empiriques très restreintes. (Chomsky 1981a, trad. p. 20-21)
113Il faut à la fois rendre compte de la diversité des langues naturelles et expliquer l’acquisition du langage, ce qui requiert de faire l’hypothèse de fortes contraintes innées. En d’autres termes, il faut résoudre la tension qui existe entre la recherche de l’adéquation descriptive et celle de l’adéquation explicative, la conception que l’on a de la grammaire universelle devant satisfaire à ces deux exigences. Pollock exprime cette tension sous la forme du paradoxe suivant :
[…] si le lien entre la faculté de langage GU et, disons, le français est si direct, comment se fait-il que GU autorise aussi des langues (internes) aussi dissemblables que le chinois, le finlandais ou le gallois ? (Pollock 1997, p. 205)
114Le cadre P & P propose une solution à ce paradoxe, dans la mesure où il fournit une « théorie extrêmement structurée de GU, basée sur un certain nombre de principes fondamentaux qui restreindraient sévèrement la classe des grammaires que l’on peut acquérir et qui en contraindraient étroitement la forme » (Chomsky 1981a, trad. p. 21), en même temps que des espaces de variation en fonction de l’expérience.
115L’approche « P & P » permet par là au modèle chomskyen de gagner en réalisme. Les principes innés deviennent plus réalistes sur le plan biologique. Il n’est pas sans intérêt de ce point de vue de souligner que Chomsky a été inspiré par les travaux du biologiste François Jacob, décrivant comment de petits changements dans le déroulement temporel et l’arrangement de mécanismes biologiques régulateurs fixes peuvent avoir des conséquences importantes et mener à des résultats substantiellement différents. Comme on l’a vu plus haut au travers de l’évolution de la caractérisation de la grammaire universelle, celle-ci gagne en simplicité : la prolifération des règles pour rendre compte des constructions particulières aux différentes langues laisse la place à un nombre limité de paramètres. Kayne (2000, p. 8) souligne ainsi qu’un petit nombre de paramètres binaires permet de rendre compte d’une grande variabilité ; il remarque qu’il suffit de 33 paramètres pour engendrer cinq millions de grammaires syntaxiquement différentes.
116La fécondité de l’approche paramétrique s’est révélée aussi dans l’extension du modèle à des phénomènes jusque là laissés de côté. C’est ainsi l’histoire qui fait son entrée dans le cadre théorique proposé par Chomsky, par le biais des travaux d’un certain nombre de générativistes qui cherchent à appliquer le modèle des « Principes et Paramètres » à l’histoire des langues. D’une manière générale, l’introduction de l’approche paramétrique a suscité l’enthousiasme parce qu’elle permet de concilier unité et diversité dans l’étude des langues humaines. Elle rend aussi possible la conceptualisation plus précise des rapports entre invariants et variations dans l’étude des langues. Elle a été considérée par certains partisans de Chomsky, comme Baker (2001) et surtout Lightfoot (1991) qui développe cette idée, comme la clé pour comprendre l’histoire des langues, permettant d’expliquer à la fois la variation entre les langues et le fait que cette variation est contrainte dans des limites strictes.46
117Surtout, le modèle des « Principes et Paramètres » permet à la linguistique générative de prendre pleinement en compte la variation historique et culturelle. Longobardi fait partie des linguistes générativistes qui ont voulu tirer toutes les conséquences du nouveau modèle pour le rapport de la linguistique à l’histoire et à la diversité des langues (voir Longobardi 2003). Longobardi introduit ainsi un niveau d’« adéquation historique » qui cherche à répondre à la question de la variété culturelle : pourquoi les langues et les cultures humaines varient-elles comme elles le font ? Comment l’histoire culturelle explique-t-elle ces variations ? C’est une nouvelle question qui s’ajoute aux questions traditionnelles de la linguistique chomskyenne et qui suppose son niveau d’explication propre, et l’approche paramétrique permet d’approcher ces problèmes de manière féconde (voir aussi Gianollo et al. 2008 pour la défense d’une telle approche).
3. Le « Programme minimaliste » et la simplification de la Grammaire universelle
118Dans les années 1990, la grammaire générative a connu une nouvelle évolution avec l’introduction du « Programme minimaliste ». Le « Programme minimaliste » peut être considéré comme un pas de plus fait dans la direction du réalisme psychologique et neurobiologique. Il cherche notamment à concevoir comment la faculté de langage s’insère dans l’esprit et interagit avec d’autres systèmes cognitifs (voir Chomsky 1995a, p. 1). Chomsky ajoute ainsi deux nouvelles questions à celles qui, depuis les années 1960, servent à définir son programme de recherche : comment les propriétés de l’esprit/cerveau qui caractérisent la faculté de langage ont-elles évolué dans l’espèce ? Comment ces propriétés sont-elles réalisées dans des mécanismes cérébraux ? (Chomsky & Lasnik 1995, p. 17). Sans être entièrement nouvelles, ces questions prennent une place centrale avec le minimalisme (voir Chomsky 1980a, p. 214sq).
119Le « Programme minimaliste » ne rompt pas avec le cadre des « Principes et Paramètres ». Tout en conservant le cadre général précédent, il s’agit de prendre comme hypothèse de travail l’idée que le langage a une structure optimale, non pas, comme le souligne Rizzi (2003, p. 132), du point de vue fonctionnel de la communication, mais du point de vue structurel. Cela signifie qu’on peut rendre compte de la structure de la faculté de langage par des notions d’économie et de perfection. Là encore, ce ne sont pas des idées entièrement nouvelles chez Chomsky. On se souvient que, dans les débuts de la grammaire générative, c’est un critère de simplicité qui permet de départager des grammaires descriptivement adéquates. Chomsky (1981a) esquisse déjà les notions d’optimalité et de perfection quand il écrit que, s’il s’avérait que la faculté de langage présente redondance et complexité pour des raisons dues à l’utilité fonctionnelle ou à des accidents de l’évolution, la grammaire universelle ne serait pas une théorie intéressante intellectuellement (Chomsky 1981a, trad. p. 38-39).47
120Le « Programme minimaliste », qui, comme son nom l’indique, est un programme et non une théorie, explore ces idées et cherche à examiner dans quelle mesure les concepts et les principes du modèle précédent sont dérivables de nouveaux outils descriptifs, plus réduits et plus économiques.
121Bien que le cadre général soit conservé, les notions de principe et de paramètre changent.48 On a vu que les linguistes générativistes divergeaient en partie sur la conception des paramètres. Une conception lexicale des paramètres a notamment été développée, initialement formulée par Borer (1984). C’est celle que Chomsky adopte dans le cadre du « Programme minimaliste ». Selon cette conception, les paramètres sont liés aux propriétés de base de certains mots (en termes techniques, ils sont toujours des têtes fonctionnelles du lexique). Cette approche est attrayante d’un point de vue développemental : l’enfant ne peut faire autrement que d’apprendre les mots pour dire les choses, d’apprendre le lexique ; il est très économique de penser qu’en apprenant les mots, il apprend aussi des propriétés syntaxiques du langage qui sont déterminées par des mots ou des groupes de mots. Quant aux principes de la grammaire universelle, ils ne sont plus paramétrés et Chomsky propose qu’ils appartiennent à deux catégories : des conditions d’interface avec le système conceptuel-intentionnel (dit CI) d’une part et avec le système articulatoire-perceptuel (dit AP)49 d’autre part, et des principes d’économie.
122La dérivation des phrases est régie par des principes d’économie. Ainsi, les dérivations ne doivent pas contenir d’étapes inutiles : c’est le principe que Chomsky nomme « Dernier recours » (« Last Resort »). Le mouvement d’un trait n’a lieu que s’il est indispensable, il n’est jamais libre ou optionnel. Alors que dans la théorie du Gouvernement et du Liage, le mouvement a lieu partout et qu’on recherche ce qui le contraint, dans le « Programme minimaliste » au contraire, il faut des conditions pour déclencher le mouvement. Une étape dans une dérivation est légitime seulement si elle est nécessaire pour que la dérivation converge, c’est-à-dire pour qu’elle soit interprétable (voir Chomsky 1995a, p. 200). Deux autres contraintes s’ajoutent pour restreindre encore le mouvement. Tout d’abord, il y a le principe dit d’« Avarice » (« Greed »), selon lequel un trait ne peut bouger que pour satisfaire ses propres conditions. Cela signifie que les traits d’un terme doivent être « vérifiés » et effacés s’ils sont ininterprétables. Ensuite le principe dit « Procrastiner » (« Procrastinate ») consiste à retarder le mouvement le plus tard possible dans la dérivation (voir Marantz 1995, p. 357). Enfin, un Principe de localité ou de distance minimale assure qu’un terme ne se déplace que dans sa cible la plus proche. La notion de proximité est définie en termes de c-commande asymétrique : la cible Y la plus proche pour un terme a (c’est-à-dire la position dans laquelle ce terme peut vérifier ses traits) est celle qui est c-commandée asymétriquement par toutes les autres, et X c-commande asymétriquement Y si et seulement si, d’une part, toutes les catégories qui dominent X dominent Y, et, d’autre part, toutes les catégories qui dominent Y ne dominent pas X (d’après Pollock 1997).
123Ce sont ces différents principes d’économie qui déterminent, selon Chomsky, une forme d’optimalité dans les computations linguistiques. Il s’agit également de réduire autant que possible l’outillage descriptif du linguiste, en éliminant tous les outils qui ne sont pas indispensables pour rendre compte des phénomènes linguistiques (voir Chomsky 1995a). Chomsky tend ainsi vers une conception du langage comme un système « parfait » du point de vue computationnel (voir Chomsky 1995a, p. 1), même s’il ne faut pas oublier que la perfection reste moins une affirmation qu’une heuristique (ibid., p. 9).50
124La perspective minimaliste a d’importantes conséquences sur la conception de l’évolution du langage51, et elle a contribué à mettre cette question sur le devant de la scène, alors qu’elle restait relativement secondaire jusque là pour la linguistique générative52. Nous avons vu plus haut que Longobardi (2003) et Gianollo et al. (2008) ont mis en avant un niveau d’adéquation historique. Pour eux, l’approche paramétrique introduit également un problème d’adéquation évolutionnaire où il faut expliquer pourquoi les langues biologiquement possibles sont telles qu’elles sont, ou encore expliquer la variation des langues humaines. Dans le cadre des « Principes et Paramètres », la variation elle-même est encodée génétiquement, ce qui suppose de nombreux paramètres innés, et donc une conception pas très économique de la grammaire universelle. L’adéquation évolutionnaire voudrait que la minimisation du coût génétique se fasse par la minimisation du nombre de paramètres, réduisant l’espace de variation. De ce point de vue, le « Programme minimaliste » représente un pas vers l’adéquation évolutionnaire.53
125Ainsi, par rapport aux premières caractérisations de la grammaire universelle comme un ensemble de contraintes sur la forme des règles grammaticales, l’approche des « Principes et Paramètres » et le « Programme minimaliste » donnent une dimension plus concrète et plus réaliste au modèle de la faculté de langage proposé par le programme de recherche chomskyen. Les « Principes et Paramètres » fournissent un cadre général pour conceptualiser la notion d’innéité et les relations entre inné et acquis, entre grammaire universelle et expérience linguistique. Le « Programme minimaliste », tout en poursuivant dans cette voie, ouvre également des perspectives de recherche sur l’évolution du langage.
Notes de bas de page
1 Quand on parle de « locuteur », disons d’emblée qu’il faut comprendre « locuteur-auditeur ». Le malentendu a existé, des critiques reprochant à Chomsky de ne pas prendre en compte le point de vue de l’auditeur. Mais le modèle ne fait pas de différence entre la production et la compréhension du langage (Cf. Chomsky 1965, trad. p. 19-20).
2 Cf. Bloomfield (1933), préface. Bloomfield parle souvent de conception « mécaniste », par opposition à une conception « mentaliste », plutôt que de behaviorisme.
3 C’est ce que souligne Seuren (1998, p. 197-198).
4 Voir par exemple Chomsky (1986).
5 Je reviendrai aux chapitres 2 et 4 sur cette idée selon laquelle la performance est un mystère. Comme nous le verrons, elle est liée à l’adoption par Chomsky d’une thèse néo-cartésienne sur la liberté humaine. Il faudrait d’ailleurs nuancer cette idée chomskyenne, dans la mesure où certains aspects de la performance peuvent bien être étudiés scientifiquement (on peut penser par exemple à l’analyse du traitement de ce qu’on appelle en anglais les « garden path sentences », des phrases grammaticalement correctes mais dont l’interprétation par le lecteur a de grandes chances d’être incorrecte).
6 Il faut distinguer grammaticalité et acceptabilité. L’acceptabilité est une notion qui appartient à la performance, au sens où des facteurs externes à la compétence linguistique, comme la mémoire, peuvent conduire à juger des phrases comme inacceptables. La grammaticalité renvoie à la connaissance de sa langue internalisée par tout locuteur natif, qui n’est pas exemplifiée comme telle. Sur ce point, voir Chomsky (1965), trad. p. 23.
7 On peut parler de nouveauté au moins relative, dans le contexte des années 1950 où la psychologie américaine est dominée par le behaviorisme et où la linguistique structuraliste et formaliste américaine refuse globalement le mentalisme. Cependant, comme Chomsky lui-même n’a de cesse de le rappeler, son approche mentaliste reprend des intuitions de penseurs classiques, et des linguistes du 20e siècle, comme Pike, ont aussi défendu une vision réaliste, et donc mentaliste, de la linguistique.
8 Voir Gardner (1985).
9 Cf. Andler (1992/2004).
10 Ce point est mis en évidence par Égré (2011).
11 Dans Current Issues in Linguistic Theory, Chomsky introduit une distinction entre la « créativité gouvernée par les règles » et la « créativité qui change les règles ». La seconde se situe du côté de la performance et renvoie aux changements lexicaux, syntaxiques, phonologiques, introduits par les locuteurs dans leur usage quotidien de la langue. La première est fondamentale pour Chomsky ; elle relève, ainsi que nous l’avons vu, de la compétence du locuteur, de sa maîtrise de la langue, qui lui permet de comprendre et de produire un nombre indéfini de phrases.
12 Notons que Chomsky distingue la capacité générative faible d’une grammaire (le fait qu’elle engendre toutes et seulement les phrases bien formées de la langue considérée, indépendamment de la structure sous-jacente qu’elle assigne à celles-ci) et la capacité générative forte (qui prend en compte la structure assignée aux produits engendrés par la grammaire). Pour reprendre le résumé qu’il donne de cette distinction dans Aspects de la théorie syntaxique, « une grammaire engendre au sens faible un ensemble de phrases et engendre au sens fort un ensemble de descriptions structurales » (Chomsky 1965, trad. p. 86). C’est la capacité générative au sens fort qui intéresse le linguiste, dans la mesure où il cherche à rendre compte des propriétés structurales des langues.
13 Pour tout le passage qui suit, je m’inspire de Seuren (1998).
14 Cette notion renvoie à la théorie des automates en informatique, où un automate est un objet mathématique permettant de modéliser un système. En l’occurrence, Chomsky utilise la notion d’automate pour modéliser les types de grammaires possibles.
15 On pourrait également le rapprocher, comme le fait Egré (2011), d’un modèle inspiré par Saussure. Égré rappelle que Saussure maintient le principe du « caractère linéaire du signifiant » (Saussure 1916, p. 103), et il montre que le genre d’automates à états finis présenté dans Syntactic Structures peut correspondre aux combinaisons et substitutions le long des axes syntagmatique et paradigmatique définis par Saussure.
16 Là encore, je renvoie à Égré (2011) pour une explication plus détaillée de ce point, notamment sur le fait que l’argument de Chomsky dans Structures syntaxiques est un argument simplifié, et sur les conditions d’une démonstration rigoureuse de son argument.
17 Il faut lire : P=phrase, SN=syntagme nominal, SV=syntagme verbal, Art=article, N=nom, V=verbe.
18 C’est ce que souligne Seuren dans son histoire de la linguistique occidentale par ailleurs souvent critique par rapport à l’œuvre de Chomsky (voir Seuren 1998, p. 250).
19 Cette thèse a suscité de vives controverses, y compris au sein de la linguistique générative elle-même. Dans les années 1960 et 1970, un certain nombre de linguistes générativistes, comme Postal, Ross ou Lakoff, ont ainsi récusé l’idée de l’autonomie de la syntaxe et donné naissance à ce qu’on a appelé la Sémantique générative. Sur ce point, voir Harris (1993).
20 L’astérisque est une convention utilisée pour marquer une phrase comme non grammaticale.
21 Cf. Putnam (1967).
22 Chomsky (1964) parle de trois niveaux, ajoutant aux deux niveaux d’adéquation mentionnés ici un niveau plus élémentaire d’« adéquation observationnelle », qui consiste à présenter correctement les données linguistiques observées.
23 Outre l’ambiguïté, évoquée ici, entre la grammaire particulière d’une langue et la grammaire universelle, le mot « grammaire » donne lieu à une autre ambiguïté entre la grammaire comme compétence du locuteur et la grammaire comme théorie scientifique de la compétence élaborée par le linguiste. Je reviendrai sur cette deuxième ambiguïté au chapitre 2.
24 Je laisse ici de côté la question de savoir si cette généalogie est fidèle aux penseurs classiques. Pour un point de vue critique, voir par exemple Fortis (2009), p. 3, et les références qu’il donne.
25 Je reviendrai sur la question des niveaux de description, neurologique, cognitif, et linguistique dans le cas du langage au deuxième chapitre.
26 Je traduis littéralement l’expression « domain-specificity » ainsi que la notion opposée de « domain-generality ». Même si la traduction de « domain-specificity » par « domanialité », proposée par Daniel Andler, est certainement meilleure, par souci de clarté, j’aurai recours à la traduction littérale afin de préserver la symétrie et l’opposition des deux expressions, qui est au cœur de la discussion sur l’acquisition du langage.
27 J’examinerai au chapitre 2 ce qu’il faut entendre par connaissance dans ce cas.
28 On peut en trouver les origines dans le champ de la neuropsychologie, où elle est l’héritière d’une tradition qui remonte à la seconde moitié du 19e siècle, notamment aux travaux de Gall et de Broca. Elle est liée à l’étude des lésions cérébrales et concerne donc, plus précisément, la neuropathologie. Les dissociations observées entre deux compétences à l’occasion de lésions affectant l’une et non l’autre fournissent des indices de modularité (et inversement), c’est-à-dire de l’existence d’aires cérébrales dédiées à des compétences différentes et responsables de tâches précises. Dans cette tradition, la notion de modularité est associée à la localisation cérébrale des facultés.
29 Supra, p. 33.
30 Exemple tiré d’Egré (2011).
31 En réalité, Chomsky mentionne très peu les travaux de Greenberg, et c’est pour dire que ce qu’il a en vue est très différent, sans s’expliquer nécessairement sur cette différence (voir Chomsky 1965, trad. p. 164). Comme le souligne Égré (2011), la relation précise entre universaux chomskyens et universaux typologiques reste à éclaircir. Il ne s’agit ici que de faire ressortir certaines propriétés des uns et des autres, et quelques-unes de leurs conséquences.
32 Smith (1994) met cependant en doute le fait que toutes les langues respectent cet universel implicationnel.
33 Les générativistes sont partagés sur la façon de situer le programme chomskyen par rapport à la typologie et sur l’apport de la méthode comparative à la découverte d’universaux formels de la grammaire. En effet, les universaux formels de la grammaire universelle ne correspondent pas directement aux universaux typologiques qui sont, au mieux, des indices indirects des premiers. Baker (2001) considère qu’on peut réduire certaines régularités typologiques à des contraintes formelles de la grammaire universelle qui les expliquent. Cependant, d’autres, comme Smith (1994), sont sceptiques sur l’intérêt des universaux typologiques pour établir les principes de la grammaire universelle. Pour Smith, même si ces universaux étaient bien établis, l’essentiel reste de les expliquer et l’existence de tels universaux ne tranche pas la question en faveur d’explications innéistes, puisque d’autres types d’explications, pragmatique, fonctionnaliste, sont disponibles. Newmeyer (2005) par exemple, tout en s’inscrivant dans le cadre du générativisme, pense qu’il faut recourir à des contraintes fonctionnelles pour expliquer les régularités typologiques. Je reviendrai sur cette question quand je traiterai plus précisément du contenu du modèle chomskyen, dans la deuxième section. En effet, on considère souvent que Chomsky a intégré depuis les années 1980 la diversité linguistique et l’approche typologique à son propre cadre théorique.
34 Voir Rizzi (1994), notamment p. 405, sur ce point, qui souligne l’inconvénient méthodologique qu’il peut y avoir, pour les générativistes, à avoir recours à la méthode comparative, si les données sur lesquelles elle s’appuie ne sont pas suffisamment bien analysées et comprises d’un point de vue grammatical.
35 Pour des objections à cette explication dans un esprit formaliste, voir Egré (2011).
36 Voir Hacken (2007) pour une discussion approfondie de ce point.
37 On pourra se référer notamment à Ruwet (1967), Newmeyer (1996), Pollock (1997) et Freidin (2006) pour quatre présentations de la grammaire générative très différentes dans leur perspective et leur méthode respectives.
38 On retrouve le même genre d’ambiguïté syntaxique dans des expressions françaises comme « l’amour de ma mère ».
39 Dans Structures syntaxiques, Chomsky parle de « phrases-noyaux » et non encore de structure profonde pour désigner la base sur laquelle opèrent les transformations.
40 Chomsky illustre cette approche par l’image d’un réseau relié à un boîtier de commande avec des commutateurs ; le réseau correspond au système des principes de la grammaire universelle et les commutateurs aux paramètres dont la fixation dépend de l’expérience (voir Chomsky 1988, p. 62-63 et 2000a, p. 8).
41 Il faut noter cependant que tous les linguistes générativistes n’adoptent pas l’approche paramétrique. Certains continuent de défendre une approche par les règles, comme Newmeyer (2004). Dans une perspective différente, Prince & Smolensky (1993/2004) refusent aussi l’approche paramétrique et proposent une théorie alternative, la théorie de l’optimalité. Selon la théorie de l’optimalité, toutes les langues possèdent les mêmes règles universelles ; autrement dit, il y a un ensemble de règles universelles qui sont toutes opérantes dans toutes les langues. Cependant, toutes les langues n’assignent pas la même priorité à toutes les règles : si toutes s’appliquent dans les différentes langues, elles n’y ont pas la même importance. La priorité de telle règle sur telle autre selon les langues permet de rendre compte du même type de variations dont rendent compte les paramètres dans le modèle chomskyen. Cette théorie, inspirée par le connexionnisme, a eu des succès en phonologie et certains chercheurs l’utilisent dans le domaine de la syntaxe.
42 Pour cette présentation de la grammaire universelle dans le cadre des « Principes et Paramètres », je suis Pollock (1997).
43 Pour ce passage, voir la présentation de Baker (2001) que je suis partiellement ici.
44 On peut se référer à Haspelmath (2008). Dans cet article, Haspelmath fait une revue intéressante de tous les paramètres cités dans seize ouvrages de référence en grammaire générative. Il n’en trouve que sept qui semblent faire l’objet d’un accord plus ou moins général (ces sept paramètres n’apparaissent pas tous dans tous les ouvrages). Ce relevé est intéressant parce qu’il permet de dégager quels sont les paramètres les plus classiques en un sens, tout en relativisant le consensus qu’il peut y avoir à leur sujet.
45 Voir aussi Gianollo et al. (2008) et Longobardi (2003) qui insistent sur la dimension méthodologique du débat sur la « taille » des paramètres : la méthode qu’ils proposent et qui utilisent les micro-paramètres leur paraît la meilleure pour étudier la grammaire universelle.
46 Il faudrait préciser que les paramètres sont nécessaires dans la mesure où ils expliquent des variations qui ne sont pas expliquées par l’histoire. Dans le cas contraire, une explication mixte, mêlant l’approche paramétrique et l’approche historique, ne saurait être satisfaisante : si les différences paramétriques recoupent les grandes familles de langues et si les paramètres sont expliqués par l’histoire, il paraît plus économique de les éliminer. Avant d’accréditer l’approche paramétrique, il importe de vérifier si d’autres explications à la fois des similarités entre les langues et du fait que la variation est limitée sont possibles. Comme nous l’avons vu, l’existence d’universaux peut avoir au moins deux autres explications que l’existence de principes universels paramétrés : l’origine unique du langage peut en être une, bien que les linguistes semblent s’accorder à penser qu’elle n’est pas très puissante, et l’existence de contraintes universelles ne relevant pas spécifiquement de la faculté de langage peut en être une autre.
47 Il faut distinguer cependant entre minimalisme méthodologique (élégance théorique) et minimalisme substantiel (voir Chomsky 2002, p. 154-158).
48 Pour une présentation détaillée du minimalisme, voir Pollock (1997), sur lequel je m’appuie ici.
49 Chomsky (1995a) souligne cependant que l’idée selon laquelle articulation et perception constituent une seule interface est une hypothèse de travail discutable et incorrecte sur certains points fondamentaux.
50 Malgré tout, cette notion de perfection reste un des aspects les plus controversés du Programme minimaliste. Voir par exemple Lappin et al. (2000).
51 J’y reviendrai au chapitre 5.
52 En tout cas, elle apparaissait difficilement abordable étant donné les connaissances scientifiques disponibles.
53 Gianollo et al. (2008) proposent une étude plus détaillée de cette contrainte, qui aboutit à dégager des schèmes paramétriques, dont ils ont montré que de nombreux paramètres reprenaient la forme. Si cette approche est correcte, ils en soulignent les conséquences pour la conception de la grammaire universelle : il ne serait plus nécessaire de supposer que l’état initial de la faculté de langage comprend des paramètres très spécifiques, mais il pourrait seulement contenir un ensemble très restreint de schèmes paramétriques, qui permettraient, avec les données linguistiques primaires et les éléments du lexique, de produire les paramètres et leurs valeurs.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Géométrie pratique
Géomètres, ingénieurs et architectes. XVIe–XVIIIe siècle
Dominique Raynaud (dir.)
2015
Science, philosophie, société
4e congrès de la Société de Philosophie des Sciences
Alexandre Guay et Stéphanie Ruphy (dir.)
2017
Le langage est-il inné ?
Une approche philosophique de la théorie de Chomsky sur le langage
Delphine Blitman
2015
Les mathématiques comme habitude de pensée
Les idées scientifiques de Pavel Florenski
Renato Betti Laurent Mazliak (trad.)
2022
Analogies végétales dans la connaissance de la vie de l’Antiquité à l’Âge classique
Sarah Carvallo et Arnaud Macé
2023
Le schème et le diagramme
Les ancrages matériels de la pensée et le partage visuel des connaissances
Fabien Ferri, Arnaud Macé et Stefan Neuwirth (dir.)
2024