La notion de modèle suppose-t-elle une conception réaliste de la vérité mathématique ?
p. 171-192
Texte intégral
1La notion de modèle a une réputation sulfureuse auprès de plusieurs écoles logiques et philosophiques, car elle repose, selon ses détracteurs, sur une conception réaliste de la vérité, conception que ces différentes écoles, par delà leurs différences, s’accordent à rejeter. Je voudrais, dans cet exposé, discuter la pertinence de ce lien entre la notion de modèle et la conception réaliste de la vérité.
1. Les conditions de vérité d’un énoncé
1. 1 Une question obsolète ?
2L’idée que la logique ait pour but de définir les conditions de vérité d’un énoncé mathématique est devenue bien vieillotte. On pense volontiers aujourd’hui que la logique ne peut pas être le premier chapitre des mathématiques, en particulier parce qu’elle utilise des outils, parfois pointus, issus d’autres théories, notamment de l’algèbre. D’ailleurs la quête de ce mythique premier chapitre des mathématiques serait nécessairement vaine et ne serait qu’un résidu de deux siècles de réductionnisme.
3Je ne m’opposerai pas fortement à ces idées, mais je tenterai néanmoins de les modérer. Que la logique ne se limite pas à définir les conditions de vérité d’un énoncé, que ses développements récents l’aient amenée dans de nombreuses autres contrées me semble tout à fait exact. En revanche, il me paraît excessif de dire que la logique n’a pas, entre autres buts, celui de définir les conditions de vérité d’un énoncé. Il me semble, en particulier, que beaucoup d’étudiants qui s’orientent vers la logique, le font parce que cette question des fondements s’est préalablement posée à eux. En effet, quand on fait des mathématiques même élémentaires, on est confronté, par exemple, à l’invocation de l’axiome du choix dans la démonstration du théorème de la base incomplète ou de l’existence de parties non mesurables de la droite réelle. S’il y a un axiome du choix, il doit bien y avoir d’autres axiomes, et il est naturel de se demander ce qu’ils sont. De même, quand on apprend, en géométrie, que l’on peut abandonner l’axiome des parallèles et poser des axiomes alternatifs, on ne peut manquer de se demander quelle part de la géométrie est conservée et quelle part est affectée par cette substitution, par exemple si le théorème de la somme des angles d’un triangle reste vrai dans les géométries non euclidiennes ou si sa démonstration utilise l’axiome des parallèles. Quand on apprend, en analyse, à se méfier des propositions faussement évidentes, on en vient à se demander comment on démontre que deux et deux font quatre, c’est-à-dire comment on construit les entiers naturels, comment on définit l’addition, si le principe de récurrence est un axiome ou si on peut le démontrer et si oui à partir de quoi...
4En informatique, cette question des conditions de vérité d’un énoncé se pose à nouveau quand on veut écrire des programmes de traitement de démonstrations mathématiques, qu’il s’agisse de programmes de vérification, de transformation ou de recherche de démonstrations. Et si ce n’est pas le rôle de la logique de répondre à ces questions, de quelle théorie est-ce le rôle ?
5Naturellement, je partage le point de vue selon lequel il faut un jour dépasser ces questions, et qu’il est plus intéressant, par exemple, d’étudier les propriétés du raisonnement que de décrire minutieusement ses règles l’une après l’autre. Cependant, je ne crois pas que l’on puisse faire l’économie de cette première étape et étudier les propriétés d’une chose que l’on n’aurait pas préalablement définie. Quand on ne cherche pas à évacuer cette question des conditions de vérité d’un énoncé, mais que l’on cherche à y répondre, on trouve des réponses que l’on peut grossièrement classer en deux catégories : celles qui fondent la notion de vérité sur la notion de correspondance et celles qui la fondent sur celle de démontrabilité.
1.2 La vérité-correspondance
6La notion de correspondance repose initialement sur l’idée que les mots sont des reflets des choses. Le mot « Lune », par exemple, est un reflet de la Lune, comme l’est son reflet dans l’eau d’un lac. Les symboles de prédicats, quant à eux, reflètent des ensembles de choses. Et ce qui rend vrai ou faux un énoncé formé d’un nom propre et d’un symbole de prédicat, par exemple l’énoncé « La Lune est sphérique » est le fait que l’objet reflété par le nom propre appartient ou non à l’ensemble reflété par le symbole de prédicat. Cette définition des conditions de vérité d’un énoncé peut naturellement s’étendre à des langages plus riches avec des prédicats à plusieurs arguments, des symboles de fonction, des connecteurs et des quantificateurs.
7Le premier problème que pose cette définition des conditions de vérité est qu’elle suppose l’existence de choses reflétées par les mots. S’il semble peu hardi de supposer l’existence d’un objet reflété par le mot « Lune », il est déjà un peu plus problématique de supposer l’existence d’un ensemble reflété par le mot « sphérique ». Supposer l’existence de la planète B 612 ou du Petit Prince pose encore plus de problèmes, car tout le monde sait qu’ils n’existent pas. Cette notion de vérité-correspondance ne semble donc pas appropriée pour définir les conditions de vérité de l’énoncé « Le Petit Prince vient de la planète B 612 ». Malheureusement, si tout le monde s’accorde à peu près pour dire que la Lune existe et que la planète B 612 n’existe pas, les objets sur l’existence desquels il semble le plus difficile de s’accorder sont les objets mathématiques. Le nombre π existe-t-il ? Et l’ensemble des nombres transcendants ? Et la notion de vérité-correspondance permet-elle de définir les conditions de vérité de l’énoncé « Le nombre π est transcendant » ?
8Je ne vais naturellement pas tenter de résoudre ici ce problème de l’existence des objets mathématiques. Je veux juste dire que la seule manière de tenter de le résoudre me semble être d’essayer de s’accorder sur une définition de cette notion d’existence, afin que la solution du problème découle de cette définition. Sans une telle définition commune, toutes les querelles sur cette question resteront d’éternels dialogues de sourds.
9Une autre raison pour ne pas tenter de résoudre ce problème de l’existence des objets mathématiques est qu’il me semble ne pas être le seul posé par cette notion de vérité-correspondance. Même en supposant l’existence, hors de la caverne, du nombre π et de l’ensemble des nombres transcendants, cette définition des conditions de vérité d’un énoncé ne nous donne aucun moyen de déterminer la valeur de vérité de l’énoncé « Le nombre π est transcendant ». Nous avons, en effet, des sens qui nous permettent d’observer la Lune, nous avons des moyens de transport qui nous permettent d’en faire le tour, nous avons donc des moyens d’interagir assez directement avec cet objet, ce qui nous permet de déterminer la valeur de vérité d’au moins quelques énoncés dans lesquels le mot « Lune » a une occurrence, même si ce n’est pas le cas de tous. Quand nous n’avons pas les moyens d’interagir directement avec un objet de la Réalité, nous avons parfois des moyens d’interagir indirectement avec lui. Ainsi, même si nous ne pouvons pas voir d’animaux préhistoriques, nous pouvons parfois voir leur fossiles, même si nous ne pouvons pas voir les ondes que sont les électrons, nous pouvons voir leurs franges d’interférences, qui nous renseignent indirectement, souvent d’une manière négative, sur les animaux préhistoriques et les électrons.
10En revanche, même s’ils existent, on ne voit pas par quel moyen on pourrait interagir avec les objets mathématiques. Si on exclut l’expérience mystique, la seule chose qui pourrait ressembler à un sixième sens qui nous permettrait de percevoir les objets mathématiques est l’intuition. Mais l’intuition ne semble pas nous permettre de percevoir si le nombre π est algébrique ou transcendant. De plus, si on identifie l’intuition à une perception, on ne comprend plus pourquoi il est nécessaire de démontrer les énoncés dont nous avons perçu la vérité par l’intuition, comme, par exemple, la continuité de la fonction sinus dont nous avons, tous peut-être, l’intuition géométrique.
11Si on accepte cette définition des conditions de vérité d’un énoncé, le seul moyen de justifier le fait que l’on démontre la transcendance de π est de supposer que l’on n’a pas accès à ces objets par la perception directe, mais que, comme les électrons, on y a accès indirectement, c’est-à-dire que l’on peut déduire la transcendance de π d’énoncés dont on perçoit directement la vérité : les axiomes des mathématiques. Ainsi les axiomes deviennent l’équivalent des énoncés d’observation, puisque leur vérité nous vient de l’interaction avec les objets mêmes.
12Les démonstrations trouvent ainsi leur rôle dans cette conception de la vérité : ce sont des outils qui permettent d’accéder à la vérité de certains énoncés que nous ne percevons pas directement par l’intuition. Et contrairement aux autres sciences, où les énoncés d’observation sont des énoncés particuliers (car s’il est possible de voir que tel mouton est blanc, il est impossible de voir que tous les moutons sont blancs), les énoncés d’observation sont, en mathématiques, des énoncés généraux. C’est pour cela que l’on peut atteindre en mathématiques une forme de certitude inatteignable dans les autres sciences, où, parce que les énoncés d’observation sont des énoncés particuliers, on est réduit à poser des conjectures, toujours à la merci d’une réfutation par une nouvelle observation.
13Ainsi, en suivant cette conception, les mathématiques sont-elles une sorte de science de la Réalité, qui parle d’une Réalité hors du monde : la « Réalité mathématique » que nous percevons partiellement par l’intuition et où les énoncés d’observation sont des énoncés généraux. Le raisonnement permet d’accéder indirectement à la vérité de certaines des propriétés de ces objets. Cependant, une partie de cette vérité nous restera hélas cachée à jamais, comme le montrent les théorèmes d’incomplétude, qui s’interprètent alors comme l’existence de choses vraies mais indémontrables. Par exemple, sauf si nous pouvions soudainement le percevoir par l’intuition ou le déduire de nouveaux axiomes dont nous percevrions la vérité par l’intuition, nous ne saurons sans doute jamais si l’hypothèse du continu est vraie ou fausse, dans la Réalité.
1.3 La vérité-démontrabilité
14A l’opposé de cette vérité-correspondance, la conception de la vérité comme démontrabilité ne demande pas de supposer l’existence des objets mathématiques, ni, d’ailleurs, leur inexistence, cette hypothèse n’étant simplement pas nécessaire. Cette définition des conditions de vérité d’un énoncé consiste simplement à poser qu’un énoncé est vrai s’il est démontrable. Dans cette conception, les axiomes apparaissent comme des définitions implicites ou déguisées des symboles du langage puisqu’ils en déterminent la signification, c’est-à-dire les conditions de vérité des énoncés dans lesquels ces symboles ont une occurrence. Les théorèmes d’incomplétude s’interprètent comme le fait qu’il y a des énoncés qui ne sont pas vrais et leur négation non plus. L’hypothèse du continu, par exemple, n’a pas de valeur de vérité dans la théorie des ensembles, mais elle peut en avoir dans certaines de ses extensions − naturellement dans des extensions où on poserait cet énoncé, ou sa négation, en axiome, mais aussi dans un certain nombre de théories plus intéressantes.
15Cela signifie que les théorèmes mathématiques sont analytiques ou tautologiques, c’est-à-dire qu’ils sont des conséquences logiques des axiomes. Cela ne signifie cependant pas qu’ils sont évidents car le théorème d’indécidabilité montre que « analytique » ne signifie pas « évident », contrairement à ce que l’on semblait penser à l’époque de Kant. Cela ne signifie pas non plus qu’un mathématicien a le choix de rendre le nombre π algébrique ou transcendant selon son bon vouloir, comme un auteur de fiction peut, au contraire du biographe, choisir la couleur de l’écharpe du Petit Prince ; cependant les contraintes sur la vérité des énoncés ne viennent pas de la résistance que l’existence conférerait aux objets mathématiques, mais des axiomes et des règles de déduction qui en sont des définitions implicites. Cela ne signifie pas non plus que les symboles mathématiques sont vides de sens, puisque le sens de ces symboles est défini par les axiomes et les règles de déduction. Cela ne signifie pas non plus que les mathématiques sont sans rapport avec la Réalité, puisque les axiomes peuvent être choisis de manière à modéliser et abstraire certains concepts issus de la Réalité.
1.4 La Réalité mathématique modèle des mathématiques
16Cette différence entre vérité-démontrabilité et vérité-correspondance fait écho à la différence entre les jugements de la forme Γ ⊢ P et M ⊨ P en logique des prédicats. Bien entendu, la définition des conditions de vérité d’un énoncé du langage mathématique, à la différence d’autres définitions en logique, ne peut pas se faire dans le langage mathématique lui-même, ce qui serait circulaire. Cette définition doit se faire dans un sous-ensemble restreint du langage mathématique, dans lequel les conditions de vérité d’un énoncé sont peu problématiques. La définition de la vérité-démontrabilité se fait dans un tel sous-ensemble restreint, puisque les énoncés et les démonstrations sont des objets finis et la relation « être une démonstration de » est définie par un algorithme très simple. La définition des jugements de la forme Γ ⊢ P formalise exactement l’idée de vérité-démontrabilité dans ce sous-ensemble des mathématiques.
17La relation entre la vérité-correspondance et les jugements de la forme M ⊨ P est moins évidente, car la définition de la vérité-correspondance invoque la Réalité mathématique, mais pas celle des jugements de la forme M ⊨ P. Pour mettre cette relation en évidence, on peut commencer par remarquer que, même si c’est peu habituel, il est possible d’appliquer une fonction mathématique à un objet de la Réalité. On peut par exemple définir la notion de parité d’une permutation puis s’interroger pour savoir si une permutation de trois cartes à jouer − qui sont des objets de la Réalité − est paire ou non. Ensuite, on peut définir un jugement. ⊨ P paramétré par un modèle, pour pouvoir l’appliquer à divers modèles. Encore une fois, cette définition elle même utilise une partie très réduite du langage mathématique : les énoncés sont des objets finis et la définition de la validité n’utilise que la quantification sur les éléments du modèle − si le modèle est fini, par exemple, aucun objet infini n’est invoqué dans cette définition. La valeur de vérité de l’énoncé P du langage mathématique s’obtient, selon la conception de la vérité-correspondance, en appliquant ce jugement paramétré à la Réalité mathématique elle-même. Ainsi, en suivant la définition du jugement. ⊨ P, le symbole « π » dénote un objet de la Réalité, le symbole « transcendant » un ensemble d’objets de la Réalité et l’énoncé « π est transcendant » est vrai car l’objet dénoté par le symbole « π » appartient à l’ensemble dénoté par le symbole « transcendant ». Pour appliquer le jugement paramétré « . ⊨ π est transcendant » à la Réalité mathématique, la seule chose qu’il soit nécessaire de savoir est si l’objet dénoté par le symbole « π » appartient ou non à l’ensemble dénoté par le symbole « transcendant », mais c’est justement ce que la notion de vérité correspondance demande de savoir.
18Il est important de noter que l’application du jugement. ⊨ P à la Réalité mathématique est très différente de l’application de ce jugement à un objet mathématique comme la structure Vα où α est un cardinal inaccessible. En effet, définir cette structure demande de se placer dans le langage mathématique et l’énoncé Vα ⊨ P est alors un énoncé de ce langage. Dire que l’énoncé P est vrai s’il est valide dans Vα demande d’avoir déjà défini les conditions de vérité de l’énoncé Vα ⊨ P et définir ainsi les conditions de vérité d’un énoncé du langage mathématique est circulaire.
19Maintenant que ce lien entre la notion de vérité-correspondance et la notion de modèle est mis en évidence, on comprend pourquoi ceux qui refusent l’hypothèse de l’existence des objets mathématiques, ou qui préfèrent ne pas invoquer ces objets pour définir les conditions de vérité d’un énoncé du langage mathématique sont tentés de rejeter la notion de modèle. Après tout, que nous apprend la notion de vérité-correspondance et son avatar, la notion de modèle, sinon qu’un énoncé est vrai quand il est réellement vrai ?
2. Chassez les modèles…
20Bien entendu, dès que l’on est convaincu qu’une notion est inutile, il faut résister à la tentation de l’utiliser, et comme avec toute forme de tentation, cela est parfois difficile.
2.1 Munir tous les ensembles d’une structure de groupe
21La première fois que la tentation s’est présentée à moi, je cherchais à résoudre un exercice d’algèbre élémentaire : si on se donne un ensemble E quelconque, peut-on toujours le munir d’une loi de groupe ? Laissons de côté le cas dans lequel E est l’ensemble vide, qu’on ne peut, bien entendu, pas munir d’une loi de groupe. En revanche, la question est assez facile pour tous les autres ensembles finis : il suffit de mettre E en bijection avec le groupe Z/nZ, où n est le cardinal de E, et de transporter la structure de ce groupe sur E. En fait, cet argument montre que la question se ramène à celle de l’existence de groupes de toutes les cardinalités non nulles, et même de toutes les cardinalités infinies, puisque le cas des ensembles finis est résolu. Une fois la question posée ainsi, il est clair que le théorème de Lowenheim-Skolem donne immédiatement la réponse : la théorie axiomatique des groupes a un modèle infini, elle a donc des modèles de toutes les cardinalités infinies.
22Peut-on résoudre cette question sans faire appel à la notion de modèle ? Bizarrement, la question est plus simple pour les espaces vectoriels que pour les groupes : si E est un ensemble infini, les combinaisons linéaires finies à coefficients rationnels d’éléments de E − c’est-à-dire les fonctions finies de E dans le corps des rationnels − forment un espace vectoriel sur le corps des rationnels, et cet espace vectoriel a même cardinal que E. Et comme les espaces vectoriels sont des groupes, on peut en déduire le résultat pour les groupes.
23En regardant mieux, la même construction fonctionne aussi directement pour les groupes : le groupe libre engendré par E a, lui aussi, le même cardinal que E. Mais qu’est-ce que le groupe libre engendré par E, sinon un quotient d’un ensemble de termes où les éléments de E sont pris comme symboles d’individus ? Cette construction reproduit exactement la démonstration du théorème de Lowenheim-Skolem. La similitude avec la construction de Lowenheim-Skolem est simplement moins apparente dans le cas des espaces vectoriels, car la notion d’espace vectoriel libre engendré par un ensemble − c’est-à-dire dont cet ensemble est une base − est plus simple du fait de la commutativité de l’addition : au lieu de parler de termes, on parle de combinaisons linéaires finies, mais au fond, une combinaison linéaire finie est-elle très différente d’un terme ou d’un mot ? Quoi qu’il en soit, le groupe des fonctions finies de E dans le groupe des entiers, qui a même cardinal que E, auquel on aboutit finalement, se présente simplement sans invoquer la notion de modèle, et ses connotations réalistes.
24Cependant, la notion de modèle ne nous laisse pas en paix très longtemps, car on se pose assez vite une question similaire pour les anneaux, les corps, les corps totalement ordonnés, les corps totalement ordonnés archimédiens et complets... Le résultat s’étend aux anneaux, aux corps, aux corps totalement ordonnés, mais pas aux corps totalement ordonnés archimédiens et complets, qui sont tous isomorphes à la droite réelle et qui ont, de ce fait, la puissance du continu. Le théorème de Lowenheim-Skolem ne s’applique, en effet, qu’aux structures algébriques définissables par une théorie du premier ordre, et l’axiome de complétude utilise une quantification sur les parties de la structure. Pas moyen d’y échapper : il n’y a pas de formulation purement algébrique du théorème de Lowenheim-Skolem, car on ne peut pas faire, dans ce théorème, l’économie d’une hypothèse sur le langage dans lequel on définit la structure en question.
2.2 La théorie de la démonstration sans modèles
25Après cet incident, la notion de modèle n’a cessé de me poursuivre. Non seulement quand je m’intéressais, de manière occasionnelle, à des problèmes d’algèbre élémentaire comme celui-ci, mais aussi dans mon travail en théorie de la démonstration. Après avoir appris les règles de la déduction naturelle et les axiomes de la théorie des ensembles qui répondaient, pour l’essentiel, à mes questions premières sur les fondements des mathématiques, à savoir ce qu’était une démonstration formelle, comment on construisait les entiers naturels, comment on démontrait le principe de récurrence... je me suis tourné vers d’autres questions, et j’ai tenté de comprendre des travaux de théorie de la démonstration, c’est-à-dire des travaux qui étudiaient, comme des objets, les formalismes que l’étape précédente avait consisté à décrire et à définir.
26En théorie de la démonstration également, il est souvent possible d’éviter la notion de modèle. Par exemple, pour montrer qu’un énoncé atomique n’est pas démontrable dans la théorie vide, on peut construire un contre-modèle, mais ce n’est pas indispensable : il suffit de remarquer que le séquent formé de la théorie vide et de cet énoncé n’a pas de démonstration dans le calcul des séquents sans coupures, car aucune règle ne s’applique, puis d’étendre ce résultat au calcul des séquents en entier en utilisant le théorème d’élimination des coupures. Cette démonstration consiste, en fait, à montrer l’indépendance de cet énoncé en montrant qu’un programme de recherche de démonstrations dans le calcul des séquents sans coupures échoue sur cet énoncé après avoir exploré tout l’espace de recherche, et bien entendu, pour l’informaticien que je suis, faire échouer des systèmes de recherche de démonstrations est tout aussi important que démontrer des résultats d’indépendance. On utilise, bien entendu, dans cette démonstration un argument qui intervient également dans certaines démonstrations du théorème de complétude, dans lesquelles on construit un contre-modèle à partir d’une trace de l’échec de la recherche d’une démonstration ; mais ce qui est important ici est que l’on formule cet argument sans invoquer la notion de modèle.
27On reconnaîtra dans cet exemple très simple un programme proposé par J.-Y. Girard visant à placer le théorème d’élimination des coupures au centre de la théorie de la démonstration et à en déduire de nombreux autres résultats comme de simples corollaires. En démonstration automatique, où l’élimination des coupures permet de réduire l’espace de recherche, un programme analogue a été développé par R. Smullyan, P. Andrews, G. Huet...
28Pour revenir aux démonstrations d’indépendance, une autre démarche, visant un but similaire, a été suggérée par P. Martin-Löf : remplacer la construction de modèles par l’utilisation de traductions. Dans une construction de modèle, en effet, on n’attribue jamais directement un objet mathématique à chaque terme du langage, puisque l’on ne peut désigner un tel objet que par une expression d’un langage. Puisque l’on associe un terme d’un langage à un terme d’un autre, il vaut mieux parler de traduction. Il y a donc une manière de démontrer qu’un énoncé P est indépendant d’une théorie Γ en définissant une traduction des démonstrations dans Γ en des démonstrations dans une théorie Γ’ telle qu’une démonstration de P dans Γ se traduise en une démonstration de P’ − souvent une contradiction − dans Γ’. On peut ensuite déduire l’indépendance de P dans Γ de l’indépendance de P’ dans Γ’ − souvent de la cohérence de Γ’.
29Cela marche particulièrement bien quand on fait une démonstration d’indépendance relative. Par exemple, si pour démontrer, dans la théorie des ensembles, la cohérence de la géométrie hyperbolique, on commence par supposer la cohérence de la géométrie euclidienne, et donc l’existence d’un modèle pour cette théorie, puis que l’on interprète les axiomes de la géométrie hyperbolique dans ce modèle, on peut alors remplacer cette construction par une traduction de la géométrie hyperbolique dans la géométrie euclidienne en prenant donc la géométrie hyperbolique comme théorie Γ et la géométrie euclidienne comme théorie Γ’.
30Cela marche encore, mais un peu moins bien, si on fait une démonstration d’indépendance absolue, c’est-à-dire si on construit, dans la théorie des ensembles, un modèle de la géométrie hyperbolique, en utilisant les ressources de la seule théorie des ensembles. Dans ce cas, la démonstration peut se formuler comme une traduction de la géométrie hyperbolique dans la théorie des ensembles elle-même, c’est-à-dire que l’on prend la géométrie hyperbolique pour Γ et la théorie des ensembles pour Γ’. On aboutit au résultat que si la théorie des ensembles est cohérente, alors la géométrie hyperbolique l’est aussi, ce qui est un peu moins fort que ce que l’on obtenait avec la démonstration initiale à savoir la cohérence de la géométrie hyperbolique sans supposer en outre la cohérence de la théorie des ensembles. Cette intrusion de la cohérence de la théorie des ensembles reflète le fait que, dans une démonstration de cohérence relative, comme dans une traduction, on utilise en général des ressources très faibles de la théorie dans laquelle on exprime la démonstration, alors que dans une démonstration de cohérence absolue on utilise ces ressources de manière plus importante pour construire le modèle. Dans le cas des démonstrations d’indépendance absolue, cette méthode présente, en outre, la limite de ne pas prendre en compte le fait que la syntaxe de la théorie Γ est elle-même formalisée dans la théorie des ensembles, ce qui est utilisé, par exemple, dans les constructions de modèles syntaxiques.
2.3 L’élimination des coupures et les modèles
31On peut donc tenter, en théorie de la démonstration, d’éviter la notion de modèle, en particulier en utilisant le théorème d’élimination des coupures. Ce théorème, qui a été démontré par G. Gentzen, permet de démontrer la cohérence des règles de raisonnement et certains résultats d’indépendance. Il permet de démontrer les propriétés de la disjonction et du témoin pour les démonstrations constructives. Et il permet enfin, en démonstration automatique, de limiter l’espace de recherche aux démonstrations sans coupures.
32Malheureusement, ces différents corollaires sont valables uniquement pour la théorie vide et ils ne s’étendent pas systématiquement quand on ajoute des axiomes. Seules la propriété de la disjonction et celle du témoin s’étendent à des théories très particulières comme les théories de Harrop. En démonstration automatique, on peut certes se restreindre à ne chercher que des démonstrations sans coupures utilisant les axiomes considérés, mais l’espace de recherche reste assez grand et, en particulier, la recherche d’une démonstration d’une contradiction n’échoue pas immédiatement − ce qui est à mettre en parallèle avec le fait que la démonstration de cohérence ne s’étend pas. C’est pour cela, que l’on a d’autres notions de coupure pour des théories axiomatiques particulières, comme l’arithmétique, et d’autres théorèmes d’élimination des coupures. Le théorème d’élimination des coupures n’a donc pas été démontré une bonne fois pour toutes, comme on pourrait le souhaiter, mais chaque théorie semble demander un théorème particulier.
33Le théorème d’élimination des coupures pour l’arithmétique, par exemple, donne la cohérence et les propriétés de la disjonction et du témoin, pour l’arithmétique. En démonstration automatique, il donne des méthodes de recherche de démonstrations dans l’arithmétique qui échouent immédiatement quand on leur demande de démontrer une contradiction. Chaque nouvelle théorie semble donc demander une nouvelle démonstration d’élimination des coupures, et on n’a même pas encore de notion universelle de coupure paramétrée par une théorie axiomatique. Bien entendu, ces diverses démonstrations d’élimination des coupures ont un air de famille et un certain nombre de concepts, comme celui de candidat de réductibilité, introduit pour la première fois dans la démonstration d’élimination des coupures de la théorie des types simples, reviennent dans nombre d’entre elles.
34Dans un travail en coopération avec B. Werner, nous avons cherché à comprendre si cet air de famille cachait une notion générale de coupure paramétrée par une théorie et un théorème général dont les différents théorèmes d’élimination des coupures seraient des conséquences, et nous avons abouti à un théorème qui montre l’élimination des coupures pour toutes les théories qui vérifient certaines conditions sur lesquelles je vais revenir. Malheureusement, pour réussir à formuler ce théorème, nous avons dû modifier légèrement la notion de théorie. Une théorie n’est plus dans ce cadre un ensemble d’axiomes, mais un ensemble de règles de calcul - en fait l’histoire s’est naturellement déroulée dans l’autre sens : nous avons d’abord étudié les théories formées de règles de calcul que nous avions introduites avec Th. Hardin et C. Kirchner, avant de nous apercevoir que cela nous donnait un théorème général d’élimination des coupures. Même si cette notion de théorie est moins générale que celle, traditionnelle, d’ensemble d’axiomes, nous avons montré que de nombreuses théories, en particulier l’arithmétique et la théorie des types simples formulée dans la logique des prédicats du premier ordre, pouvaient se formuler avec des règles de calcul. Nous avons donc pu déduire de notre résultat, des résultats d’élimination des coupures pour ces théories. Des travaux récents d’A. Miquel suggèrent qu’il est possible de faire de même pour la théorie des ensembles.
35Quelles sont donc les conditions qu’une théorie doit vérifier pour que ce résultat puisse s’appliquer ? Il faut que la théorie ait un prémodèle : une sorte de modèle dans lequel les valeurs de vérité sont remplacées par des candidats de réductibilité. En fait, B. Werner, et d’autres, avait sans doute cette intuition de la similarité entre les démonstrations d’élimination des coupures et les constructions de modèles depuis longtemps. En particulier, ils employaient le vocabulaire et les notations liées à la notion de modèle, appelant, par exemple, « interprétation », ou « dénotation », d’une proposition le candidat associé à cette proposition. En introduisant cette notion de prémodèle, nous n’avons fait que développer cette intuition, et simplifier certaines démonstrations, en particulier en introduisant la notion de domaine d’un modèle qui manquait encore dans ce cadre.
36L’intérêt des modèles pour démontrer des théorèmes d’élimination des coupures ne s’est pas limité à cette notion de prémodèle, puisque nous avons découvert, par la suite, que dans sa démonstration du théorème d’élimination des coupures pour la théorie des Fondations Stratifiées de Quine − aussi appelées « Nouvelles Fondations » −, M. Crabbé avait introduit une notion de « modèle de normalisation » qui n’est autre, à quelques différences techniques près, que la notion de prémodèle, dans le cas particulier des Fondations Stratifiées. Pour construire un modèle de normalisation, Crabbé part d’un modèle de la théorie des Fondations Stratifiées dû à R.B. Jensen − ou, ce qui est équivalent, d’un ω-modèle de la théorie des ensembles de Zermelo. Il y a donc plus qu’une ressemblance superficielle entre la notion de prémodèle et celle de modèle, puisque qu’on utilise, dans certains cas, des techniques de construction de modèles internes pour construire des prémodèles.
37La notion de modèle surgit donc, qu’on le veuille ou non, de ces démonstrations d’élimination des coupures. Elle a aussi surgi de deux autres manières dans ce travail. Tout d’abord, on peut montrer que dans le cadre du calcul propositionnel, on peut transformer tout ensemble d’axiomes cohérent en un ensemble de règles de calcul telles que la théorie qu’elles définissent ait la propriété de l’élimination des coupures. Pour construire ce système de réécriture, on utilise non seulement les axiomes, mais aussi un modèle de ces axiomes − qui se réduit, puisque nous sommes dans le calcul propositionnel, à une ligne d’une table de vérité.
38Ensuite, nous avons proposé, avec Th. Hardin et C. Kirchner, une méthode de démonstration automatique complète pour toutes les théories, formées avec règles de calcul, qui ont la propriété de l’élimination des coupures. Nous avions conjecturé à l’époque, et O. Hermant l’a démontré récemment, que cette méthode était complète uniquement pour les théories qui avait la propriété de l’élimination des coupures, c’est-à-dire que la complétude de cette méthode était équivalente à la propriété de l’élimination des coupures. Nous avons donc naturellement été assez surpris quand J. Stuber a démontré la complétude de cette méthode pour toute une classe de théories, avec des méthodes basées sur la construction d’un contre-modèle dans le cas où la méthode de recherche échoue. L’aspect surprenant de cette démonstration était qu’elle ne demandait pas l’hypothèse de l’élimination des coupures : la démonstration de Stuber devait contenir, cachée quelque part, une démonstration du théorème d’élimination des coupures pour ces théories, ce que O. Hermant a également montré récemment. Il y avait donc une certaine naïveté de ma part à penser que l’élimination des coupures était une alternative au recours à la notion de modèle. Au contraire, j’ai plutôt l’impression aujourd’hui que la construction de modèles, telle qu’on la trouve dans le théorème de complétude de Gödel, et le théorème d’élimination des coupures sont deux morceaux émergés du même iceberg, qui reste en grande partie à explorer.
3. La même notion de modèle ?
3.1 Deux utilisations de la notion de modèle
39J’ai donné deux exemples où j’ai succombé à la tentation d’utiliser la notion de modèle : pour démontrer l’existence de groupes de toutes les cardinalités et pour faire des démonstrations d’indépendance et d’élimination des coupures. Le choix de ces exemples était motivé par le fait qu’ils me semblent paradigmatiques de deux types d’utilisation de la notion de modèle en mathématiques.
40La première utilisation a pour but d’établir des propriétés des modèles qui sont des structures algébriques − les groupes, les corps... − intéressantes en elles-mêmes et étudiées pour elles-mêmes dans d’autres branches des mathématiques. La logique apparaît ici comme un outil pour démontrer des théorèmes d’algèbre. Comme on l’a vu, ces résultats peuvent parfois s’obtenir par des méthodes purement algébriques, mais d’autres fois non : le fait qu’une structure puisse se définir en logique des prédicats du premier ordre ou non détermine certaines de ses propriétés. Pour reprendre une formulation due à D. Lascar, on fait ici de l’algèbre avec un grand A et de la logique avec un petit 1. C’est, en général, cette branche des mathématiques que l’on appelle la théorie des modèles.
41La seconde utilisation de la notion de modèle a une finalité toute autre. Le but est d’établir des propriétés de théories déductives : cohérence, indépendance, élimination des coupures, normalisation, propriété de la disjonction et du témoin, complétude de méthodes automatiques de recherche de démonstrations... Cette utilisation de la notion de modèle en théorie de la démonstration est de la logique avec un grand L, puisque le but est d’étudier les propriétés du raisonnement, et ce n’est pas de l’algèbre, ni avec un grand A, ni avec un petit.
3.2 Les différences
42Bien qu’elles utilisent la même notion de modèle, la théorie des modèles et la théorie de la démonstration me semblent avoir davantage de différences que de ressemblances.
43Tout d’abord, les buts de ces deux théories sont, comme nous l’avons vu, très différents. Dans le premier car, il s’agit d’étudier des structures algébriques et, dans le second, des démonstrations mathématiques.
44Les théories que l’on étudie sont également très différentes : les théories qui ont des modèles intéressants d’un point de vue algébrique − les groupes, les corps, les corps ordonnés...− ont peu d’intérêt comme théories déductives. En particulier, dans les livres de théorie des groupes, on ne démontre pas des théorèmes de la théorie axiomatique des groupes, c’est-à-dire des énoncés exprimés dans un langage dont les objets sont les éléments d’un groupe et l’unique symbole de prédicat l’égalité. On démontre des théorèmes exprimés dans un langage dont les objets sont des groupes, des morphismes... et les symboles de prédicats les relations « être un sous-groupe de », « être un sous-groupe distingué de ». . . En revanche, les théories intéressantes du point de vue de la théorie de la démonstration sont des théories qui permettent souvent de formaliser toutes les mathématiques, ou une bonne partie : la théorie des ensembles, la théorie des types simples... Les modèles de ces théories sont des structures énormes qui n’ont que peu d’intérêt d’un point de vue algébrique, et que l’on aurait eu peu de chances de rencontrer en tant qu’objets mathématiques, si on ne s’était pas intéressé à ces théories.
45La théorie des groupe, la théorie des corps,... sont essentiellement des théories-à-définir-des-structures. La théorie des ensembles, la théorie des types simples,... sont essentiellement des théories-où-raisonner. Il y a bien quelques théories, comme l’arithmétique de Peano ou la géométrie de Hilbert, qui ont un intérêt à la fois en théorie de la démonstration et en théorie des modèles. Mais, bien qu’elles aient commencé leur carrière comme théories-où-raisonner, ces deux théories sont devenues aujourd’hui essentiellement des théories-à-définirdes- structures, quand l’arithmétique et la géométrie ont été intégrées dans la théorie des ensembles et que l’on a cessé de dire « Par deux points, il passe une et une seule droite » pour dire « Dans tout espace affine, par deux points, il passe une et une seule droite ». Plus personne ne raisonne vraiment dans un cadre purement géométrique sans invoquer les coordonnées de tel point, l’équation de telle courbe, le groupe de transformation de telle figure... Les recherches sur le problème du mot ou sur l’unification équationnelle sont peut-être les seuls domaines dans lesquels on regarde certaines théories tantôt comme des théories-où-raisonner et tantôt comme des théories-à-définir-des structures.
46Les outils utilisés dans ces deux domaines sont également très différents. La notion de démonstration formelle est bien entendu centrale en théorie de la démonstration, ainsi que le théorème de complétude qui relie la notion de démontrabilité à la notion de validité. Ce théorème, en revanche, est, au mieux, un outil en théorie des modèles ( il permet par exemple de démontrer le théorème de compacité, formulé en théorie des modèles comme le fait que si toute partie finie d’une théorie a un modèle alors la théorie elle-même a un modèle), mais cette démonstration n’est qu’une démonstration parmi d’autres. Il semble qu’en théorie des modèles, on puisse se passer bien souvent de la notion de démonstration formelle et du théorème de complétude.
47Enfin, je ne suis même pas certain que l’on utilise réellement la même notion de modèle dans les deux cas. En théorie des modèles, quand on quantifie sur les parties du domaine du modèle, par exemple pour exprimer la complétude d’un corps totalement ordonné, on quantifie naturellement sur toutes les parties du modèle : seuls les modèles standard sont des modèles.
48Dans une démonstration, en revanche, on ne peut substituer à une variable d’ensemble qu’un terme définissant un ensemble et donc la quantification est implicitement restreinte aux ensembles définissables, ce que l’on doit traduire dans les modèles, si on veut garder le théorème de complétude : on doit abandonner la notion de modèle standard et la remplacer par la notion de modèle général, due à L. Henkin. Dans un tel modèle, si le domaine de variation des variables ordinaires est un ensemble E, le domaine de variation des variables d’ensemble n’est pas toujours l’ensemble ℘(E) mais une partie F de ℘(E) seulement, dont la seule contrainte est de contenir toutes les parties définissables de E.
49Une autre manière de dire les choses est que les corps totalement ordonnés archimédiens et complets ne peuvent pas se définir comme les modèles d’une théorie en logique des prédicats du premier ordre − comme le montre le fait qu’il n’y ait pas de telles structures dénombrables − ; il est donc nécessaire, en théorie des modèles, d’introduire un nouveau cadre logique pour définir cette structure : la logique du second ordre. En théorie de la démonstration en revanche, on peut définir la logique du second ordre comme une théorie du premier ordre à deux sortes d’objets avec un schéma d’axiome de compréhension, et les modèles généraux ne sont rien d’autre que les modèles de ce schéma. Le fait que l’ensemble F contienne toutes les parties définissables de E exprime précisément que l’axiome de compréhension est valide dans ce modèle. Cette expression de la logique du second ordre, et plus généralement de la théorie des types simples, comme une théorie exprimée en logique des prédicats du premier ordre a, par exemple, été proposée à la fin des années soixante par M. Davis. Elle a longtemps souffert du fait qu’elle ne rendait pas compte de manière satisfaisante de la notion de coupure propre à la théorie des types, mais on sait aujourd’hui comment exprimer ces coupures, tout en restant dans la logique des prédicats du premier ordre, en particulier en transformant les axiomes en règles de calcul. Je ne vois donc plus de raison de présenter, en théorie de la démonstration, la logique du second ordre ou la théorie des types comme un autre cadre logique et non comme une théorie. En revanche, il est clair qu’une telle réduction ne sera jamais possible en théorie des modèles.
50Je voudrais pour terminer sur ce point examiner deux arguments que l’on pourrait opposer à cette division entre modèles standard en théorie des modèles et modèles généraux en théorie de la démonstration.
51La première est que, même pour les théories-où-raisonner, on vise parfois l’interprétation standard, en particulier quand on définit les conditions de vérité dans ces théories d’une manière réaliste. Par exemple le théorème de Y. Matyiacevic montre qu’il y a des polynômes P et Q tels que l’énoncé
∃x1...∃xnP (x1,..., xn) = Q(x1,..., xn)
52soit indéterminé dans l’arithmétique du second ordre, ou dans la théorie des ensembles. On peut en déduire que l’équation P (x1,..., xn) = Q(x1,..., xn) n’a pas de solution. Une première manière d’argumenter repose sur le fait que cette équation a des solutions dans certains modèles et pas dans d’autres. Si elle avait des solutions dans le modèle standard, elle en aurait dans tous les modèles car elle est purement existentielle. Elle n’en a donc pas dans le modèle standard. L’énoncé ∃x1...∃xnP (x1,..., xn) = Q(x1,..., xn) n’est donc pas valide dans le modèle standard, et il est donc faux, puisque l’intention était de quantifier sur tous les ensembles, même si on a été contraint, malgré soi, de se restreindre aux ensembles définissables. Ainsi, un énoncé de la forme ∃x1...∃xnP (x1,..., xn) = Q(x1,..., xn) qui est indéterminé dans l’arithmétique ou dans la théorie des ensembles est faux.
53On pourrait penser que le même argument montre que l’hypothèse du continu est fausse, c’est-à-dire qu’il existe des parties de ℝ qui ont un cardinal intermédiaire. En effet, puisqu’il n’est pas contradictoire de supposer l’existence d’une collection p telle que l’ensemble {x ∈ ℝ | p(x)} ait un cardinal intermédiaire, un tel ensemble existe dans les modèles où il y a beaucoup de collections p et il n’existe pas dans les modèles où il y en a peu. En fait, la situation est plus compliquée car dans les modèles où il y a beaucoup de collections p, il y a aussi davantage de bijections et il est donc plus difficile pour un ensemble d’être de cardinal intermédiaire, si bien que l’argument se retourne1.
54Mais, pour revenir aux équations diophantiennes, il y a d’autres manières d’argumenter. Premièrement, il est peut-être possible, même si ce point reste encore très obscur pour moi, d’ajouter des axiomes qui posent l’existence de davantage d’ensembles d’entiers et qui permettent de démontrer par récurrence que cette équation n’a pas de solution. Deuxièmement, on peut dire que cette équation n’a pas de solution car, si elle en avait, on pourrait le démontrer. Cela peut se formuler sans référence au modèle standard en ajoutant le schéma d’axiome :
¬Bew (<< ∃x1...∃xn t =u >>)⇒ ¬∃x1...∃xn t = u
55Dans un cas comme dans l’autre, on choisit d’étendre la théorie en favorisant des axiomes qui posent l’existence d’ensembles au détriment de leur négation. Ces axiomes n’éliminent que des modèles non standard, et c’est cela qui les rend préférables. Mais cela ne signifie pas pour autant qu’ils permettent de se restreindre au modèle standard, car il n’y a aucun moyen d’ajouter suffisamment d’axiomes pour éliminer tous les modèles non standard. Il y a donc une grande différence entre cette « standardité », si l’on peut dire potentielle, qui consiste à préférer certains axiomes à d’autres, et la « standardité » actuelle que l’on utilise en théorie des modèles.
56La seconde objection, à l’inverse, est que l’on utilise aussi des modèles non standard en théorie des modèles, par exemple en analyse non standard où les principaux objets d’intérêt sont les modèles non standard de la théorie des corps totalement ordonnés archimédiens et complets. Cependant, une grande partie de l’intérêt de l’analyse non standard vient du fait que les théorèmes de l’analyse non standard exprimables dans le langage de l’analyse peuvent être transférés en analyse. De ce fait l’analyse non standard me semble beaucoup plus proche des préoccupations de la théorie de la démonstration que de la théorie des modèles, même si on utilise des méthodes issues de la théorie des modèles, des ultrafiltres... Bien entendu, c’est un domaine qui ne se situe pas loin de la frontière.
4. Que penser quand deux objets se ressemblent ?
57L’utilisation de la notion de modèle en théorie des modèles et en théorie de la démonstration est donc assez différente : ces deux démarches ont des buts différents, elles s’intéressent à des théories différentes, elles utilisent des méthodes différentes, et parfois même des notions différentes de modèles, dans le cas de la quantification sur les ensembles, par exemple.
58Il n’en reste pas moins que, sauf dans des cas exceptionnels comme celui de la quantification sur les ensembles, c’est la même notion de modèle que l’on utilise. Et il est plus utile de tenter d’unifier deux théories que l’on croyait distinctes, comme la mécanique céleste et celle des objets sublunaires, que de tenter de diviser une théorie que l’on croyait unique. La perception d’une similitude entre deux objets mathématiques ou la mise en relation de deux théories jusque là indépendantes est souvent une source de progrès. Et j’ai moi-même consacré davantage de mon temps à proposer des cadres unificateurs, que des cadres séparatistes. Cependant, je me demande si cette quête des ressemblances ne va pas parfois un peu trop loin.
59Prenons deux exemples. Le périmètre d’un cercle rapporté à son diamètre est indépendant du cercle et vaut un peu plus de 3.14. La surface d’un disque rapportée au carré de son rayon est également indépendante du disque et vaut également un peu plus de 3.14. Si on calcule ces deux nombres avec cent décimales, on s’aperçoit que ces décimales sont identiques. Il serait surprenant qu’il s’agisse d’une coïncidence fortuite. Et, il est intéressant de comprendre pourquoi le même nombre intervient dans ces deux problèmes...
60En revanche, certains remarquent avec raison que le réseau internet ressemble par certains aspects à notre cerveau, et vont jusqu’à qualifier le net de cerveau mondial. Au lieu d’essayer de tirer des conséquences philosophiques de cette ressemblance, je me demande parfois s’il ne serait pas plus sage de remarquer que ces ressemblances se ramènent, pour la plupart, au fait que et le net et le cerveau sont des graphes, et que la structure de graphe étant relativement pauvre, elle est relativement générale, et qu’il n’y a rien de surprenant à ce que l’on retrouve des graphes ici et là. Dès que le mot « graphe » est lâché, la ressemblance qui paraissait si séduisante au premier abord devient plus terne. Éviter le mot « graphe » est une technique rhétorique bien utile pour faire briller l’analogie entre le net et le cerveau. Bien entendu, si l’analogie entre le net et le cerveau avait permis de découvrir la notion de graphe, elle aurait été fructueuse, mais ce n’est pas le cas. Il se pourrait aussi que le net et le cerveau partagent des propriétés plus fortes, par exemple que ne nombre d’arêtes rapporté au carré du nombre de sommets soit identique dans les deux cas, il y aurait alors sans doute quelque chose à découvrir ; mais on peine, pour le moment à voir de telles ressemblances fortes.
61De même, le fait que la théorie des groupes soit utile pour l’étude de la résolution par radicaux des équations du cinquième degré et pour l’étude des particules élémentaires ne semble pas indiquer un lien mystérieux entre les équations du cinquième degré et les particules élémentaires, mais beaucoup plus vraisemblablement que la notion de groupe est tellement générale, qu’il n’est pas surprenant de la retrouver dans différents domaines. De même, il ne me semble y avoir rien d’autre à tirer comme conséquence du fait que la notion de morphisme soit utilisée en algèbre, en géométrie, en topologie... que le fait que c’est une notion très générale.
62On peut se poser la même question pour la notion de modèle. J’aimerais avancer l’hypothèse que le fait que la notion de modèle soit utilisée dans l’étude des structures algébriques et en théorie de la démonstration révèle moins des liens mystérieux entre les structures algébriques et les démonstrations que le fait que la notion de modèle est une notion suffisamment fondamentale, simple et générale pour être utile à différents endroits.
63Qu’est-ce donc en effet qu’un modèle sinon un morphisme entre un langage et autre chose ? Le fait que les modèles soient des morphismes serait plus apparent si, mais ce n’est qu’une question de vocabulaire, au lieu de dire que M muni de la fonction [.]. est un modèle du langage L, on disait que [.]. est un modèle / morphisme de L vers M, et si on définissait un modèle / morphisme comme une fonction [.]. qui associe un élément de M à chaque terme du langage et une valeur de vérité à chaque proposition, fonction qui doit vérifier un certain nombre de propriétés pour être un modèle / morphisme, et non par sa valeur sur les symboles de fonction et de prédicat du langage, ainsi, qu’en algèbre linéaire, par exemple, on définit une application linéaire comme une application d’un espace vectoriel dans un autre et non comme une fonction associant un vecteur de l’espace d’arrivée à chaque élément d’une base de l’espace de départ. Reste que les langages se distinguent d’autres objets mathématiques par la présence de quantificateurs et de variables liées et que de ce fait la notion de morphisme doit être adaptée, en particulier, que la fonction [.]. doit avoir un second argument qui est une valuation. Et, est-il si surprenant que la notion de morphisme soit utile ici et là ?
5 Modèles et Réalité
64Revenons à notre question initiale. Est-il nécessaire d’avoir une définition réaliste des conditions de vérité en mathématiques pour utiliser la notion de modèle ?
65Commençons par deux exemples. Dans le cas de la démonstration de l’existence de groupes de toutes les cardinalités infinies, on pose cette question dans le cadre du langage mathématique dont les conditions de vérité sont préalablement définies − par une définition reposant sur une correspondance ou sur la notion de démontrabilité, peu importe. Répondre à cette question consiste à donner une démonstration, mettons en théorie des ensembles, de la proposition « Il y a des groupes de toutes les cardinalités infinies ». Cette démonstration peut utiliser des objets extérieurs à ceux qui sont dans l’énoncé du théorème, par exemple des espaces vectoriels, et il n’y a aucune raison de refuser d’utiliser également des langages et des modèles/morphismes de ces langages, s’il est admis que le langage introduit n’est pas le langage mathématique, et que ce modèle / morphisme n’est pas la définition des conditions de vérité du langage mathématique. Utiliser dans cette démonstration un langage et un modèle / morphisme de ce langage n’est pas très différent d’utiliser des polynômes formels en algèbre linéaire et de définir l’application d’un polynôme à un scalaire ou à une application linéaire en construisant un morphisme de l’anneau des polynômes formels vers ces anneaux. On ne suppose aucune thèse réaliste, ou dualiste, quand on utilise ainsi un modèle / morphisme, à moins de penser que l’on défend une thèse dualiste à chaque fois que l’on met deux ensembles en relation par un morphisme. Il n’y a donc aucune raison de refuser d’utiliser un langage et un modèle / morphisme, sous prétexte que d’autres utilisent cette même notion pour donner une définition réaliste des conditions de vérité d’un énoncé du langage mathématique. Mais en faisant ainsi de la théorie des modèles, on ne fait certainement pas de la sémantique, et la notion de validité d’un énoncé dans un modèle doit être soigneusement distinguée de celle de vérité d’un énoncé du langage mathématique.
66Le même argument s’applique à l’utilisation de la notion de modèle / morphisme en théorie de la démonstration. Le but de la théorie de la démonstration n’est pas de définir les conditions de vérité d’un énoncé du langage mathématique, mais, une fois ce langage et ces conditions définies (encore une fois, par une définition reposant sur la notion de correspondance ou sur la notion de démontrabilité), d’étudier les démonstrations avec des outils mathématiques. Tous les outils mathématiques peuvent être convoqués dans cette étude, il n’y a aucune raison de se priver d’utiliser un modèle / morphisme du langage étudié, s’il est admis que ce modèle / morphisme n’est pas la définition des conditions de vérité du langage mathématique.
67N’y a-t-il donc aucun lien entre la notion de modèle / morphisme et la conception réaliste de la vérité en mathématiques ? Si : nous avons vu que la notion de modèle / morphisme était une notion suffisamment générale pour être utile à plusieurs endroits, et nous en avons cité deux : l’étude des structures algébriques et l’étude des démonstrations. Il y a un troisième usage de la notion de modèle / morphisme, c’est la définition réaliste des conditions de vérité d’un énoncé mathématique, comme validité dans le modèle que constitue la Réalité mathématique, puisque cette définition consiste à supposer un morphisme entre la Réalité mathématique et le langage mathématique.
68L’existence de la Réalité mathématique et de ce modèle / morphisme entre le langage mathématique et cette Réalité est un postulat fort, qu’il est raisonnable de critiquer, voire de rejeter. Mais cette critique me semble pas atteindre la notion de modèle / morphisme elle-même, ni son utilisation à d’autres fins que celle de définir les conditions de vérité des énoncés mathématiques.
Notes de bas de page
1 Je remercie Daniel Lascar et Patrick Dehornoy de m’avoir signalé ce point.
Auteur
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Agir et penser
Essais sur la philosophie d’Elizabeth Anscombe
Valérie Aucouturier et Marc Pavlopoulos (dir.)
2015