Chapitre 1. Les classes aux frontières incertaines
p. 20-36
Texte intégral
La physique théorique exige le plus haut niveau possible de précision rigoureuse dans la description des relations, comparable à celui obtenu dans l’emploi du langage mathématique.
(Albert Einstein, sur les structures de la physique théorique)1.
UNE MATHÉMATIQUE DES QUANTITÉS NÉBULEUSES
1Dans un article publié en 19652, Lotfi Zadeh, professeur de génie électrique à l’Université de Californie, faisait une observation fondamentale : la plupart des collections d’objets que nous trouvons dans le monde réel ne sont pas définies de façon précise. Ainsi, il est clair que tout chien, tout cheval ou tout oiseau entre dans la classe des animaux, alors que les roches, les fluides et les plantes n’en font pas partie. Cependant, des objets tels que les étoiles de mer et les bactéries ont un statut ambigu, les termes contradictoires « animal » et « non-animal » semblant tous les deux leur convenir. Dans le même ordre d’idées, des appellations telles que « formes rondes », « vieilles voitures » et « basses températures » sont elles aussi dépourvues d’une définition précise.
2Et pourtant, les classes aux frontières incertaines remplissent le langage et la pensée, et jouent un rôle important dans la communication de l’information. L’idée de Zadeh fut de quantifier cette incertitude, laquelle n’est pas due au hasard mais à l’absence de critères nettement définis de l’appartenance à une classe. Le concept qui en résulte—soit celui d’un ensemble flou—utilise la rigoureuse précision des mathématiques pour composer avec l’imprécision de la pensée humaine. Si l’article de Zadeh commençait par énoncer des évidences, la suite, elle, fut révolutionnaire. Ce premier chapitre est une visite guidée des ensembles flous et de leur conséquence, la logique floue.
LES ENSEMBLES, LA LOGIQUE ET LES ALGÈBRES BOOLÉENNES
3Avant d’aborder la notion d’ensemble flou, il n’est pas mutile de parler des ensembles ordinaires, car les deux concepts sont intimement liés : les ensembles familiers sont des cas particuliers des ensembles flous.
4Autrefois, seuls les mathématiciens et les philosophes qui s’intéressaient aux fondements des mathématiques étudiaient les ensembles ; aujourd’hui, ceux-ci sont enseignés dès l’école primaire et même aux tout petits des écoles maternelles—relique de la révolution des « nouvelles mathématiques » des années 70. (On peut se demander si une connaissance aussi précoce, et superficielle, des ensembles accroît les compétences mathématiques ou logiques des élèves.)
5Un ensemble est habituellement conçu comme une « collection d’objets », mais cette description n’est pas très éclairante. Ce qui importe, c’est d’être en mesure de dire quels sont les objets qui entrent dans l’ensemble et quels sont ceux qui n’y entrent pas. Par exemple, si Z dénote l’ensemble de tous les lauréats du prix Nobel de chimie, alors Ernest Rutherford, Marie Curie et Il y a Prigogine sont dans l’ensemble Z (ils ont obtenu le prestigieux prix, respectivement, en 1908,1911 et 1977). Par ailleurs, Frank Sinatra et Margaret Thatcher ne sont pas dans Z. Pour prendre un exemple mathématique, supposons que P est l’ensemble de tous les nombres premiers : alors, 2, 7 et 13 sont certainement dans P (ou appartiennent à P ou sont des éléments, des membres, de P), tandis que 10,22 et 63 en sont exclus. Pour des nombres très grands, le classement peut prendre un certain temps, mais il n’en demeure pas moins nettement défini : n est dans P s’il n’est pas divisible par un nombre plus petit que lui-même—excepté, bien entendu, le nombre 1.
6P est un sous-ensemble de l’ensemble plus grand N de tous les nombres naturels (les nombres 0, 1, 2, 3, etc. que nous utilisons pour compter). Nous pouvons de façon commode représenter l’appartenance à un sous-ensemble par un chiffre binaire : 1 pour un membre et o pour un non-membre. Le symbole P(x) dénote le degré d’appartenance du nombre naturel x dans le sous-ensemble P. Par exemple, P(7) = 1, P(15) = 0, P(2859 433) =0 et P(2859 433 -1) = 1. (Selon le Livre des records Guinness, le nombre2859 433-1 est premier—mais il est inutile de perdre son temps à le vérifier. Il s’est révélé premier grâce à un calcul effectué par un superordinateur en janvier 1994. À cette époque, c’était le plus grand nombre premier connu. En fait, il n’existe pas de nombre qui soit le plus grand nombre premier.) Les ensembles peuvent être combinés de différentes façons pour former d’autres ensembles. Étant donné deux ensembles A et B, leur réunion est l’ensemble A ∪ B qui consiste en ces objets qui sont soit dans A soit dans B. Par exemple, si A est l’ensemble des diviseurs de 10 (A = {1, 2, 5, 10}) et B l’ensemble des diviseurs de 15 (B = {1, 3, 5, 15}), alors A ∪ B = {1, 2, 5, 10, 3, 15}-l’ensemble des nombres qui divisent soit 10 soit 15 (ou les deux). L’intersection A ∩ B est formée des objets dans A et B. Dans l’exemple ci-dessus, A ∩ B = {1,5} — les diviseurs communs à 10 et 15.
7Union et intersection peuvent être visualisées à l’aide de diagrammes appelés diagrammes de Venn, dans lesquels les ensembles sont représentés par des cercles ou par d’autres courbes fermées. (John Venn, logicien anglais du XIXe siècle, est surtout connu à cause de son emploi de ces diagrammes géométriques pour décrire les relations entre des ensembles.) Si nous traçons un cercle pour chaque ensemble, leur union est représentée par la région à l’intérieur des cercles, et leur intersection par la région commune aux deux cercles (les parties foncées de la figure 1.1).
8Lorsque nous nous entendons sur la sorte d’objets dont nous désirons parler, nous avons un « univers de discours » ou ensemble universel U. Alors, chaque ensemble A possède un complément Ᾱ, constitué des objets dans U qui ne sont pas membres de A. Par exemple, si nous discutons des nombres naturels et que A est l’ensemble de tous les nombres pairs {0,2,4, alors Ᾱ est l’ensemble de tous les nombres impairs {1, 3, 5,...}. Le traitement que Venn fait de U a été critiqué par C. L. Dodgson, alias Lewis Carroll. L’auteur d’Alice au pays des merveilles, mieux connu pour ses œuvres littéraires que pour ses réalisations mathématiques, insista sur le besoin d’englober les cercles dans un rectangle, pour ainsi délimiter l’univers du discours. De cette façon, le complément de A est représenté par la région extérieure au cercle mais intérieure au rectangle (fig. 1.2).
9Les trois opérations introduites ci-dessus sont des manières particulières de combiner des sous-ensembles (d’un ensemble donné) pour former d’autres sous-ensembles. Des combinaisons répétées, représentées par des expressions comme , ont donné naissance à une algèbre que le mathématicien britannique George Boole fut le premier à étudier. La structure de cette algèbre booléenne des classes reflète celle que l’on retrouve dans l’algèbre de la logique inventée par Boole durant les années 1850.
10L’idée de Boole fut de remplacer le processus usuel de la déduction logique par la manipulation algébrique de certaines expressions formelles. Dans le calcul propositionnel de Boole, les lettres représentent des énoncés qui peuvent se combiner selon les connecteurs « ou », « et » et « non »— équivalents linguistiques des opérations sur les ensembles : union, intersection et complément.
11Les applications techniques de l’algèbre de la logique de Boole durent attendre presque un siècle. En 1938, Claude E. Shannon, qui devait s’illustrer plus tard par sa théorie mathématique de la communication, était étudiant au Massachusetts Institute of Technology. Dans son mémoire de maîtrise, Shannon montra comment les algèbres booléennes pouvaient servir à l’analyse et à la configuration des circuits électriques3. Constitués de contacts de relais et de commutateurs connectés en série ou en parallèle, ces circuits apparurent dans les centraux téléphoniques automatiques et dans les commandes des moteurs industriels. De semblables circuits, construits à partir d’éléments appelés portes logiques, accomplissent des opérations sur des signaux binaires et constituent aujourd’hui le système nerveux central des ordinateurs électroniques numériques.
12Une élégante théorie mathématique est à l’origine des applications pratiques des algèbres booléennes à la logique propositionnelle, aux circuits et aux ordinateurs numériques : le calcul symbolique des fonctions binaires à n variables binaires. Les scientifiques et les ingénieurs modernes peuvent considérer comme acquis cet outil théorique, et cela grâce à la géniale démonstration de Boole selon laquelle le raisonnement peut s’exécuter par le « calcul » ou, pour parler plus simplement, par laquelle la logique peut se réduire à l’algèbre.
LES ENSEMBLES FLOUS
13La caractéristique d’un ensemble est qu’il est nécessaire qu’un objet donné soit ou ne soit pas dans l’ensemble. Si cette dichotomie à la Hamlet fonctionne bien pour des objets mathématiques comme les nombres, nous devons cependant nous rendre compte qu’il y a un problème quand nous essayons de l’appliquer au monde réel. Certains objets peuvent être classés sans hésitation : ainsi, un chien est un animal et une banane n’en est pas un. Le pianiste Arthur Rubinstein était assurément vieux quand il mourut en 1982 (il avait 95 ans) et Mozart, enfant prodige, n’était certainement pas vieux quand il composa sa première sonate (à l’âge de sept ans). Mais le pittoresque Picasso était-il vieux quand il peignit le Portrait de Dora Maar (il avait 56 ans) ? Les éponges sont-elles des animaux ?
14La classe des animaux aquatiques et la classe des vieilles personnes ne sont pas des ensembles au sens ordinaire, parce que ni « animal aquatique » ni « vieille personne » ne sont des concepts bien définis. Afin de traiter de ces classes mal définies, Zadeh eut l’idée de permettre que le degré d’appartenance soit un nombre compris entre 0 et 1. Il appela ces classes ensembles flous. Zadeh s’attendait à ce que ce nouveau concept, qui généralisait celui d’un ensemble ordinaire, trouve des applications dans le domaine de la reconnaissance des formes et dans celui de la communication de l’information. Non seulement l’avenir lui donna raison, mais il avait grandement sous-estimé les possibilités de sa création.
15Contrairement à celles des ensembles ordinaires, les frontières des ensembles flous ne sont pas nettes, mais... floues. Et parce que les ensembles flous font place à l’appartenance partielle, c’est-à-dire aux objets qui ne sont ni totalement à l’intérieur ni totalement à l’extérieur, ils peuvent s’adapter à l’ambiguïté du langage humain beaucoup mieux que ne peuvent le faire les ensembles ordinaires. Prenons, par exemple, la classe des vieilles personnes. À l’âge de cinq ans, une personne n’est certainement pas vieille (degré d’appartenance 0), et à l’âge de 95 ans, la même personne est manifestement vieille (degré d’appartenance 1). Mais quelque part entre 5 et 95, il y a une zone grise, représentée numériquement par des degrés d’appartenance plus grands que 0 et moins grands que 1. Par exemple, une personne de 40 ans peut se situer au degré 0,30 dans l’ensemble flou des vieilles personnes (intuitivement, la description d’une telle personne comme « vieille » est exacte à 30 %). À l’âge de 58 ans, le degré d’appartenance peut se situer à 0,70 ou 0,75 et atteindre 1 lorsque la personne parvient à l’âge de 85 ans.
16Ce qui importe ici, c’est l’absence de démarcation nette ; il n’existe aucun âge magique g tel que vous deveniez vieux (et le demeuriez) dès l’instant où vous l’atteignez—alors que vous n’étiez pas vieux la veille. Cette situation n’est pas due à l’insuffisance de notre connaissance ou à notre inaptitude à calculer g, mais au fait que « vieux » ne peut être saisi en une définition précise comme peut l’être « nombre premier » ou « prix Nobel ». Évidemment, on peut toujours décider que « vieille personne » signifie « âge égal à ou plus grand que 65 ans ». Même si une telle définition arbitraire peut convenir à certaines fins, la classe qu’elle caractérise est fondamentalement différente de la classe des vieilles personnes, la première étant un ensemble ordinaire, la seconde ne l’étant pas.
17Un autre exemple d’un ensemble flou est la classe P des personnes pauvres. Nous verrons que traiter P comme un ensemble bien défini conduit à une absurdité. Car, si quelqu’un qui a un revenu annuel de X (disons 2000 $) est membre de P, alors quelqu’un dont le revenu annuel est de X+1 le sera tout autant (ce n’est pas un dollar de plus qui empêchera l’indigence). Pour la même raison, ceux qui ont des revenus de X+2, X+3, et ainsi de suite, sont tout aussi pauvres. Mais, si on répète cet argument un assez grand nombre de fois, on en arrive à la conclusion qu’un individu qui gagne 100 000 $ par année est pauvre ! Ce paradoxe résulte de l’existence présumée d’un seuil de la pauvreté, si cher aux statisticiens des gouvernements, car, dans ce cas, le dollar qui permet de franchir ce seuil change tout—ce qui confirme le simple bon sens selon lequel la notion officielle de pauvreté est différente de la réalité.
18Il est important de comprendre que le concept d’ensemble flou n’est pas d’ordre statistique, et qu’il y a une différence entre le flou et l’aléatoire. Le flou, au sens de Zadeh, représente le vague dans l’intuition humaine, non la probabilité. La probabilité concerne l’occurrence des événements : ainsi, quand tous les faits sont là, un événement donné ou bien a eu lieu ou bien n’a pas eu lieu. La somme de deux dés jetés est ou n’est pas 7 ; lorsque s’arrête la roulette, le compartiment qui contient la boule est noir ou ne l’est pas. Mais à des questions comme : l’exposé était-il long ? le conférencier était-il petit ? la salle de conférence était-elle grande ? on ne peut pas toujours répondre par un oui ou par un non, même si tous les faits (la longueur du discours, la taille du conférencier et les dimensions de la salle) sont là. On peut visualiser certains ensembles flous, surtout les sous-ensembles flous des nombres, par une représentation comme celle qui se trouve à la figure 1.3. En termes mathématiques, ceux-ci sont simplement les habituels graphiques des fonctions d’appartenance y = A(x) dans un système de coordonnées cartésiennes. Ces graphiques sont souvent soit triangulaires soit trapézoïdales, ou sont, à l’occasion, en forme de cloche. Les formes les plus simples sont préférables parce qu’elles facilitent les calculs.
19Il faut souligner que concevoir une classe donnée A en tant qu’ensemble flou est une chose et que c’en est une autre de pouvoir préciser sa fonction d’appartenance A(x). De même qu’il n’y a pas un seuil de pauvreté séparant nettement les pauvres des non-pauvres, ainsi n’y a-t-il pas de vraie fonction d’appartenance pour l’ensemble flou des gens pauvres ou pour n’importe quel autre ensemble flou. Ceci ne veut pas dire que le choix des degrés d’appartenance soit complètement arbitraire. Des considérations à la fois théoriques et empiriques interviennent dans la sélection, comme le font le contexte et la situation particulière à modéliser. L’utilisation croissante des techniques d’apprentissage et d’optimisation, tels les réseaux de neurones et les algorithmes génétiques, fait en sorte que la sélection des fonctions d’appartenance est de moins en moins un art et de plus en plus une science. Mais, indépendamment de la méthode employée (conjecture éclairée ou algorithme), la principale raison du choix d’une fonction d’appartenance particulière dans l’application pratique des ensembles flous est, en définitive, « que ça marche ».
20Les graphiques comme ceux de la figure 1.3 sont une façon commode de représenter des sous-ensembles flous isolés. Pour obtenir une image de la totalité des sous-ensembles flous (d’un ensemble universel X), il existe une meilleure technique : celle de Bart Kosko. Celui-ci eut l’idée de représenter chaque sous-ensemble de X par un point dans un système de coordonnées cartésiennes4. Pour simplifier, supposons que l’univers X ne soit constitué que de deux éléments, X = {x1, x2}. Alors, le sous-ensemble flou S de X, dans lequel x1 a un degré d’appartenance 0,2 et x2 un degré 0,7, est représenté par un point de coordonnées (0,2 ; 0,7) [figure 1.4]. D’une façon générale, le sous-ensemble A de X est représenté par un point de coordonnées (A(x1) ; A(x2)).
21Remarquons que cet univers X a quatre sous-ensembles ordinaires (qui sont, évidemment, des cas particuliers des ensembles flous) : {x1, x2}, {x1}, {x2} et le sous-ensemble vide {}. Les quatre sommets du carré correspondent alors aux sous-ensembles ordinaires de X (par ex. (0 ; 1) correspond à {x2} et (0 ; 0) au sous-ensemble vide). Aller des sous-ensembles ordinaires à tous les sous-ensembles flous de X équivaut à « remplir le carré ». Cela signifie également se déplacer du discret (quatre points) au continu (le carré plein)—une vivante illustration de l’abondance des sous-ensembles flous.
22La représentation des ensembles au moyen de points peut s’étendre à des dimensions plus grandes. Si X = {x1, x2, x3}, alors les sous-ensembles ordinaires de X sont représentés par les huit sommets d’un cube dans un système de coordonnées cartésiennes à trois dimensions, et la collection de tous les sous-ensembles flous de X remplit le cube entier. Les sous-ensembles flous d’un X infini peuvent être illustrés par les points d’un « hyper-cube » aux dimensions infinies.
LES OPÉRATIONS SUR LES ENSEMBLES FLOUS
23Revenons brièvement sur les ensembles ordinaires. Si A et B sont de tels ensembles, A est dit inclus dans B si chaque élément de A est aussi un élément de B. En symboles : A ⊆ B. Par exemple, l’ensemble des nombres premiers plus grands que 2 est inclus dans l’ensemble des nombres impairs, ceci traduisant dans le jargon des ensembles le fait que tous les nombres premiers plus grands que 2 sont impairs. La notion d’inclusion d’un ensemble peut s’exprimer par les fonctions d’appartenance, car nous avons A ⊆ B, précisément si
pour tout x dans l’ensemble universel, A(x) ≤ B(x) (1)
24En d’autres termes, A ⊆ B signifie que, étant donné n’importe quel x, le degré d’appartenance de x en A ne peut excéder son degré d’appartenance en B—en termes plus crus, A ⊆ B si aucun x ne peut se trouver dans A « plus » qu’il ne l’est dans B. Puisque que l’énoncé (1) est formulé dans le langage des fonctions d’appartenance, cela a du sens pour tous les sous-ensembles de X—, les flous aussi bien que les ordinaires. Ainsi, nous pourrons dire que le sous-ensemble flou A est inclus dans le sous-ensemble B si (1) est vrai.
25On peut utiliser une approche semblable pour étendre les opérations sur les ensembles (l’union, l’intersection, etc.) aux ensembles flous d’une façon naturelle. Nous devons tout d’abord faire remarquer que le degré d’appartenance de x dans A ∪ B est le plus grand (ou le maximum) des deux degrés A(x), B(x). En symboles :
A ∪ B (x) = max {A(x), B(x)} (2)
26De la même façon, le degré d’appartenance de x dans A ∩ B, qui est le plus petit (ou le minimum) de A(x), B(x), est exprimé par la formule :
(A ∩ B)(x) = min{A(x), B(x)} (3)
27Le degré d’appartenance de x dans le complément Ᾱ, s’obtient à partir de l’équation :
Ᾱ(x) = 1 - A(x) (4)
28(si x est dans A, A(x) = 0 ; si x n’est pas dans A, alors Ᾱ(x) = 1).
29Les trois équations ci-dessus ont encore du sens quand A(x) et B(x) sont des nombres entre 0 et 1, de sorte qu’elles peuvent être utilisées pour définir des opérations « floues » sur des sous-ensembles flous. L’équation (2), par exemple, indique que le degré d’appartenance de x dans l’union (floue) A ∪ B doit être le plus élevé des deux degrés A(x), B(x). La figure 1.5 illustre l’effet des ces opérations floues sur les graphiques des fonctions d’appartenance.
30Parce que les mêmes règles de combinaison s’appliquent, l’union floue (ou l’intersection) de deux ensembles ordinaires coïncide avec leur union (intersection) habituelle. Dans le jargon technique, on peut exprimer ce fait en disant que les opérations floues sont des extensions des opérations familières au domaine plus grand de tous les sous-ensembles flous de X. Et il en va ainsi pour un nombre infini d’autres combinaisons possibles de sous-ensembles flous. Par exemple, on peut construire un nouveau sous-ensemble flou C à partir de A et B en précisant que
C(x) = A(x)+B(x)-A(x) B(x) (5)
31Alors, un simple calcul confirme que, si A et B sont des ensembles ordinaires (c’est-à-dire que A(x) et B(x) sont forcément soit 0 soit 1), alors C’est leur union habituelle. Bien que beaucoup d’autres façons de combiner deux ou plusieurs sous-ensembles flous aient été proposées, seule une poignée d’entre elles se sont révélées d’un intérêt autre que théorique.
LE FLOU COMME LOGIQUE POLYVALENTE
32Le degré d’appartenance A(x) de x dans l’ensemble flou A est généralement perçu comme indiquant « dans quelle mesure » x est dans A. Mais A(x) peut aussi s’interpréter comme le degré de vérité de l’énoncé « x est dans A ». Pour un ensemble ordinaire, A(x) est soit 1 soit 0, selon que l’énoncé « x est dans A » est vrai ou faux. Mais si A est flou, la valeur de vérité de « x est dans A » peut être n’importe quel nombre entre 0 et 1. À titre d’exemple, prenons A comme étant l’ensemble flou des voitures chères. Si c est une voiture donnée, alors A(c) représente le degré selon lequel est vrai l’énoncé « la voiture c est chère ». De tels énoncés flous donnent une plus grande portée à la logique binaire traditionnelle en permettant un continuum de nuances de vérité.
33Voici un autre exemple. En 1991, Hitachi construisit le prototype d’un dispositif de sécurité (en fait, un réseau de neurones) qui peut apprendre à reconnaître les signatures. Il faut d’abord fournir trois échantillons d’une même signature en signant avec une plume spéciale sur un bloc-notes électronique. Chose intéressante, cette machine enregistre non seulement la signature en tant qu’objet graphique mais aussi l’allure de l’exécution de son tracé (plus précisément, les composantes verticales et horizontales du vecteur vitesse associé à la pointe de la plume). Celui qui essaiera de déjouer la machine devra alors contrefaire cette signature en la traçant à la même vitesse que son auteur. Pour que cette signature soit validée, on signe de nouveau sur le bloc-notes, la machine étant cette fois en mode « vérifier ». Après un bref intervalle, l’écran montre un nombre entre 0 et 1. Si ce nombre est 0,93, la ressemblance entre l’échantillon et la signature originale est de 93 %. On pourra interpréter ce résultat comme signifiant que l’énoncé « la personne qui vient de signer est Sandra Smith » a une valeur de vérité égale à 0,93—énoncé pas absolument vrai mais probablement assez vrai pour autoriser le retrait de 100 000 $ du compte de banque de Mme Smith.
PRÉCISION
Toute logique traditionnelle suppose que des symboles précis soient utilisés. Par conséquent, elle ne s’applique pas à la vie terrestre mais seulement à une existence céleste imaginaire.
(Bertrand Russell)5.
34Au royaume idéal des mathématiques, les choses sont certaines et précises, mais, dans le monde réel, la précision et la certitude absolues sont des denrées fort rares. Le rapport de la circonférence d’un cercle à son diamètre est exactement n, mais, dans nos calculs pratiques, nous devons nous satisfaire d’une approximation décimale. Les hauteurs d’un triangle parfait se rencontrent en un point précis, mais les triangles réels ne sont jamais parfaits et les points n’existent que dans notre imagination. Alors que les énoncés mathématiques sont ou vrais ou faux, les affirmations de la vie de tous les jours ne cadrent pas avec ce genre de dichotomie, car la vie se partage rarement—voire jamais—entre le noir et le blanc.
35Les horloges numériques, les compteurs de vitesse et les calculatrices de poche font clignoter des chiffres avec la clarté du cristal liquide. Mais quelle est la portée de ces chiffres et de quel degré de précision avons-nous vraiment besoin dans notre vie quotidienne ? Des concepts imprécis (l’amour, la justice, le mauvais, le joli, le gros, le drôle) remplissent nos pensées et notre langage. L’interprétation que fait le jury d’une notion aussi nébuleuse que celle de « doute raisonnable » peut, dans certains cas, être une question de vie ou de mort.
36L’éternelle quête philosophique de la connaissance et de la sagesse s’exprime dans le langage humain, donc dans un langage inexact. Gian-Carlo Rota, mathématicien au Massachusetts Institute of Technology, condamne les philosophes contemporains qui, dans leurs tentatives d’imiter les mathématiques, abordent les questions philosophiques avec ce qu’il appelle « le mythe de la précision »6. Il fait remarquer qu’un concept n’a pas besoin d’être rigoureusement précis pour être porteur de sens. « Notre raisonnement de tous les jours n’est pas précis, de dire Rota, mais il n’en est pas moins efficace. La nature elle-même, depuis les galaxies jusqu’aux gènes, est approximative et inexacte. » Et il ajoute : « Les concepts philosophiques sont parmi les moins précis. La signification de termes comme “esprit”, “perception”, “mémoire” et “connaissance” n’est ni fixe ni claire ; ils ont quand même du sens. »
37Le fait de quantifier un phénomène d’une façon à première vue précise le fait apparaître comme étant exact et bien compris. Dans une conférence donnée au Japon, Lotfi Zadeh cita un jour un article de journal selon lequel la probabilité qu’un tremblement de terre de magnitude 6 sur l’échelle sismique [de Richter] se produise dans les deux mois était de n %. « Les lecteurs de cet article, faisait-il observer, allaient avoir la fausse impression que le chiffre de 11 % (plutôt que 10 ou 12 %) était le résultat d’une connaissance suffisante des tremblements de terre. »
38Selon Zadeh, complexité et précision sont inversement proportionnelles, car au fur et à mesure que la complexité d’un problème augmente, la possibilité de l’analyser en termes précis diminue. Dès lors, une façon de penser floue peut être légitime, si elle rend possible la solution de problèmes trop complexes pour une analyse précise.
39Dans de nombreuses situations, la précision peut être onéreuse ou prendre trop de temps. Zadeh choisit comme exemple la tâche banale de garer une voiture. « D’habitude, un conducteur peut se garer sans trop de difficultés, parce que la position finale de la voiture n’est pas préalablement précisée. Si elle l’était, cela prendrait des jours et peut-être des mois pour garer sa voiture »7 Un exemple plus complexe est le codage des images numériques de la télévision par les techniques de compression des données. La perte d’une certaine précision dans la restitution de l’image, à peine perceptible à l’œil nu, est grandement compensée par l’augmentation de la vitesse de transmission. C’est cette tolérance envers l’imprécision que la logique floue exploite dans nombre de ses applications.
QU’EST-CE QUE LA LOGIQUE FLOUE ?
40Les consommateurs, en général, se blâment pour leur incapacité à utiliser des machines telles que les magnétoscopes, les fours électroniques, voire l’ordinateur personnel. Mais est-ce leur faute s’ils ne peuvent penser comme les machines—talent que les concepteurs de celles-ci semblent tenir pour acquis ? La logique floue sert, entre autres choses, à faciliter la construction de machines qui raisonnent davantage comme des êtres humains, afin que ces derniers n’aient pas à penser comme des machines.
41L’expression « logique floue » semble être une contradiction dans les termes : en effet, ce ne serait pas vraiment un compliment de dire à quelqu’un qu’il a une logique « floue » ! Dans son sens original et technique, la logique floue est une méthode mathématique, fondée sur la théorie des ensembles flous, qui permet aux machines de « raisonner » davantage comme des êtres humains. La logique floue est habituellement mise en place par un algorithme, ou programme, sur un ordinateur classique. Mais la méthode comporte aussi une composante subjective—dès lors, essentiellement empirique et inexacte—, car elle présuppose la traduction sous forme numérique de l’imprécision du langage et du savoir humains.
42Cette dualité—exact/inexact—de la logique floue est, je crois, une de ses forces, mais elle est aussi une source de malentendus. Beaucoup de critiques, de bonne foi ou non, n’en voient qu’un des aspects. « On prétend que la logique floue utilise des concepts vagues et des données imprécises. C’est faux », écrivait un lecteur mécontent de l’un de mes articles de vulgarisation8. Et il ou elle—les initiales ne le précisent pas—de continuer : « La logique floue saisit des données précises, analogiques, se livre à un traitement fantaisiste, pour ensuite produire des données de sortie analogiques précises. J’appelle cela traitement de signaux analogiques. » Ce lecteur a raison au fond, mais il (ou elle) omet de reconnaître le rôle que joue la logique floue dans l’élaboration de ce « traitement fantaisiste ».
43À l’autre extrême, il y a ceux qui critiquent le côté imprécis de la logique floue. Voici un extrait d’une autre lettre : « Bien entendu, la pensée simpliste peut convenir dans des cas simples, et la logique floue peut, en effet, programmer des ascenseurs et des machines à laver. Mais il en va de même pour les arguments probabilistes. Le vrai danger d’un raisonnement incohérent, à la mode, apparaîtrait s’il était appliqué à des objets importants tels que la sécurité aérienne ou le contrôle des réacteurs nucléaires. La pensée floue dans ces domaines se révélerait aussi dangereuse qu’inquiétante. »
44Une telle réaction est typique de ceux qui considèrent la logique floue non seulement comme une méthode spécifique (algorithme) mais comme une attitude ou une philosophie générale. Cette philosophie du flou a ses détracteurs aussi bien que ses adeptes. L’approche floue, lorsqu’elle est appliquée à la solution de problèmes pratiques, est, pour ses détracteurs, au mieux redondante et, au pire, irresponsable et dangereuse. La devise de ces critiques pourrait être : « Si c’est flou, cela ne peut pas être pris au sérieux. » Les « croyants », de leur côté, considèrent que la pensée floue est un puissant moyen de comprendre le raisonnement humain et de gérer la complexité du monde réel. C’est au Japon plus qu’ailleurs que cette fascination pour le flou s’est manifestée. « Le flou est inhérent à la culture japonaise », affirme Toshiro Terano, directeur du Laboratory for Fuzzy Engineering Research (LIFE) de Yokohama. Ainsi, ce n’est pas un hasard si les scientifiques et les ingénieurs japonais ont joué un rôle déterminant dans la mise au point des applications pratiques qui ont popularisé la logique floue. Terano voit dans la logique floue un outil et un nouveau paradigme pour résoudre des problèmes pour lesquels il est difficile, voire impossible, d’obtenir des modèles mathématiques exacts. « Comme outil, la logique floue peut capter la signification incertaine des mots et traiter la subjectivité et l’intuition du processus de la pensée humaine », fait-il remarquer.
45Le mot de la fin appartient à Lotfi Zadeh, le créateur du concept. Au printemps 1994, Zadeh écrivait : « Le terme logique floue est en fait utilisé dans deux sens différents. Dans un sens étroit, la logique floue est un système logique qui est une extension de la logique polyvalente et est destinée à servir comme une logique du raisonnement approximatif. Mais dans un sens plus large, la logique floue est plus ou moins synonyme de théorie des ensembles flous, c’est-à-dire une théorie des classes aux frontières diffuses. Ce qu’il importe de reconnaître, c’est que le terme logique floue est aujourd’hui employé principalement dans ce sens large »9.
46Cependant, Zadeh lui-même a admis récemment que le terme logique floue peut induire en erreur. S’adressant à des experts dans une rencontre internationale à l’Université de Californie (Berkeley) au printemps de 1996, il affirma : « Dans ce que nous faisons aujourd’hui (en logique floue), nous n’avons pas vraiment affaire à la logique. Nous nous servons des mathématiques, de la manipulation et de l’évaluation des fonctions ; mais, pas de la logique, à proprement parler, simplement du calcul »10. Une telle clarification pourra aider les lecteurs à résoudre la question que la plupart d’entre eux vont probablement se poser tôt ou tard : ceci est flou, c’est sûr, mais est-ce logique ?
Notes de bas de page
1 A. Einstein, « Prinzipien der Forschung, Rede zur 60. Geburstag von Max Planck » (1918), dans Mein Weltbild, Ullstein Verlag, 1977, pp. 108-109, (trad. Ideas and Opinions, New York, Crown, 1954, pp. 225-226). Tel que cité dans I. Prigogine et I. Stengers, Order Out of Chaos, Flamingo (Fontana Paperbacks), 1985, pp. 52-53.
2 L. A. Zadeh, « Fuzzy Sets », dans Information and Control, 8 (1965), pp. 338-356.
3 C. E. Shannon, « A Symbolic Analysis of Relay and Switching Circuits », dans aiee Transactions, vol. 57 (1938), pp. 713-723.
4 B. KOSKO, « Fuzziness vs. Probability », dans International Journal of General Systems, vol. 17, nos 2 et 3 (1990), Gordon and Breach Science Publishers.
5 B. Russell, « Vagueness », dans Australian Journal of Philosophy, 1 (1923), pp. 84-92.
6 G.-C. Rota, « The Pernicious Influence of Mathemathics upon Philosophy », dans Synthèse 88 (1991).
7 L. A. Zadeh, « The Calculus of Fuzzy If/Then Rules », dans AI Expert, vol. 7, no 3 (1992), pp. 23-27.
8 A. Sangalli, « Fuzzy Logic Goes to Market », dans New Scientist, vol. 133, no1807 (1992), PP. 36-39.
9 L. A. Zadeh, « Fuzzy Logic and Soft Computing: Issues, Contentions and Perspectives », Proceedings of the 3rd International Conférence on Fuzzy Logic, Neural Nets and Soft Computing, Iizuka, Japon, 1-7 août, 1994, pp. 1-2.
10 1996 Biennial Conference of the North American Fuzzy Information Processing Association nafips, Université de Californie, Berkeley, 19 au 22 juin, 1996, séance plénière.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Guide méthodologique universitaire
Un programme en 12 semaines
Aude Jimenez et Jamal-Eddine Tadlaoui
2011
Éloge du flou
Aux frontières des mathématiques et de l’intelligence artificielle
Arturo Sangalli
2001