Chapitre VI. Le dispositif comme structure spatiale
p. 101-119
Texte intégral
La vision sans point de vue
1Jusqu’ici, l’exploration a toujours pris pour référence le corps de l’observateur et s’est présentée comme une navigation multisensorielle sur les surfaces concrètes du dispositif. Or, constate Gibson, « les observateurs perçoivent l’environnement, et non simplement les surfaces projetées. On voit les choses dans leur intégralité, et les unes devant les autres1 ». La raison en est, dit-il, que l’observateur perçoit ordinairement le monde en se déplaçant et ne le voit donc « depuis aucun point d’observation et de ce fait ne peut, à proprement parler, remarquer les perspectives des choses […] le monde n’est pas vu en perspective2 ». Pour Shepard également, l’expérience que nous avons d’un monde entre les surfaces duquel nous nous déplaçons librement a construit notre système perceptif autour du « principe automatiquement appliqué selon lequel nous ne voyons pas le monde d’un point de vue spécial3 ». Personne n’imagine qu’un arbre soit un demi-cylindre ou qu’un visage se termine abruptement à son contour. Nous savons comment se continuent les arbres et les visages. De la perception d’un de leurs aspects nous déduisons automatiquement leurs autres aspects et nous les percevons comme pleinement tridimensionnels. Plus précisément encore, nous tendons à percevoir les grandeurs non pas telles qu’elles apparaissent sur la rétine, toujours changeantes et déformées par les lois de la perspective, mais telles qu’elles sont en général, indépendamment de tout point de vue : un mécanisme de constance des grandeurs stabilise l’aspect des objets et facilite leur reconnaissance. Quand nous éloignons ou approchons notre pouce des yeux, nous ne le voyons pas plus petit ou plus grand mais de taille constante. Pour la même raison, nous ne voyons pas ordinairement les objets en diminution perspective mais en perspective parallèle parce que notre système visuel corrige automatiquement la grandeur des bords éloignés et des fuyantes en fonction des distances et tend à redresser la forme, si bien qu’une boîte sur un bureau n’est pas vue comme trois trapèzes opaques sur un autre trapèze opaque mais comme un objet parallélépipédique posé sur un plateau rectangulaire. La correction s’applique dès qu’apparaissent les indices perspectifs d’une profondeur (c’est-à-dire presque toujours, en situation naturelle), d’où un certain nombre d’illusions géométriques quand ces indices apparaissent sur une surface plane4.
2Cette manière décentrée, ou allocentrique, de percevoir l’environnement se caractérise par une localisation relative, et non absolue, des objets et de leurs parties. Elle permet par exemple à l’observateur posté derrière une maison de dire à un interlocuteur situé de l’autre côté que tel objet se trouve non pas « à gauche derrière », mais « à droite devant la maison », c’est-à-dire de localiser l’objet par rapport à son vis-à-vis et à ses directions, et non par rapport à lui-même et à son propre référentiel corporel. Elle lui permet ainsi de « se mettre à la place » d’un observateur situé ailleurs par rapport à l’objet et donc confronté à une autre vision perspective5, autrement dit, capacité de première importance pour la perception d’un dispositif sculptural, de tourner mentalement autour de l’objet. Elle correspond également à une attention aux relations métriques objectives qui organisent les objets et l’environnement, par exemple, en sculpture, sous la forme de proportions. Le De Statua d’Alberti, consacré entièrement au problème technique de la mesure, se termine par un calcul des proportions du corps humain idéal. On voit ce même regard métrique à l’œuvre, de façon plus naturaliste, dans la manière dont Epstein établit les repères sur lesquels viendront se placer les modelés expressifs du portrait en cours :
« Le modèle arrive dans l’atelier, monte sur la table de pose, et je commence mon étude. Mon but, au début, est entièrement constructif. Avec une précision scientifique, je construis la forme de manière tout à fait froide et réfléchie, en installant les formations osseuses autour des yeux, l’arête du nez, la bouche et les pommettes, et en définissant les relations entre les différentes parties du crâne. Au fur et à mesure que le travail avance, je prends note de l’expression et des changements d’expression, et le caractère du modèle commence à s’imprimer en moi. À la fin, au terme d’un processus naturel d’observation, les caractéristiques mentales et physiologiques du modèle s’imposent d’elles-mêmes à l’argile6. »
3Ces deux manières, égocentrée et allocentrique, de percevoir l’environnement et ses objets semblent structurer profondément notre système perceptif et correspondre à un traitement neurologiquement différencié de l’information visuelle selon la tâche accomplie par l’observateur. L’expérimentation et l’imagerie par résonance magnétique fonctionnelle (IRMf) font en effet apparaître que les informations fournies par la rétine sont traitées par le cerveau de manière distincte selon que le sujet agit sur l’objet ou qu’il lui prête une attention de type cognitif. Une voie dorsale s’occuperait de l’information visuelle destinée au guidage instantané de l’action en cours, telle que manipuler ou intercepter l’objet, sans accès à la conscience, tandis qu’une voie ventrale s’occuperait de l’information destinée à des tâches perceptives telles que la reconnaissance d’objet et la planification à long terme d’actions, avec accès à la conscience et à la mémoire7. N’étant pas vouée à interagir physiquement avec les objets, mais à les discriminer et à les identifier, la vision pour la perception intègrerait un ensemble de mécanismes perceptifs (dont la constance des grandeurs et la localisation relative) permettant de percevoir l’objet avec ses qualités permanentes8, c’est-à-dire traiterait l’information de manière allocentrique. Cette voie ventrale serait alimentée en majorité par les cônes et les neurones traitant les formes en détail et les couleurs, et serait privilégiée dans l’hémisphère gauche, l’association avec le langage permettant de nommer les formes reconnues et d’accéder aux contenus sémantiques. Fortement égocentrée au contraire, la vision pour l’action localiserait l’objet de manière absolue par rapport au corps de l’observateur et tiendrait compte de son aspect réel sans se laisser influencer par le contexte : devant une illusion de type Titchener (un même cercle entouré de petits cercles est vu plus grand que s’il est entouré de grands cercles), la main se préforme correctement pour la saisie alors que l’œil est trompé. Cette voie dorsale serait alimentée en majorité par les bâtonnets de la vision périphérique et les neurones sensibles au mouvement et aux contrastes de luminosité, et servirait également à la surveillance de l’environnement9.
4C’est sans doute à une telle dissociation entre deux modes de traitement de l’information visuelle que l’on doit de voir le sculpteur interrompre régulièrement son action, prendre du recul et passer de la manipulation à l’observation, comme s’il constatait ce qu’un autre avait accompli. Mais le spectateur du musée est également concerné par cette hypothèse puisque la perception approfondie d’un dispositif sculptural demande d’alterner vision d’ensemble et vision proche, laquelle active les transformations sensorimotrices associées à l’action sur les formes, comme nous l’avons vu, et sollicite sans doute le codage par la voie dorsale de l’information visuelle. L’existence de deux voies distinctes de la vision laisserait penser que le temps de l’appréciation n’est pas un continuum, qu’il est au moins « physiologiquement non-unitaire » comme l’écrivent Goodale et Milner de l’attention générale à l’espace10. Le dispositif serait éprouvé de manière attentionnelle selon deux modalités de perception, l’observateur devant parfois se rendre « aveugle » à la conscience globale du dispositif comme objet pour se livrer à l’exploration morcelée des surfaces et s’ouvrir aux sensations haptiques, vestibulaires, etc. visuellement guidées qu’elles proposent, bientôt stockées dans la mémoire sous forme d’épisodes dont s’enrichit la vision d’ensemble de l’objet. Sans exagérer outre mesure cette concurrence entre deux modes de vision, puisqu’existent des mécanismes de coopération et d’interaction susceptibles d’être calibrés par l’apprentissage11, on peut penser que la perception finale d’un dispositif ressemble à une perception d’objet « augmentée », c’est-à-dire à une connaissance globale chargée du souvenir d’expériences sensibles, que celles-ci proviennent de l’exploration réelle de ce dispositif particulier ou d’épisodes antérieurement mémorisés sur des dispositifs analogues.
La structure interne
5L. R. Rogers fait du développement volontaire de la capacité ordinaire à percevoir les objets « dans leur intégralité » un aspect fondamental de l’appréciation du dispositif sculptural. Percevoir une sculpture, c’est percevoir un volume déployé dans l’espace, et le percevoir pleinement, c’est porter à la conscience une « structure interne » à laquelle on accède en mettant en relation entre eux les éléments volumétriques remarquables des surfaces de manière à constituer une représentation mentale globale de l’objet :
« Apprécier la sculpture revient en partie à observer les variations qui se produisent à la surface des volumes mais, beaucoup plus important, cela implique de mettre ces variations en relation et de les intégrer dans une appréhension des volumes comme formes expressives pleinement tridimensionnelles. Il ne s’agit pas seulement de prendre conscience des caractéristiques extérieures des volumes comme d’une série, en quelque sorte, d’événements qui entrent en relation sur le pourtour d’une surface. […] Ce qui caractérise la meilleure sculpture, c’est la présence d’une structure interne. Les modifications de la surface entrent en relation à travers les volumes autant que sur leur pourtour. […] les surfaces sont la manifestation extérieure d’une structure qu’il faut imaginer comme se continuant à travers toute la masse12. »
6Cette notion, qui concerne au premier chef les dispositifs-objets jouant de leur volumétrie (ce qu’on entend traditionnellement par sculpture), nous amène à nous demander plus précisément comment nous pouvons nous représenter « dans son intégralité », de façon consciente et soutenue, un dispositif tridimensionnel que nous ne voyons jamais que par une de ses faces, et à partir d’une image rétinienne bidimensionnelle. De nombreux auteurs, souvent dans des travaux portant sur la reconnaissance des objets, ont cherché à rendre compte des mécanismes perceptifs qui assurent cette récupération, mécanismes dont nous pensons que l’activation intentionnelle, lors d’une appréciation attentive, sous-tend la perception consciente du dispositif sculptural comme « structure interne ». Leurs recherches vont généralement dans le sens d’un appariement des indices perçus par les sens avec un modèle structural présent en mémoire, qui autorise un « remplissage perceptuel automatique13 » donnant accès à une représentation volumétrique globale de l’objet marquée par la constance perceptive.
7Pour que ces mécanismes s’enclenchent, il faut d’abord que le système perceptif procède à une décision d’objet, c’est-à-dire qu’il reconnaisse la présence dans l’arrangement optique d’un ensemble d’éléments formant un tout qui serait l’indice d’une entité tridimensionnelle, ce qui revient à fonder la conscience de l’objet à la fois sur celle d’une discontinuité et sur celle d’une organisation14. Pour cette dernière, Shepard insiste sur le rôle de la symétrie bilatérale, propriété que le système perceptif aurait au cours de l’évolution intériorisé comme invariant de la constitution des objets : « En effet, écrit-il, la symétrie bilatérale est une caractéristique courante de la plupart des constituants du monde vivant […] et de bon nombre de fabrications humaines. […] Qui plus est, tous les nombreux objets qui présentent globalement une symétrie de type circulaire […] engendrent une image rétinienne à symétrie bilatérale, quel que soit l’angle d’observation. En revanche, les images rétiniennes des espaces entre des objets ne sont symétriques que dans des conditions extrêmement improbables15. » L’hypothèse qui est faite automatiquement, écrit alors Ninio, « est que ce qui est symétrique appartient à un objet, qu’il n’y a donc pas lieu de le décomposer ; au contraire, il faut le considérer dans son unité, et lui attribuer un sens16 ». Ce sont les contours, ces frontières que le cerveau trace entre les zones de couleur, de luminance et de texture qui structurent l’arrangement optique, qui permettraient d’après Shepard cette attribution, et plus précisément la manière dont ils se rencontrent : en entrant en résonance avec une représentation d’objet mémorisée, ces jonctions bidimensionnelles, en fourche ou en flèche, en T ou en L, permettraient au système perceptif non seulement d’identifier l’objet, mais d’en inférer une représentation tridimensionnelle. Celle-ci serait alors soumise à toutes les transformations qu’imposerait à la forme l’exploration effective de l’objet, le cerveau ayant intériorisé l’auto-congruence manifestée à des degrés divers, et du fait de leur symétrie, par les objets lors des rotations et translations provoquées par leur déplacement ou par celui de l’observateur : « notre perception de la forme est peut-être fondée sur le calcul implicite de l’auto-similitude d’un objet soumis à toutes les transformations rigides possibles17 ». Notre connaissance de l’objet dans sa tridimensionnalité se construirait donc sur la rotation mentale automatisée d’une forme supposée symétrique, la plupart des objets (un visage par exemple) fournissant de fait de trois-quarts toutes les informations nécessaires à une saisie approximative mais globale de leur extension dans l’espace. L’automatisation de l’ensemble du processus répondrait à l’avantage évolutif d’être capable de détecter très rapidement la présence physique dans l’environnement de ce que Shepard nomme un « objet important », partenaire, proie ou prédateur.
8Biederman18 développe de manière proche une théorie de la reconnaissance des objets qui permet de rendre compte de la perception tridimensionnelle de formes complexes. Les fortes concavités (régions présentant une discontinuité particulièrement saillante, dans l’orientation des contours, pour le système visuel) et les symétries multiples présentes dans l’arrangement optique amènent l’œil à segmenter le stimulus détecté comme objet en composants élémentaires, chacun doté d’un axe qui l’organise et assemblé aux autres selon une configuration spatiale spécifique. Ces composants élémentaires, nommés géons (pour geometric ions), sont reconnus par le cerveau sous la forme de cônes régularisés, c’est-à-dire d’entités volumétriques produites par translation d’une section de forme constante, mais de taille variable, le long d’un axe donné (par exemple un cylindre est la translation d’un disque de taille constante sur un axe rectiligne). Le système visuel détermine l’axe du géon selon trois critères : il est de longueur maximale, il donne une symétrie et une constance de grandeur maximales à la section. Les traits distinctifs des géons sont au nombre de quatre : l’axe peut être droit ou courbe ; la section peut avoir des bords droits ou courbes ; elle peut être de taille constante, en expansion ou en expansion et contraction ; elle peut avoir une forme asymétrique, symétrique par réflexion ou symétrique par réflexion et rotation (fig. 26). Les volumes ainsi générés, au nombre de trente-six, sont reconnus dans leur extension tridimensionnelle grâce aux traits que ces propriétés confèrent de manière invariante à leurs contours bidimensionnels (colinéarité, courbure, parallélisme, symétrie, terminaisons en T, en Y ou en L). Les géons s’assemblent, « aux régions de forte concavité », en structures spatiales spécifiques selon des règles elles aussi en nombre fini : le géon est au-dessus, au-dessous, à côté de l’autre géon ; il est attaché à la section, à la surface latérale de l’autre géon, etc. (fig. 27). (Dans un système analogue, Marr considère que la structure est rendue lisible par la manière dont les axes des cônes généralisés se connectent entre eux, la direction générale de l’objet étant donnée par l’axe qui reçoit le plus de connexions, par exemple sur la figure humaine, celui du tronc19.) Le modèle permet de générer 74649 objets à deux géons et 154 millions d’objets à trois géons20. C’est en tant qu’assemblage spécifique de géons que les objets courants seraient reconnus au premier abord, de manière pré-attentionnelle, en 100 ms environ, par appariement de la représentation tridimensionnelle ainsi construite avec un assemblage répertorié en mémoire. Un objet nouveau (par exemple une sculpture abstraite) serait perçu et enregistré à travers une décomposition du même ordre, ce répertoire de « primitives géométriques21 », résumé intériorisé des propriétés formelles générales des objets, contraignant la perception. Seules les choses non nombrables comme l’eau, le sable, la neige, dont les contours dépendent d’une autre entité, seraient identifiées au premier abord par la texture et la couleur. Les objets nombrables possèdent leurs limites propres et spécifiques qui les font reconnaître en priorité. Certains objets « tels que les chevelures, les claviers de machine à écrire ou les tire-bouchons » pourraient être mémorisés et reconnus la fois par leurs composants volumétriques et par leurs zones de texture22.
Fig. 26. – Exemples de géons distingués par leurs propriétés non accidentelles. D’après Biederman, p. 122 et 123.

Fig. 27. – Un assemblage différent de composants semblables peut produire des objets différents. D’après Biederman, p. 119.

9L’appel à ce genre de modèle fondant la reconnaissance d’objet sur des primitives géométriques déduites de jonctions de contours semble particulièrement légitime pour rendre compte de la manière dont nous construisons l’extension tridimensionnelle d’un dispositif sculptural, abstrait ou figuratif, celui-ci n’étant pas autre chose qu’un objet rigide fabriqué par l’homme à fin de reconnaissance. Les sculptures de toutes les traditions articulent la plupart du temps de manière stable et rigide, au moyen de concavités marquées, des cônes généralisés plus ou moins géométriques ou naturalistes. Les zones de textures souples, comme les chevelures, les tissus ou l’eau, sont elles-mêmes rendues dans les sculptures figuratives par un assemblage statique d’objets géométriques, sphères percées au trépan, cylindres ondoyants parallèles, etc. C’est également en tant qu’assemblage de géons (ou quelque nom qu’on leur donne) que sont généralement pensées les sculptures, qu’elles soient figuratives ou abstraites, et que le sculpteur travaille « de tête » ou devant modèle : non seulement ses représentations mentales sont, autant que celles de l’observateur, vraisemblablement contraintes par un système de modèles internes analogue à celui que décrit Biederman, mais sa formation, dans les cultures les plus variées, repose explicitement sur l’apprentissage de formules simplifiées standardisées, ou sur le développement d’une capacité personnelle à traiter la complexité des formes naturelles « par le cylindre, la sphère, le cône », selon la célèbre formule de Cézanne23. Son travail effectif sur la substance débute presque toujours par une ébauche dont les formes simplifiées, articulées sur des dièdres concaves ou convexes marqués, devront « contenir » (pour la taille) ou « soutenir » (pour le modelage) les futurs modelés (fig. 41). Le sculpteur découpe en quelque sorte dans le bloc, ou monte dans l’argile, les formes de son dispositif de la même manière que sa perception isole au quotidien des objets dans l’arrangement optique. Génétiquement, son œuvre est une configuration rigide de représentations géométriques produite par ses capacités de reconnaissance. Quant à nous, observateurs, s’il est vrai, comme le soutient Shepard, que les œuvres d’art nous plaisent parce qu’elles satisfont « un mécanisme neural qui avait préalablement évolué à d’autres fins24 », ces objets rigides que les sculpteurs apparient à leurs représentations nous retiennent sans doute parce qu’ils manifestent ce que nous ne cessons de chercher lorsque nous scannons l’environnement, à savoir les précieuses régularités géométriques qui nous permettent de détecter la présence des objets importants, de les percevoir comme entités tridimensionnelles et de les identifier. L’intérêt pour l’extension volumétrique des formes serait ainsi, en réponse à l’exhibition du dispositif, la poursuite dans la durée et en pleine conscience des mécanismes automatiques de restitution de la tridimensionnalité constitutifs du processus d’identification.
10La pleine conscience du dispositif comme « structure tridimensionnelle déployée dans l’espace25 » se construit vraisemblablement, selon ce modèle, sur une attention sélective, discontinue et hiérarchisée aux informations fournies par les surfaces, puisque les jonctions (les régions les plus informatives du dispositif) l’emportent sur les contours, et les contours sur le contenu textural et coloré des surfaces, ce qui correspond au déroulé de construction du dispositif par le sculpteur. Pour ce qui est des contours, les expériences menées par Biederman sur des images dégradées montrent de fait que l’effacement des régions médianes affecte peu l’identification de l’objet, au contraire de celui des sommets, et surtout des concavités : en présence de ces seules terminaisons, même si le temps nécessaire à la reconnaissance augmente (jusqu’à 1s), le sujet reconstitue correctement la forme en procédant automatiquement à un « remplissage des contours […] par colinéarité ou courbe lisse26 », c’est-à-dire en continuant et en faisant se rejoindre les tronçons par un tracé théorique aux propriétés constantes qui rend possible l’appariement avec les représentations en mémoire. En leur absence en revanche, si le dessin ne présente que les parties médianes des contours, le même mécanisme de remplissage lui fait combler de manière erronée les concavités et interdit la reconnaissance, « quel que soit le temps passé à voir l’image27 ». L’attention aux contours est donc, comme le suggérait Shepard, en elle-même très inégalement répartie ; parce qu’ils sont porteurs de peu d’information et globalement peu fiables lorsqu’il s’agit d’identifier et de mémoriser une forme qui ne cesse de se déformer sur la rétine, le système perceptif s’appuie en priorité sur ce que Ninio appelle leurs « points d’arrêt28 » et Gibson les « invariants de structure29 », ainsi que sur leurs relations constantes. Sur ce même principe, les surfaces intérieures, généralement peu informatives sur l’identité de l’objet et soumises aux accidents dus à l’éclairement, sont, elles, quasi effacées de la conscience. Pendant l’exploration, le mouvement ultrarapide des saccades oculaires de point à point s’accompagne en effet d’un mécanisme inhibiteur, dit « de suppression saccadique30 », qui évite au cerveau de percevoir le glissement de la matière optique sur la rétine et le rend momentanément aveugle aux régions intermédiaires, les surfaces étant complétées par des équivalents de remplissage stabilisés relevant de la constance perceptive. La conscience du dispositif comme objet pleinement tridimensionnel peut donc être décrite comme une attention à une configuration d’événements volumétriques remarquables reliés par des surfaces aux propriétés de couleur, d’ombrage et de texture inévitablement perçues mais régularisées par la constance perceptive, analogues en somme, mais en trois dimensions, aux contours subjectifs d’un triangle de Kanisza (fig. 28). « Le cerveau, écrit Ninio, produit une surface plausible, rendant compte au mieux des frontières, par une sorte de création31. »
Fig. 28. – Triangle de Kanisza, illustration reproduite de La Science des illusions de J. Ninio.

11De toute évidence cependant, tout abstraite qu’elle soit, cette conscience du dispositif comme structure spatiale n’est pas celle de formes géométriques ou prototypiques pures (cylindre, sphère, coin ; en forme de citron, de corne, de calebasse) ni de principes organisationnels généraux (dessus, dessous) : même lorsque nous considérons un dispositif dans sa globalité et comme pur volume, nous percevons, sinon le détail des modelés (qui peut prendre l’allure d’une texture), du moins bon nombre de complications ou d’inflexions qui le distinguent des formes et des combinaisons prototypiques par lesquelles nous sommes tentés de le décrire. La perception d’un dispositif comme « structure interne » est sans doute la conscience à la fois des propriétés formelles et combinatoires générales qui sous-tendent le volume observé et de la manière particulière dont celui-ci les réalise, de la même façon que la lecture experte d’un sonnet de Baudelaire, par exemple, superpose la conscience de la forme fixe à la conscience de l’exemplaire. C’est sur un modèle de ce type que sont identifiées, selon Biederman, les formes complexes de section asymétrique : l’objet serait reconnu au premier abord comme catégorie par le seul trait général asymétrique vs symétrique (une aile d’avion), puis, dans un second temps seulement et grâce à un « examen minutieux », comme sous-catégorie (une aile de tel avion) par sa manière particulière d’être asymétrique, sans qu’il cesse d’être reconnu comme aile d’avion32. D’autres expériences, celles de Hamm et McMullen (1998), ont montré que l’orientation de l’objet n’a aucune incidence sur la vitesse de reconnaissance et de dénomination lorsqu’il s’agit de nommer les niveaux de base (« oiseau ») et superordonné (« animal »), selon la classification de Rosch, mais qu’elle en a une s’il s’agit de nommer le niveau subordonné (« canari »), l’opération étant alors ralentie par des explorations supplémentaires33. La reconnaissance des visages semble également fonctionner sur un même mécanisme de mise en relation à un prototype résumant nos perceptions antérieures de l’objet : l’exemplaire serait classé dans la mémoire, et reconnu, selon la manière dont il fait varier tel ou tel trait distinctif d’un « visage moyen » dérivé de toutes les représentations disponibles34. Si l’on présente au cours d’une expérience un ensemble de visages tirés d’un même prototype (non montré), les sujets reconnaissent ce prototype quelque temps plus tard erronément avec un haut degré de certitude. Si le traitement de l’information visuelle à des fins cognitives semble donc irrésistiblement tirer l’objet vers les représentations simplifiées stockées en mémoire, c’est sans doute sous la forme d’une tension entre catégorisation (réduction de l’objet à des propriétés générales) et observation que se construit la conscience du dispositif comme structure volumétrique. C’est sur ce modèle que Rogers décrit l’accès à la structure interne d’un volume simple (fig. 29).
« Les lignes de volume, les points de saillie et les plans du volume simple convexe de la figure 14 peuvent facilement être vus comme organisés autour d’un cube, et nous n’avons aucun mal à imaginer ce cube à l’intérieur du volume. Nous pouvons mettre ces traits superficiels en relation les uns avec les autres à travers l’intérieur de la forme et voir très clairement comment les changements de section, les coins arrondis et les points de saillie des six faces sont en rapport les uns avec les autres. En grande partie du fait de sa totale symétrie, il est facile d’appréhender sa structure complète comme un volume en ronde-bosse35. »
Fig. 29. – Schéma (« figure 14 ») de L. R. Rogers illustrant la citation.

12Cette mise en tension entre propriétés générales connues et propriétés particulières observées signifie sans doute une activation intense et dans sa globalité de la voie ventrale d’identification. L’enregistrement de l’activité cérébrale déclenchée par des tâches de catégorisation d’objets établit en effet la progressivité fonctionnelle de cette voie, depuis la très générale et grossière décision d’objet effectuée « dès la naissance de la voie occipito-temporale qui assure la reconnaissance des objets », jusqu’à la reconnaissance précise de l’exemplaire, « les zones recrutées [étant] de plus en plus antérieures à mesure qu’augmente la précision requise (jusqu’à la pointe temporale s’il s’agit de réaliser une identification précise d’un exemplaire)36 ». La pleine conscience de l’objet comme « structure tridimensionnelle déployée dans l’espace » s’obtiendrait donc, au cours d’une contemplation volontaire et soutenue, par l’activation intense et prolongée, au profit du seul objet contemplé, de la totalité d’une voie ventrale utilisée au quotidien de manière diffuse, partielle et discontinue en réponse aux incessantes entrées d’objets dans le champ visuel et selon la tâche exigée par l’objet ou l’action en cours.
13L’image plate fait appel aux mêmes mécanismes, bien sûr, d’une part pour être reconnue comme tableau, livre, c’est-à-dire comme objet, et d’autre part pour être reconnue comme représentant telle ou telle forme tridimensionnelle connue ou imaginée par l’artiste. Rappelons que les jonctions des objets apparaissent de manière bidimensionnelle sur la rétine, et que c’est sous la forme de dessins que sont présentés les tests de reconnaissance de Biederman. Comme le fait remarquer le psychologue Julian Hochberg : « Avec le dessin au trait, les artistes n’ont pas inventé un langage complètement arbitraire : ils ont découvert un stimulus qui est équivalent aux traits grâce auxquels le système visuel encode normalement les images des objets du champ visuel et qui guident l’activité intentionnelle37. » On notera cependant l’importance des propriétés données, dans le dessin, à ces jonctions pour la perception de la tridimensionnalité : des jonctions seulement bifides par exemple ne permettent pas de restituer correctement les volumes, comme on l’expérimente sans peine devant le dessin géométral d’une maison. En l’absence de la série complète des projections, et d’une formation d’architecte ou d’entrepreneur, il est pratiquement impossible pour l’observateur de restituer la tridimensionnalité d’un objet pourtant familier. Au mieux, il reconnaît le dessin pour un dessin de maison, mais n’expérimente pas la maison comme tridimensionnelle, dans son existence d’objet. Le même observateur n’aura en revanche aucune peine à percevoir « dans son intégralité » un solide quelconque, même farfelu, si le dessinateur le représente à l’aide de jonctions à trois branches. La qualité (la netteté, la complétude, etc.) des jonctions du dessin détermine donc l’intensité avec laquelle sera ressentie la tridimensionnalité38. La différence essentielle entre l’image plate et le dispositif sculptural, de ce point de vue, réside cependant dans le fait que l’aspect de l’objet n’est pas figé dans le second et que l’observateur doit (s’il le veut), par une exploration active au cours de laquelle il fait glisser les bords occluants et pivoter la structure, et par la mémorisation de ces observations, se construire une pleine représentation de la structure tridimensionnelle de l’objet. Un dessin propose une restitution toute faite d’un aspect de la structure, abstraite ou représentationnelle, qui suffit à l’appariement et peut même le faciliter en stabilisant les parties médianes des contours ; il ne propose pas d’élaborer activement une représentation mentale de la structure en poussant à leur maximum de capacité d’intégration l’ensemble des mécanismes perceptifs de reconnaissance d’objet.
L’exemple de Moore (The Archer)
14Les œuvres de Moore comptent parmi celles qui se prêtent le mieux à ce type d’attention, ayant été conçues et réalisées pour satisfaire à ce que l’artiste n’est pas loin de considérer comme définitoire de la sculpture. Mais son refus affiché des volumes secondaires39 n’a pas pour but de réduire les surfaces sensibles au rôle de simple voie d’accès à la structure spatiale du dispositif. Son intention semble plutôt de rendre momentanément « physiologiquement unitaire » l’attention au dispositif en liant de manière indissoluble les propriétés sensorielles de ses surfaces à la perception de sa structure d’objet. Dans ses dessins préparatoires, des traits de coupe se superposent ainsi souvent au rendu des ombres et des lumières pour faire apparaître les sections, propriétés volumétriques permanentes des formes, au milieu de la représentation des accidents dus au point de vue et à l’éclairement. Certaines œuvres abstraites tardives atteignent un tel degré de complexité dans l’interaction entre organisation spatiale et traitement sensoriel des surfaces qu’elles donnent envie de prendre au mot la formule de Gibson selon laquelle les œuvres non figuratives sont des « exercices de perception ».
15Three Ways Piece N° 2 : Archer40 (fig. 22 et 30 à 32) est un exemple révélateur de cet aspect du travail de Moore, et des difficultés que peut rencontrer l’observateur lorsqu’il veut à la fois reconnaître dans sa pleine tridimensionnalité un dispositif sculptural complexe et l’éprouver comme disposition de surfaces substantielles. C’est d’abord un objet sans référence dans le monde, malgré le sous-titre donné après coup, qui ne peut donc être apparié nettement à aucune représentation gardée en mémoire et demande un travail actif d’identification des formes. C’est aussi un objet sans symétrie bilatérale, qui interdit le remplissage par report des propriétés d’un côté sur l’autre, malgré la sorte de colonne qui porte l’ensemble et suggère sous certains angles ce type de symétrie. Le dispositif se présente comme un agrégat difficilement compréhensible de composants dont l’identité est pourtant marquée : la genèse de la maquette en plâtre fait apparaître des axes de symétrie partiels basculés, sur lesquels sont montés progressivement des volumes-géons (on distingue la rotation du rayon autour de l’axe qui construit la forme en coin), de sorte que la segmentation, et la caractérisation générale de chaque composant, se fait plus facilement que sur d’autres sculptures de Moore ; mais la représentation de la configuration globale est néanmoins difficile : une des faces porte par exemple deux extensions en porte-à-faux indécelables depuis le point d’observation opposé, et chaque composant s’écarte suffisamment de son prototype pour exiger une reconnaissance « en seconde lecture » qui retient l’attention et empêche une lecture globale aisée. L’objet ne présente pas non plus véritablement d’orientation canonique qui permette de le mémoriser et de le reconnaître à coup sûr depuis tous les points de vue. Moore a de fait conçu The Archer sans passer par le dessin41, lequel aurait sans doute stabilisé et expliqué la composition autour d’une vue préférentielle, mais en partant directement d’une forme tridimensionnelle tirée de sa collection de silex, selon une méthode qu’il décrit ainsi : « Je les regarde, je les manipule, je les observe de tous les côtés, éventuellement je les moule dans l’argile, je verse du plâtre dans le moule et j’obtiens un point de départ sous la forme d’un petit morceau de plâtre qui reproduit l’objet. Ensuite j’ajoute, je modifie42. »
Fig. 30 à 32. – Moore H., Working Model for Three Way Piece N° 2 : Archer, 1964, bronze, 776 × 788 × 652 cm, Tate Gallery, Londres.



16En continuant, tout au long de ce qui revient à un travail de « mise en ordre43 » des formes naturelles, à tourner entre ses mains une maquette de format volontairement réduit44, Moore se donne deux avantages qui tendent à faire de l’extension spatiale du dispositif l’occasion d’une expérience unifiée : il complète l’observation objective de l’objet comme structure dans l’espace par un ressenti haptique de poids, de forme, d’équilibre, de texture ; il complète, pour chaque point d’observation, la connaissance structurale et sensorielle de la face apparente par la connaissance simultanée de la face occluse, grâce au contact de la main. La collaboration intime de l’œil et de la main, travaillant tous deux en trois dimensions dès le « point de départ » de l’œuvre, lui donne ainsi accès à une connaissance instantanée véritablement tridimensionnelle du dispositif, et à la fois active et cognitive, chaque face étant tour à tour vérifiée de manière visuelle et tactile. Le sculpteur, explique-t-il dans un texte célèbre, « se représente mentalement une forme complexe sous toutes ses faces. Il sait, tandis qu’il regarde un côté, à quoi ressemble l’autre côté. Il s’identifie à son centre de gravité, à sa masse, à son poids. Il en pense le volume comme l’espace qu’elle déplace dans l’air45 ». L’intérêt pour la dimension sensorielle des formes se reconnaît au soin apporté au polissage des surfaces et à la patine que Moore réalise lui-même, mais surtout aux jonctions très tactiles entre les éléments formels de la structure spatiale : les concavités ne sont pas de simples points de rebroussement marquant une réunion de formes convexes, comme souvent dans la sculpture traditionnelle, mais de vraies surfaces, reliefs ou trajectoires contraignant le regard, qui introduisent une continuité sensuelle dans les points de segmentation et contribuent, pour l’observateur, à ralentir l’identification et la compréhension de la structure spatiale de l’objet. Dès sa naissance, le dispositif comme exercice de perception est fait pour demander « cet effort intellectuel et émotionnel que nécessite la compréhension de la forme dans sa pleine existence spatiale46 ».
17Aux difficultés liées à la perception s’ajoutent pour l’observateur celles de la mémorisation, rendue nécessaire par la nouveauté et la complexité de l’objet. Confronté au dispositif définitif, de grande taille, il est en effet contraint de remplacer la manipulation par une exploration visuelle au cours de laquelle il perd chaque fois contact, contrairement à Moore, avec la face qu’il vient d’occlure. Si la face qu’il a sous les yeux est une perception, la face arrière est un souvenir ; les faire s’échanger en faisant le tour du dispositif demande du temps, beaucoup plus que pour retourner entre ses mains un petit objet de plâtre. Or des expériences, menées à partir d’images, montrent l’extrême volatilité des sensations lorsque le cerveau est occupé à des tâches cognitives : « les sujets, explique Ninio à propos des tests de rotation mentale de Shepard, après avoir accompli 1500 épreuves d’identification sur un tout petit lot d’images, sont incapables de les redessiner de tête. L’épreuve terminée, les images ne laisseraient que de vagues souvenirs47 ». Les traits retenus sont alors de préférence ceux qui rappellent les représentations structurales déjà stockées : « on mémorise beaucoup mieux, continue Ninio, ce qu’on peut mettre en rapport avec des éléments déjà mémorisés. […] Dans la mémoire humaine, ce qu’on veut retenir doit pouvoir s’amarrer à des éléments préexistants, sur la base de leur similitude48 ». La chimère perceptive, mi-perception mi-souvenir, qu’est la « structure interne » d’un dispositif tel que Three Ways Piece N° 2 : Archer, aux surfaces opaques et complexes, ne peut se passer d’une forme de schématisation « écrasant » et régularisant la perception des volumes, en particulier, pour chaque point d’observation, les volumes arrière, assez rapidement ramenés à leur prototype (quelle est la situation, la forme et l’orientation exacte des deux protubérances en porte-à-faux ?). L’observateur d’un dispositif sculpté peut compter sur une mémoire corporelle des formes, nous l’avons vu. Mais sans doute faut-il beaucoup de temps passé sur le pourtour des surfaces, et une expérience sensorielle riche et marquante de leurs reliefs et de leurs trajectoires, pour que la somme des souvenirs physiques rappelés à la conscience puisse apporter ce que la main avait apporté au sculpteur, à savoir le sentiment, teinté de plénitude, d’unifier la perception dans « l’exploration du monde de la forme pure49 ». L’idéal poursuivi par Moore d’une saisie omnisciente de l’objet révèle en creux ce qui différencie le dispositif sculptural de l’image : l’impossibilité de fait qu’il atteigne nos sens comme globalité. Sa perception renvoie à la condition très humaine de vivre dans un monde tridimensionnel depuis un point d’observation, fût-il complété par les mécanismes de remplissage.
Notes de bas de page
1 Gibson J. J., Approche écologique de la perception visuelle, op. cit., p. 143. Il ajoute p. 144 : « Je suggère qu’il est possible de percevoir des surfaces qui sont temporairement soustraites au regard […]. Le fait important est qu’elles s’offrent d’abord au regard avant de s’y soustraire. »
2 Ibid., p. 305-306.
3 Shepard R. N., L’Œil qui pense, op. cit., p. 178.
4 Sur ce sujet voir Ninio J., L’Empreinte des sens, op. cit., et Shepard R. N., op. cit., p. 132-219, et particulièrement p. 137-138.
5 Voir par exemple Gibson J. J., Approche écologique de la perception visuelle, op. cit., p. 310.
6 Epstein : An Autobiography, Londres, 1955, p. 69. Cité par Rogers L. R., op. cit., p. 206.
7 Goodale M. A. et Milner A. D., « Separate visual pathways for perception and action », TINS, vol. 15, n° 1, 1992, p. 20-25. Voir aussi Ninio J., La Science des illusions, Paris, Odile Jacob, 1998, p. 195.
8 Ninio J., L’Empreinte des sens, op. cit., p. 106 et 166 : « La constance de la grandeur n’est qu’une loi dans l’arsenal des lois perceptives qui tendent à neutraliser les variations de l’environnement. […] Il existe des aires spécialisées pour les couleurs où les neurones répondent à la couleur absolue, celle qui pénètre l’œil, et des aires où les neurones répondent à la couleur relative, la couleur réelle des objets, même quand elle est masquée par des éclairages trompeurs. On retrouve donc au niveau des neurones cette loi de la perception qui fait qu’on sait reconnaître les qualités permanentes des objets, indépendamment de leur éclairage ou de leur position. »
9 Feldmeyer J.-J., op. cit., p. 309.
10 Goodale M. et Milner A. D., « Separate visual pathways for perception and action », art. cité, p. 24.
11 Goodale M. et Milner A. D., loc. cit.
12 Rogers L. R., op. cit., p. 48. Dans une logique organique, Rogers propose de voir dans cette structure interne la suggestion de forces intérieures responsables de la conformation de la surface. Nous utilisons l’expression de manière plus générale pour désigner la composition volumétrique du dispositif considéré comme objet ayant une certaine forme, hors de tout rapport avec le point de station de l’observateur ou avec l’environnement et ses événements (éclairement, etc.).
13 Shepard R. N., « Ecological Constraints on Internal Representation : Resonant Kinematics of Perceiving, Imagining, Thinking, and Dreaming », Psychological Review, vol. 91, n° 4, octobre 1984, p. 426. Berthoz A. dans Le Sens du mouvement, op. cit., p. 143, rend compte de la théorie de Shepard. Ninio J., La Science des illusions, op. cit., chap. viii : « Complétions, créations », p. 87-96, présente de nombreux exemples de « remplissage perceptuel automatique ».
14 Sur l’idée d’une décision d’objet s’effectuant avant toute reconnaissance précise, sur la base de « principes de plausibilité » très généraux, voir Bruyer R., op. cit., p. 40-41 : « Au moyen d’une procédure TEP, Kanwisher et al. (1997) ont validé l’idée déjà établie en psychologie cognitive selon laquelle le système perceptif, mis en présence d’un stimulus visuel complexe, évalue d’abord s’il s’agit d’un objet ou non. […] Il y aurait donc, dès la naissance de la voie occipito-temporale qui assure la reconnaissance des objets, une structure cérébrale sous-tendant les opérations initiales de “décision d’objet”. »
15 Shepard R. N., L’Œil qui pense, op. cit., p. 209.
16 Ninio J., La Science des illusions, op. cit., p. 80.
17 Shepard R. N., op. cit., p. 210. Si cette idée de rotation est discutée, d’après Berthoz A. cependant (La Décision, op. cit., p. 209) : « par des méthodes d’imagerie optique de portions du cortex IT [inféro-temporal] chez le singe, on a récemment observé que, dans une zone d’environ 1 mm2, des neurones codent les aspects successifs d’une forme ou d’un visage, par exemple selon plusieurs points de vue. […] Les visages et certaines parties du corps sont donc codés par des neurones uniques qui sont actifs lorsqu’on présente à l’animal un point de vue donné ».
18 Biederman I., « Recognition-by-Components : A Theory of Human Image Understanding », Psychological Review, 1987, vol. 94, n° 2, p. 115-147.
19 Bruyer R., op. cit., p. 26.
20 Biederman I., « Recognition-by-Components », art. cité, p. 128.
21 Ibid., p. 116.
22 Ibid., p. 118, n° 3 et p. 135.
23 Lettre à Émile Bernard du 15 avril 1904.
24 Shepard R. N., L’Œil qui pense, op. cit., p. 194. Voir aussi p. 208-217 : « La sensibilité aux symétries spatiales ».
25 Rogers L. R., op. cit., p. 37.
26 Biederman I., « Recognition-by-Components », art. cité, p. 135.
27 Ibid., p. 136.
28 Ninio J., L’Empreinte des sens, op. cit., p. 92.
29 Gibson J. J., Approche écologique de la perception visuelle, op. cit., p. 140 ; voir aussi p. 431 : « les invariants résident dans la manière, difficile à décrire verbalement, dont les zones sont emboîtées, non dans la forme de ces zones. Les connexions, jonctions et intersections de lignes restent invariantes sous une perspective changeante sur les surfaces ».
30 Berthoz A., Le Sens du mouvement, op. cit., p. 212.
31 Ninio J., L’Empreinte des sens, op. cit., p. 92-93. Les illusions présentées par Ninio (dont ce triangle de Kanisza) montrent que le cerveau ne complète pas les figures en reliant point par point les éléments disponibles (par interpolation), mais qu’il crée une forme géométrique continue et régulière (par exemple un cercle parfait au lieu du polygone qui serait obtenu par interpolation).
32 Biederman I., « Recognition-by-Components », art. cité, p. 123.
33 Bruyer R., op. cit., p. 30-31. L’organisation en trois niveaux est proposée par Rosch E., « Cognitive representations of semantic categories », Journal of Experimental Psychology : Human Perception and Performance, 1 (1975), p. 305-322. « Pour [Rosch], explique Bruyer, le niveau de base (exemple “table”) est celui où le concept a le plus d’attributs distinctifs, partage le moins d’attributs avec les autres concepts du même niveau, est acquis en premier lieu durant le développement, et est le plus sollicité dans les activités cognitives. Le niveau superordonné est le niveau immédiatement supérieur, dont fait partie le concept du niveau de base (“meuble”). Enfin, le niveau subordonné spécifie une sous-catégorie particulière du niveau de base (“table de salon”). Ces distinctions en trois niveaux pourraient être fonction de différences individuelles – “canari” n’est pas au même niveau pour l’homme de la rue et l’ornithologiste – y compris culturelles. »
34 Bruyer R., op. cit., p. 75.
35 Rogers L. R., op. cit., p. 58.
36 Bruyer R., op. cit., p. 40 et 42.
37 Hochberg J., « La représentation des objets et des personnes », in Gombrich E. et al., Art, Perception and Reality, John Hopkins University Press, 1972, p. 70 (cité par Danto A., op. cit., p. 133).
38 En lien sans doute avec la rapidité d’identification, qui en fait un processus pré-attentionnel. Voir l’étude de Gaillard J.-P., Boulliou R. et Gautier Ch., « Théorie des géons et interprétation quantitative dans une tâche d’identification d’objets », L’Année psychologique, 1996, vol. 96, n° 4, p. 561-586 : « l’aspect qualitatif des éléments de la structure, et pas seulement leur nombre, a un effet sur l’identification des objets » (p. 583).
39 Moore H., « Notes sur la sculpture », art. cité, p. 19.
40 Nous nous appuyons pour cette analyse sur le dossier de synthèse réalisé pour la Tate par Alice Correia, auquel nous empruntons les citations de Moore.
41 « Les idées derrière une pièce comme The Archer ne peuvent tout simplement pas être dessinées ; sa manière d’exister dans l’espace est trop complexe. Il n’y a donc pas de dessin préparatoire à The Archer. Du début à la fin l’œuvre existe en trois dimensions » (Russel J., Henry Moore, Londres, Penguin Books, 1973, p. 233).
42 « Henry Moore talking to David Sylvester », 7 juin 1963, diffusé sur la BBC le 14 juillet 1963.
43 Moore H., « Notes sur la sculpture », art. cité, p. 27.
44 « La maquette ne faisant que huit à dix centimètres, je peux la prendre en main, la retourner pour la regarder d’en haut, d’en bas, bref sous tous les angles » (Levine G., With Henry Moore : The Artist at Work, Londres, Sidgwick & Jackson, 1978, p. 123).
45 Moore H., « Notes sur la sculpture », art. cité, p. 17.
46 Moore H., loc. cit.
47 Ninio J., L’Empreinte des sens, op. cit., p. 142.
48 Ibid., p. 204.
49 Moore H., « Citations », publié dans Circle, international survey of constructive art, Londres, 1937, trad. J. Salesse Lavergne, Notes sur la sculpture, Paris, L’Échoppe, p. 44.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Comprendre la mise en abyme
Arts et médias au second degré
Tonia Raus et Gian Maria Tore (dir.)
2019
Penser la laideur dans l’art italien de la Renaissance
De la dysharmonie à la belle laideur
Olivier Chiquet
2022
Un art documentaire
Enjeux esthétiques, politiques et éthiques
Aline Caillet et Frédéric Pouillaude (dir.)
2017