Chapitre II
Analyse des éléments de narrativisation participant à orienter la diégèse
p. 58–119
Texte intégral
1. Introduction
1Le premier groupe d’éléments de narrativisation que nous envisagerons rassemble les différents aspects du jeu qui soutiennent le récit enchâssé (c’est-à-dire, pour rappel, le récit qui est déterminé à l’avance par les concepteurs et sur lequel le joueur ne peut avoir qu’une influence indirecte) : les cinématiques, le texte, l’avatar, les personnages et les renvois intertextuels. Ces éléments sont ceux dont le potentiel narratif est le plus évident (instinctivement, la plupart des gens réduisent d’ailleurs le récit des jeux à leurs seuls dialogues et cinématiques). Nous nous intéresserons, cependant, aux moyens par lesquels ils peuvent orienter un cosmos pour en faire une diégèse. En effet, par le récit qu’ils développent, ces éléments opèrent dans l’univers une coupe, une sélection des facettes qui seront présentées au joueur : ils taillent le cosmos et organisent ses différents aspects pour leur donner une cohérence qui est essentiellement narrative61.
2Sur ce point, ils se distinguent donc des éléments de narrativisation regroupés dans le chapitre suivant (ceux qui font de la diégèse une ludiégèse) qui, eux, tendent plutôt à alimenter l’univers, à l’influencer ou à modifier son statut qu’à l’orienter de manière déterminante. Certains participent bel et bien à cette sélection organisatrice mais ne peuvent en général la porter à eux seuls (le caractère « diégétisé » de l’interface de Skylanders: Spyro’s Adventure62, par exemple, ne peut être compris que grâce à la cinématique d’introduction). L’importance de la seconde catégorie d’éléments de narrativisation ne doit pourtant pas être minimisée car, par nature, le jeu vidéo n’est pas uniquement une diégèse : il est aussi une ludiégèse. On ne peut donc ignorer l’impact que les éléments du jeu ont sur la construction et la réception de l’univers représenté. Tout comme l’interactivité et la narrativité, les deux catégories d’éléments dessinées ici s’influencent mutuellement et les effets qu’ils produisent ne sont isolables qu’en théorie.
2. Les scènes cinématiques
3Le terme de « scène cinématique » (ou cut-scene) désigne une séquence vidéo non jouable qui peut être mobilisée pour servir de transition ou pour souligner les moments marquants du scénario d’un jeu. Ces scènes non interactives peuvent être divisées en deux sous-catégories.
4La première (à laquelle on réserve plus souvent le terme « cut-scene »), regroupe les scènes créées à partir du moteur graphique du jeu, qui conservent donc la même apparence que les phases jouables et ne s’en distinguent que par leur non-interactivité. La seconde rassemble les séquences vidéo pré-rendues (il s’agit de ce que l’on entend généralement par « cinématiques »), qui ne sont pas calculées par le jeu en temps réel et peuvent donc bénéficier des dernières avancées en matière d’animation63. Dans les deux cas, ces séquences constituent des ruptures dans l’expérience de jeu, car elles rompent temporairement l’embrayage64 kinésique qui relie le joueur à son avatar et replacent le premier dans la position de spectateur passif.
5Une différence de degré distingue cependant les deux catégories de scènes évoquées ci-dessus (même si cette différence tend à disparaître avec les avancées technologiques récentes) puisque les cut-scenes réalisées grâce au moteur du jeu assurent une continuité visuelle avec les phases jouables, tandis que les cinématiques sous formes de vidéos incrustées constituent des coupures plus radicales, en raison du fort contraste graphique et esthétique qu’elles occasionnent. Les captures d’écran du jeu de rôle Final Fantasy VIII peuvent illustrer l’importance potentielle de ce décalage.

Figure 2. Cut-scene de Final Fantasy VII qui utilise le moteur graphique du jeu
6
Figure 3. Cinématique de Final Fantasy VIII
7Dans le point suivant, nous tâcherons donc d’énoncer, dans un premier temps, des remarques générales valables pour ces deux types de scènes65, puis, dans un second temps, de détailler ce qui les différencie.
2.1. Scènes cinématiques et jeu
2.1.1. La rupture de l’interactivité
8La caractéristique principale de toute scène cinématique de jeu vidéo est donc qu’elle constitue une rupture dans l’interactivité. Cette coupure entraîne, inévitablement, un changement radical des codes de représentation : les éléments de narrativisation qui, auparavant, faisaient de l’univers figuré une ludiégèse sont désinvestis de leur fonction ludique et reprennent un rôle plus traditionnel dans le discours audiovisuel (les objets deviennent des décors, l’avatar devient un simple personnage, etc.). Cette transposition modifie brutalement le mode selon lequel le joueur est immergé dans la fiction, puisqu’il passe d’acteur-énonciateur à simple spectateur : il est, en quelque sorte, temporairement projeté hors d’un univers dans lequel il s’incluait précédemment par ses gestes. En mettant l’univers et le joueur face à face, cette coupure rappelle donc au récepteur qu’il se trouve devant un programme informatique. Les scènes cinématiques introduisent dans le jeu un va-et-vient qui contraint le joueur à changer régulièrement de position vis-à-vis de l’univers, et ainsi à cerner plus globalement la manière dont il est orienté. De plus, la rupture de l’embrayage kinésique déresponsabilise temporairement le joueur par rapport à l’action en cours, ce qui lui donne plus de recul, de marge, pour prendre position face à celle-ci.
9Puisqu’elles sont des ruptures, les scènes non interactives participent également à rythmer le jeu : elles y introduisent des périodes d’inaction qui constituent bien souvent, pour le joueur, des moments de repos (d’autant plus qu’elles précèdent ou suivent généralement des phases de forte tension ludique : un affrontement difficile, la fin d’un niveau, etc.). Or, d’un autre point de vue, ces scènes servent également à ponctuer les moments forts du récit66 : en ce sens, elles substituent donc à la tension créée par la difficulté du jeu une tension exclusivement dramatique, et constituent ainsi le point de rupture entre la ludiégèse (l’univers régi par le jeu) et la diégèse. En somme, par leur simple présence — et nous verrons qu’il en est de même pour les textes — ces séquences établissent pour le jeu une certaine structure narrative en divisant le récit en phases (la grande majorité des jeux s’ouvrent et se terminent d’ailleurs par une vidéo, ce qui témoigne de leur statut de limites).
10Certaines œuvres ont, néanmoins, joué sur cette non-interactivité présupposée des scènes cinématiques pour déstabiliser le joueur. Dans le survival horror Resident Evil 467, par exemple, les scènes du récit enchâssé participent, à leur façon, à construire l’ambiance angoissante propre à l’univers du jeu et ce, de deux façons.
11Premièrement, elles tablent régulièrement sur l’inaction qui leur est propre pour faire naître chez le joueur un sentiment d’impuissance : c’est le cas, par exemple, lorsque les scènes non jouables montrent ostensiblement l’approche d’un danger, sans laisser au joueur la possibilité de reprendre le contrôle de son personnage et de réagir. La deuxième scène du chapitre 1–1, par exemple, montre la première rencontre du protagoniste, Leon, avec l’un des villageois contaminés. Tandis que l’avatar détourne la tête pour ranger dans sa poche la photo de la jeune fille qu’il recherche, un plan accompagné d’une musique sinistre montre ostensiblement au spectateur le villageois en train de se saisir d’une hache. Ce procédé — courant au cinéma — gagne ici une force particulière, en raison du contraste que la scène représente par rapport au reste du jeu (où le joueur est aux commandes). De plus, au moment où la situation devient réellement critique (lorsque le villageois attaque Leon), le joueur reprend soudainement le contrôle de son personnage, et, avec lui, la responsabilité de surmonter ce danger. Le trop-plein d’informations narratives reçues dans les passages non joués n’est, en d’autres termes, qu’une manière d’ironiser sur l’impuissance temporaire du joueur (qui ne peut transmettre sa compétence à l’avatar) et de faire monter la tension dramatique des événements afin de la rendre suffisamment marquante pour qu’elle le poursuive dans ses actions postérieures.
12La seconde particularité des scènes cinématiques de Resident Evil 4 est qu’elles utilisent, à l’occasion, des phases Quick Time Event (ou QTE). Ce procédé consiste à mobiliser le joueur durant les séquences non jouables en lui demandant de presser rapidement certaines combinaisons de touches pour permettre à l’événement de se poursuivre. Ainsi, dans la première scène du chapitre 1–2, alors qu’un villageois contaminé s’apprête à abattre sa hache sur le protagoniste (qui est en pleine conversation avec l’un des rares personnages amicaux du jeu), une commande textuelle apparaît soudainement à l’image, sommant le joueur de presser deux touches pour esquiver le coup (voir figure 5).

Figure 4. Deuxième scène du chapitre 1–1 de Resident Evil 4, dans laquelle le joueur assiste, impuissant, à l’attaque d’un villageois juste avant de reprendre les commandes de son personnage

Figure 5. Première scène du chapitre 1–2 de Resident Evil 4, où le joueur est sommé d’appuyer sur les touches « A » et « B » pour esquiver un coup durant une cinématique
13Si le joueur réussit la manipulation, le protagoniste parvient à éviter la hache et la séquence se poursuit. Dans le cas contraire, celui-ci meurt d’une façon spectaculaire et le jeu affiche un game over. Ce dispositif joue efficacement sur les habitudes du joueur, qui est plutôt accoutumé à appréhender les scènes cinématiques comme des phases de repos (particulièrement convoitées dans un jeu d’horreur, où la tension est omniprésente). Or, dans ce cas-ci, la présence des QTE interdit au joueur de lâcher sa commande pour apprécier passivement la mise en scène : celui-ci doit constamment rester sur le qui-vive, appréhender ces séquences en joueur68, puisqu’il est impossible de prévoir quand le jeu lui demandera d’interagir. Tout, dans cette œuvre, contribue donc à construire un univers hostile, puisque même le récit enchâssé n’est plus sécurisant. Par ailleurs, l’introduction d’une part d’interactivité dans ces scènes — bien que très limitée — introduit une transgression peu courante : l’échec du joueur est, ici, inclus dans une composante du récit enchâssé (puisque, dans le cas où le joueur rate la manipulation demandée, la mort du protagoniste est intégrée à la cut-scene). Ces échecs ont un statut ambigu, entre récit vidéoludique (puisqu’ils ne maintiennent pas la cohérence narrative, ne font pas réellement partie de l’histoire) et récit enchâssé (par leur inscription dans les scènes cinématiques) : la possibilité de leur existence influence donc la représentation que le joueur se fait de l’univers et de son propre parcours. Cette transgression de niveaux est source d’angoisse, car le danger poursuit le joueur jusque dans les phases sur lesquelles il n’a aucun pouvoir. Dans un sens, ces séquences rompent la majeure partie du pouvoir-faire du joueur, tout en établissant un devoir-faire absolu (appuyer sur les touches), ce qui place celui-ci dans une position de totale soumission au jeu. C’est là le principe même du survival horror, genre dans lequel le protagoniste (et, avec lui, le joueur) entretient avec l’univers un rapport de profonde vulnérabilité (les vies et munitions sont limitées, l’avatar évolue dans des environnements inconnus, est totalement isolé, etc.). Notons cependant que la transgression entre récit vidéoludique et récit enchâssé est également source d’ironie : le fait, pour le joueur, de voir son avatar se faire décapiter pendant une scène non jouable peut effectivement être reçu comme une trahison vis-à-vis des conventions, un pied de nez de la part de l’univers ludique.
14En résumé, le simple statut non ludique des scènes cinématiques n’est pas sans incidences sur la représentation de l’univers et, principalement, sur la façon dont le joueur y est inclus : la présence ou l’absence, mais aussi la disposition de ces scènes (avant ou après une phase de jeu importante, etc.) rythment le récit, organisent l’univers en séquences, l’orientent et prédéterminent le mode selon lequel le joueur va l’actualiser.
2.1.2. Cut-scenes et cinématiques
15Ces différents effets varient également — comme nous l’avions annoncé — selon que ces scènes sont présentées sous la forme de cut-scenes gérées par le moteur du jeu ou de cinématiques à proprement parler.
16Dans le premier cas, on l’a vu, une continuité graphique est établie entre le jeu et les phases non jouables. Le joueur reste donc, d’une certaine façon, inclus dans l’univers par le biais de son regard (qui reste constant). Ces scènes continuent d’ailleurs bien souvent de construire leur spectateur comme un joueur (comme dans l’exemple de Resident Evil 4 ci-dessus) et participent à rapprocher le récit qu’elles véhiculent du statut de récit vidéoludique : le joueur, n’étant pas expulsé du jeu aussi fermement que dans les cinématiques, peut garder la sensation d’avoir une emprise sur les événements. Dans certains cas, il arrive même que les concepteurs lui laissent la maîtrise de ses mouvements ou de la caméra pendant ces séquences (le FPS Half-Life a, par exemple, fait de cette interactivité conservée sa marque de fabrique, en présentant presque exclusivement, non pas des cut-scenes, mais des « séquences scriptées » pendant lesquelles le joueur peut continuer à se déplacer).
17À l’inverse, les cinématiques vidéo (qui introduisent un fort contraste esthétique avec le reste du jeu) construisent pour le joueur une position de spectateur : leur mise en scène s’organise par rapport aux événements représentés, au récit, et non plus autour d’un regard qui serait interne à l’univers. Malgré cette rupture, ces séquences n’ont pas pour effet d’engendrer un détachement vis-à-vis de la diégèse, mais plutôt une immersion d’un ordre différent : celle-ci se fait, non plus sur le mode de l’exploration, mais sur celui de la contemplation car les cinématiques, par leur beauté graphique, entraînent une forte esthétisation des éléments de l’univers. Ce phénomène a pour effet général de donner au récit enchâssé le statut de récompense, mais aussi d’appuyer l’immuabilité, l’autonomie de ce récit vis-à-vis du joueur (puisqu’il est radicalement séparé des phases de jeu). Enfin, des cinématiques impressionnantes sont souvent utilisées pour inscrire de manière frappante le récit ou l’organisation de l’univers dans l’esprit du joueur, dans les jeux où ces éléments narratifs ne seront plus rappelés par la suite : le jeu de stratégie en temps réel Command & Conquer : Alerte Rouge, par exemple, présente un contraste important entre les graphismes des phases jouées (le titre date de 1996) et les cinématiques, qui sont tournées avec des acteurs réels. Cet écart permet de présenter le scénario69 de manière suffisamment marquante pour qu’il reste à l’esprit du joueur durant les campagnes, où l’aspect narratif est réduit à son minimum.
18En conclusion, avant même de nous intéresser au récit qu’elles transmettent, il semblait essentiel d’évoquer le rapport que les scènes cinématiques entretiennent avec les phases de jeu. En effet, la prise en compte de cette relation est primordiale pour comprendre en quoi ces séquences ne peuvent être totalement assimilées à du cinéma : bien qu’elles lui empruntent nombre de ses conventions, les scènes cinématiques vidéoludiques conservent certaines spécificités dues au fait qu’elles ne participent pas uniquement à orienter une diégèse, mais s’inscrivent aussi dans une ludiégèse.
2.2. Scènes cinématiques et narration
19Les scènes cinématiques constituent, avec le texte, l’un des deux principaux supports du récit enchâssé (c’est-à-dire de la part de narration qui n’est pas soumise à l’action du joueur). Ces séquences étant éminemment narratives, l’application à leur analyse des concepts narratologiques traditionnels (focalisation, ocularisation, auricularisation…) permettrait sans aucun doute d’obtenir des résultats convaincants : il existe, en effet, de nombreuses scènes cinématiques travaillées artistiquement qui constitueraient des objets fructueux pour ce type d’approche. Néanmoins, dans le but de rester fidèle à notre problématique de départ, nous éviterons de nous attarder ici sur la façon dont les scènes cinématiques élaborent un récit linéaire (puisque cette élaboration peut être décrite via des outils classiques) pour nous concentrer davantage sur la manière dont ce récit enchâssé oriente l’univers, et ainsi mieux mesurer les limites du rôle qu’il y joue.
20En effet, les scènes cinématiques sont, dans le jeu vidéo, à la base de l’orientation subie par la diégèse. Leur nature cinématographique leur permet de remplir ce rôle avec une force particulière car — comme le souligne Jost à propos du cinéma — le plan est un énoncé déictique : « l’image d’une maison ne signifie pas une maison, mais “voici une maison” »70. Cette affirmation semble particulièrement avérée dans le cas du jeu vidéo, où les scènes cinématiques rompent l’action du joueur pour lui montrer certains pans de l’univers : de telles séquences sont rarement désintéressées (ne serait-ce qu’à cause de leur coût de production). Elles apparaissent donc ostensiblement au joueur comme des sélections, des mises en avant d’éléments qui lui sont donnés à voir de manière contraignante (contrairement aux autres éléments de narrativisation, qui, eux, demandent une exploration). À l’inverse du cinéma, où certains plans peuvent se donner l’apparence d’être non intentionnels, les scènes cinématiques vidéoludiques apparaissent donc comme explicitement déterminées par une volonté de montrer. Cette subjectivité de l’image est d’autant plus marquée que ces séquences sont déclenchées par une forme inédite de « montage » : elles débutent après certaines actions bien précises du joueur (pénétrer dans un nouvel environnement, vaincre tel adversaire, etc.), si bien qu’elles apparaissent comme des « réponses » à ses actions. En d’autres termes, dans ces images, la caméra semble toujours ancrée dans une instance narrative, qu’il s’agisse d’un personnage, d’un narrateur ou d’un narrataire. Dans ces passages, l’important n’est donc pas tant de cerner si le point de vue construit pour le joueur est assimilable à un regard (car il est généralement ressenti comme tel) que de déterminer si ce regard est intra- ou extradiégétique.
21En deuxième lieu, il convient de souligner que les scènes cinématiques ne se bornent pas à orienter l’univers en y sélectionnant des éléments charnières : elles participent également à imbriquer le récit dans le jeu. En effet, les fonctions qu’elles remplissent sont principalement diégétiques71, mais peuvent aussi avoir des répercussions ludiques : elles révèlent très souvent les objectifs du jeu (transmettant ainsi les prescriptions du destinateur qu’est la machine) et guident le joueur à travers les quêtes ; elles peuvent également répartir les acteurs de la diégèse en annonçant leur rôle d’adjuvant ou d’opposant ; il leur arrive d’annoncer des événements futurs, via des prolepses, ce qui permet au joueur d’anticiper certains dangers ; elles peuvent aussi, enfin, révéler des informations primordiales sur certains mécanismes ludiques (l’utilité des objets, par exemple) et donner des clefs très concrètes au joueur pour lui permettre d’affronter les obstacles qui lui sont annoncés. Ainsi, la cinématique d’introduction du jeu d’aventure-action Tomb Raider 2 livre au joueur, dès la première minute de l’aventure, l’astuce qui lui permettra de vaincre le boss de fin du jeu (un dragon à qui il faut retirer la dague qui est plantée dans son cœur). Dans ce cas, comme l’avait déjà noté Jean-François Bélanger-Gagnon : « […] la cinématique crée un scénario narratif qui peut enrichir le processus de décision du joueur »72.

Figure 6. Cinématique d’introduction de Command & Conquer : Alerte Rouge 2, jouée par de vrais acteurs, et contrastant fortement avec les graphismes assez schématiques des phases de jeu

Figure 7. Première cinématique de Tomb Raider 2, qui livre au joueur la stratégie permettant de vaincre le boss de fin du jeu : retirer la dague enfoncée dans son cœur
22Les scènes cinématiques opèrent donc une sélection dans les réalités du cosmos, qu’elles organisent en récit linéaire et intègrent dans les réalités du jeu. Néanmoins, ce filtrage reste sporadique et incomplet : il est généralement impossible de cerner tout à fait l’histoire d’un jeu en n’en visionnant que les cut-scenes et les cinématiques (d’où l’importance des autres éléments de narrativisation). Cette sélection est complétée par un autre mode de construction du récit enchâssé : l’expansion. En effet, il existe des scènes cinématiques qui ne participent pas à l’élaboration de la trame principale, mais esquissent des réalités du jeu (des décors, événements, personnages…) qui ne seront pas développées. Ces fractions de narration constituent autant d’orientations possibles pour la diégèse qui n’ont pas été exploitées. Il s’agit du principe des « micro-événements » si bien utilisé par le FPS Half-Life (qui, on l’a dit, a la particularité de laisser constamment au joueur le contrôle de son avatar, même pendant les cut-scenes) :
[…] le garde dévoré au loin par un tentacule, l’homme en noir entrevu à distance ou la machine explosant soudain ne font rien d’autre que de désigner des récits possibles, préexistant au jeu dans l’imaginaire collectif. Par là même, ils rattachent les actions du joueur à un récit potentiel : des événements qui ne sont pas directement fonctionnels participent à l’immersion, en insistant sur la relation du jeu avec toute une classe de récits (ceux que son univers de fiction parasite), et donnent l’impression que le jeu appartient lui-même à cette classe de récit73.
23Ces récits secondaires, à peine esquissés (dont nous verrons d’autres exemples), contribuent à donner à l’univers une certaine profondeur et à constituer le récit enchâssé lui-même comme un espace à explorer plutôt qu’une ligne à suivre.
2.3. L’assomption de la fiction
24Éclairons maintenant une dernière caractéristique des scènes cinématiques et ses implications dans la représentation d’un univers fictionnel. On a vu que ces séquences assumaient leur état de ruptures, leur nature non vidéoludique (voire jouaient sur celle-ci). Or ce caractère ostensible (les cinématiques se montrent) se couple avec une puissante assomption de leur portée fictionnelle. En effet, comme l’a déjà signalé Sébastien Genvo, les scènes cinématiques de jeux vidéo se caractérisent par leur tendance à référer de manière très affirmée au septième art74 (d’où leur nom). Il n’est pas rare, par exemple, que ces séquences ajoutent à la représentation des bandes noires qui « cernent l’image en haut et en bas de l’écran comme si elle avait été “filmée” en cinémascope. De même, l’image est parfois déformée de façon à suggérer l’utilisation d’une lentille à focale courte (ligne d’horizon courbe) »75. D’autres emprunts de ce type sont très régulièrement rencontrés : le jeu peut, par exemple, imiter le reflet du soleil sur l’« objectif » de la caméra. La présence de ces signes n’est pas justifiable d’un point de vue vidéoludique (les bandes noires, par exemple, ne correspondent pas à la réalité de l’animation) mais joue sur les habitudes perceptives des joueurs, sur les codes qu’ils ont déjà assimilés, pour leur transmettre plus facilement l’injonction d’adopter une immersion fictionnelle.
25
Figure 8. Cinématique du jeu de stratégie en temps réel Warcraft III: Reign of Chaos, où l’image est soumise à un traitement très cinématographique, notamment par l’ajout de bandes noires horizontales

Figure 9. Cinématique de Final Fantasy XIII, dans laquelle l’image feint d’être prise par un objectif sur lequel se refléteraient les rayons du soleil
26Ces signes constituent, en vérité, ce que Jean-Marie Schaeffer nomme des « marqueurs conventionnels de fictionnalité »76. Selon lui, la fiction ne consiste pas à tromper le récepteur sur la réalité de ce qui lui est présenté, mais, au contraire, à clairement marquer ces représentations comme des leurres, pour inscrire ce dernier dans une situation de « feintise ludique partagée ». Les « marqueurs pragmatiques de la fiction » constituent, en somme, des étiquettes explicites qui annoncent au récepteur le contrat de lecture dans lequel il s’engage. Ces marques varient selon les genres, les médias et les cultures :
dans le cas d’une tradition fictionnelle bien ancrée dans une société donnée et d’une œuvre s’inscrivant fortement dans cette tradition, l’acte instituant la fiction peut à la limite être tacite, c’est-à-dire faire partie des présupposés implicites de la situation de communication […]. Dans d’autres formes de fiction, le contrat pragmatique se matérialise sous la forme d’un véritable cadre physique77.
27Dans le cas du jeu vidéo — qui reste, malgré tout, un support neuf dont les codes ne sont pas nécessairement aisés à appréhender pour les non-initiés —, ces marques sont particulièrement ostensibles (et ce à travers tout le jeu, mais plus particulièrement encore pendant les scènes cinématiques78), ce qui témoigne d’une profonde assomption de la fiction qu’ils véhiculent et d’un désir de lisibilité. En vérité, ce que l’on entend généralement par « réalisme », dans le médium vidéoludique, correspond davantage au respect des conventions établies par les autres médias qu’à une imitation fidèle du réel. L’imitation du réel, notamment via l’incrustation dans les jeux d’images filmées, a donné lieu à de nombreux échecs car cette intégration engendrait des univers peu cohérents et ne servait pas toujours bien les mécanismes ludiques : des images réalistes ne facilitent pas les mouvements de l’avatar et peuvent rendre difficile la distinction entre les éléments qui appartiennent au jeu et ceux qui appartiennent au décor. L’introduction de personnages digitalisés dans le jeu d’action et plates-formes Timecop (adapté du film du même nom) a, par exemple, posé de gros problèmes de jouabilité, car l’animation des mouvements de l’avatar était trop lente pour être réellement efficace en jeu. Un bon gameplay passe par une prise en main aisée, et donc aussi par une reconnaissance rapide des codes.
28Cette volonté du jeu vidéo d’affirmer sa nature fictionnelle est donc liée à ce que Genvo nomme « l’impératif d’action » du jeu vidéo : « pour être reconnue comme jouable et inciter le joueur à adopter une attitude ludique, la structure de jeu fait appel à certaines typifications de savoir-faire ludiques d’un utilisateur cible, à travers des marqueurs pragmatiques qui font sens chez un destinataire en fonction de son contexte »79. L’assomption de la fiction faite par le jeu vidéo (qui est particulièrement sensible dans les mises en scènes opérées par les cinématiques) est, en somme, un procédé qui permet de mobiliser simultanément le récepteur dans l’univers (puisqu’il transmet le récit enchâssé selon des codes bien intégrés par les joueurs) et dans le jeu (puisque la lisibilité de ces codes servent l’impératif d’action)80.
29En conclusion, faute de décrire de manière traditionnelle la manière dont les scènes cinématiques de jeu vidéo élaborent un récit linéaire, nous avons préféré envisager ici le rapport que ces séquences entretiennent avec le jeu (il s’agit de ruptures), avec l’univers (elles l’orientent via un processus de sélection et le construisent via un processus d’expansion) ainsi qu’avec la fiction en général. Substituer la notion d’univers à celle de récit a permis, en somme, de ne pas limiter l’approche à une prise en compte du récit enchâssé interne aux scènes cinématiques (ce qui serait réducteur), mais plutôt d’envisager les particularités de ce récit liées à son inclusion dans une ludiégèse.
3. Les textes
3.1. Un potentiel narratif indiscutable
30Le texte constitue l’un des aspects fondamentaux des jeux vidéo pourvus de diégèse. Cette importance a débuté avec la création des premiers jeux d’aventure (tels que Colossal Cave Adventure), qui se composaient exclusivement de texte et se situaient à mi-chemin entre le jeu et la littérature numérique. Dans ceux-ci, l’intégralité des décors et des événements était décrite textuellement et le « joueur » ne pouvait interagir avec le logiciel qu’en entrant, pour seules commandes, des mots ou des phrases simples (« go west », « take key », etc.). Le rôle central de l’écrit s’est cependant maintenu dans la suite de l’histoire du jeu vidéo et ce, pour plusieurs raisons. Tout d’abord, par mimétisme vis-à-vis du médium littéraire puisque, comme le note Greg M. Smith81, un jeune médium ne crée pas immédiatement ses propres conventions : le jeu vidéo s’est, pour sa part, longtemps inspiré de celles du cinéma et de la littérature. Ensuite, d’un point de vue purement technique, le texte constitue un moyen économe de transmettre des informations : celui-ci est moins complexe à mettre en place qu’une cinématique ou un enregistrement sonore et a, de plus, l’avantage de ne pas trop alourdir le rythme de la mise en scène (l’action serait fortement ralentie si tout devait être montré).
31Le texte joue également un rôle évident dans le développement du récit enchâssé : il constitue, avec les scènes cinématiques, l’un des deux principaux moyens de transmettre au joueur des informations sur lesquelles il n’a que peu de prise. Comme les cinématiques, le texte soutient la construction de l’univers selon deux modes différents : la sélection et l’expansion. En effet, il sélectionne les éléments du cosmos qui joueront un rôle de premier plan dans le récit (en livrant au joueur les objectifs et leurs enjeux, le passé ou les aspirations des personnages, etc.), mais constitue également un facteur de croissance de l’univers, dans le sens où il permet — plus simplement encore que les scènes cinématiques — d’évoquer des événements, des personnages ou des réalités propres à la diégèse qui ne seront pas montrés82. Bien qu’indéniable, l’importance du texte dans la construction du cosmos et dans son orientation en diégèse varie tout de même selon les genres, allant de fondamentale dans les jeux tels que les point-and-click ou les RPG83, à ponctuelle dans certains jeux de plates-formes tels que Mario ou Sonic.
32Paradoxalement, nous nous attarderons peu sur cet élément textuel en raison, précisément, de sa nature éminemment narrative. En effet, le texte étant l’un des objets privilégiés de la narratologie traditionnelle, il serait possible de s’étendre longuement sur l’analyse de certains jeux où cet aspect est développé de manière approfondie. Afin d’apporter des éléments neufs à l’analyse de la narration vidéoludique, il nous semble essentiel de ne pas isoler artificiellement le texte du contexte ludique dans lequel il prend place et d’envisager principalement son rapport avec l’interactivité propre au jeu vidéo. Nous nous attacherons donc à montrer en quoi l’écrit et le récit qu’il véhicule restent des éléments du jeu.
33Les spécificités du texte vidéoludique seront envisagées, dans un premier temps, à travers la description des trois formes de manipulations interactives auxquelles il est le plus souvent soumis : le rythme, le choix et la collection. Ensuite, nous tâcherons de récapituler quelles sont les fonctions du texte qui semblent dictées par son inclusion dans le jeu, ainsi que les conséquences que celles-ci ont sur le récit.
3.2. L’influence du ludique sur le texte : le rythme
34La particularité la plus évidente — et probablement la plus répandue — du texte vidéoludique est le caractère interactif de son rythme. Dans la majorité des jeux, le temps d’affichage des prises de parole est laissé à l’appréciation du joueur (qui peut l’accélérer ou parfois même y couper court).
35Dans certaines œuvres (comme dans le jeu d’aventure-action Ōkami), une alternance est établie entre les scènes « secondaires », dans lesquelles le joueur contrôle le rythme du texte, et les scènes « principales » (ou, en tout cas, ressenties comme telles en raison du dispositif), dans lesquelles le joueur perd provisoirement ce contrôle. Cette part d’interactivité, pourtant minime, a pour effet d’influencer concrètement le rythme du récit enchâssé et d’engager le joueur dans une partie de son énonciation (puisqu’il doit envoyer des signaux pour le faire s’afficher). De plus, comme le remarque Serge Bouchardon à propos de la littérature interactive84, le fait de manipuler l’apparition et le rythme du texte confère à ce dernier une certaine matérialité : plus qu’une suite de signes, celui-ci devient un véritable objet qui entre en contact (bien qu’indirectement) avec le geste du lecteur. Cette matérialité permet d’inclure le texte dans l’expérience physique du joueur85 mais aussi dans la ludiégèse. Le récit enchâssé véhiculé par le texte n’est, ainsi, pas complètement isolé des phases de jeu.
36Le RPG The Elder Scrolls V: Skyrim prend le contrepied de ce qui vient d’être dit. En effet, dans cette œuvre, tous les dialogues sont prononcés en temps réel par les personnages (contrairement à beaucoup d’autres RPG qui ne prêtent une voix qu’aux personnages principaux). Mises à part quelques scènes fondamentales dans lesquelles il perd le contrôle de son avatar, le joueur peut généralement choisir les conversations auxquelles il va participer et y couper court à n’importe quel moment (en interrompant le PNJ pour parler, ou même en quittant tout bonnement les lieux). Le fait d’assister ou non à certains dialogues influence tant le récit vidéoludique que le récit enchâssé puisqu’il peut donner accès à de nouvelles quêtes ou de nouvelles scènes. Or, malgré cette part importante laissée à l’interactivité dans les dialogues, le contrôle du rythme du texte — pourtant banal dans le domaine du jeu vidéo — est refusé au joueur. Cette contrainte est, tout simplement, due au fait que les dialogues sont réellement prononcés : il est donc possible d’interrompre quelqu’un, mais pas de le faire parler plus vite. Converser avec l’ensemble des habitants d’un village, écouter jusqu’au bout leurs revendications ou leurs aventures peut alors demander un temps considérable au joueur. Le fait de lui refuser un pouvoir qu’il est habitué à exercer sur les PNJ a pour effet d’inclure le joueur dans un univers qui conserve, vis-à-vis de lui, une certaine autonomie. Alors que les dialogues dont il peut contrôler le rythme l’engagent dans une partie de l’énonciation des PNJ (ce qui le place dans une position d’extériorité, de surplomb par rapport à la situation de communication), les conversations de The Elder Scrolls V: Skyrim, au contraire, s’adressent uniquement à lui en tant que personnage de la diégèse. Elles établissent donc, entre l’univers fictionnel et le joueur, un rapport qui imite l’inclusion de ce dernier dans le monde réel.
37Néanmoins, la nature facultative de ces textes fait du récit qu’ils véhiculent un cas limite de récit enchâssé, puisque celui-ci est fortement soumis aux actions du joueur. À l’inverse, les dialogues principaux, où le joueur perd le contrôle de son avatar et assiste, passif, à leur déroulement constituent une forme pure de récit enchâssé et obligent le récepteur à réinvestir une position de spectateur.
3.3. L’influence du ludique sur le texte : le choix
38La deuxième particularité du texte vidéoludique vient du fait qu’il est couramment le vecteur des choix du joueur et ce, selon différentes modalités : nous distinguerons les décisions qui portent sur les dialogues de celles qui portent sur les actions ou les itinéraires.
39Premièrement, certains jeux offrent à leur utilisateur la possibilité de participer aux scènes dialoguées en choisissant une réponse parmi un certain nombre de répliques proposées. Cette décision peut avoir une influence directe sur la tournure du récit enchâssé, ou simplement modifier temporairement sa représentation (et donc n’influencer que le récit vidéoludique construit par la réception du joueur). Revenons sur le RPG The Elder Scrolls V: Skyrim pour illustrer ces deux cas de figure. Dans ce jeu, certains choix de répliques exercent une influence directe sur la tournure des événements et réorientent, ainsi, la diégèse (en déclenchant ou non un conflit, en affiliant le joueur à un camp plutôt qu’à un autre, etc.). D’autres choix, en revanche, se bornent à modifier la perception que le joueur a de l’univers et de ses propres actions : le fait de demander à un PNJ son avis sur tel conflit ou telle réalité du jeu peut, par exemple, changer l’opinion du joueur vis-à-vis des événements dans lesquels il prend place. Répondre agressivement à un marchand et déclencher chez lui un mécontentement passager n’a pas de répercussions sur la trame principale, mais influence la conception que le joueur a de lui-même et du rapport qu’il entretient avec l’univers fictionnel (rapport de bienveillance, d’hostilité, de dérision…).
40Un autre exemple de dialogue interactif peut être observé dans le jeu de rôle Final Fantasy VII86 où le joueur a régulièrement la possibilité de choisir, via les répliques, l’attitude que son avatar adopte vis-à-vis des trois personnages féminins principaux (Tifa, l’amie d’enfance du protagoniste ; Aeris, la dernière descendante d’une civilisation disparue ; et Youfie, une voleuse au caractère enfantin). Ces choix, d’apparence anodine, ont pour conséquence de déterminer laquelle des trois jeunes filles est la plus proche du héros. Ce rapprochement est consacré, plus loin dans la partie, par une scène du récit enchâssé dans laquelle l’avatar sélectionne la fille qu’il préfère pour l’accompagner durant une promenade en téléphérique. Le comportement que le joueur choisit d’adopter au fil du jeu a donc un impact direct sur le déroulement des événements (puisque la scène varie radicalement en fonction du personnage secondaire qui est préféré)87 mais aussi sur la représentation qu’il se fait des relations entre les personnages (le protagoniste ne fait jamais connaître explicitement l’identité de celle qu’il aime, laissant ce choix au joueur).

Figure 10. L’un des nombreux dialogues facultatifs de The Elder Scrolls V: Skyrim, où l’on voit que le joueur a choisi de demander à un PNJ des précisions sur l’univers dans lequel il se trouve (« Je croyais que tous les dragons étaient morts depuis longtemps »). Une fois la question posée, le joueur ne peut contrôler le rythme de la réponse du personnage, excepté en y coupant court

Figure 11. Dialogue de Final Fantasy VII prenant place lors de la deuxième rencontre entre Clad (le protagoniste) et la mystérieuse fleuriste Aeris. Lorsque celle-ci lui demande s’il se souvient d’elle, le joueur a le choix entre deux réponses : l’une plus courtoise et l’autre plus désobligeante
41En deuxième lieu, le texte peut être le vecteur d’un choix en dehors des dialogues. En effet, lorsque le joueur se trouve face à une alternative, c’est généralement via une commande textuelle que le jeu lui demande de prendre une décision. Comme dans le cas de figure précédent, les choix proposés au joueur via le texte peuvent jouer un rôle qui va du fondamental à l’anecdotique, voire à l’illusoire. Fondamental, tout d’abord, lorsqu’ils constituent les pivots de renversements narratifs importants, comme dans le jeu d’action-RPG nommé Fable, où, vers la fin de l’histoire, le joueur doit faire un choix qui l’oriente définitivement vers le bien ou le mal : détruire une épée démoniaque pour libérer le monde du danger qu’elle représente, ou la conserver (il s’agit de l’arme la plus puissante du jeu) à condition de tuer sa propre sœur88. L’interactivité suscitée par le texte a d’importantes conséquences narratives puisque, cette quête étant l’objectif final du jeu, elle oriente l’ensemble de la diégèse dans un sens ou dans un autre (les valeurs dominantes de l’univers se situeront soit du côté de la bienveillance soit du côté de la cruauté).
42Le rôle de ces choix textuels peut également être plus anecdotique : lorsque, dans le RPG Final Fantasy VII, les héros décident d’attaquer le quartier général de la tyrannique compagnie nommée Shinra, le joueur a la possibilité d’y entrer de force par l’entrée principale (ce qui déclenche des combats, mais permet de visiter les locaux de la compagnie) ou d’opter pour une voie plus discrète, à savoir l’escalier de service (le joueur évite alors les combats et assiste à une scène humoristique où l’on voit les personnages s’épuiser dans l’ascension de l’escalier en question). Le fait d’opter pour un chemin plutôt qu’un autre n’a pas de conséquence sur la suite des événements mais montre au joueur un aspect de la diégèse au détriment d’un autre, influençant donc la tournure de son récit vidéoludique.
43Enfin, ces décisions peuvent également être illusoires. Lorsqu’un PNJ demande à la protagoniste du jeu d’aventure-action Ōkami (une déesse réincarnée en loup) si elle est prête à écouter sa requête et à l’aider, l’alternative qui est proposée au joueur (répondre par oui ou par non) est, en réalité, un faux choix puisque seule la réponse affirmative permet de poursuivre le jeu. Bien que cette option n’exerce aucune influence sur la diégèse (puisqu’une réponse négative ne fait que bloquer le récit en remettant la quête à plus tard), elle a tout de même pour effet d’impliquer le joueur dans le dialogue et de le responsabiliser par rapport à la suite des événements. De plus, la présence de texte agit comme un avertissement, un indice qui annonce que l’événement qui va suivre sera la source d’une forte tension narrative et d’une série d’obligations pour le joueur. En effet, ces messages précèdent généralement les affrontements contre les boss ou l’entrée du joueur dans un environnement particulièrement hostile, au sein duquel il ne pourra faire demi-tour.

Figure 12. Dans Fable, si le joueur souhaite détruire l’Épée des Âges et sauver sa sœur, il recevra une demande de confirmation sous forme de texte

Figure 13. Lorsque Tsuzurao (l’un des personnages secondaires du jeu Ōkami) implore à l’aide la déesse Amaterasu (l’avatar), il est demandé au joueur de choisir entre une réponse affirmative et une réponse négative
44Vecteur des choix, le texte vidéoludique est aussi, en ce sens, synonyme de pause, car son apparition équivaut presque nécessairement à l’absence d’action. Néanmoins, ses aspects interactifs l’empêchent d’être perçu comme un corps totalement étranger à l’univers du jeu : plus qu’une coupure, le texte constitue une limite qui, par son seul affichage, ordonne l’expérience ludique du joueur en phases.
3.4. L’influence du ludique sur le texte : la collection
45Le troisième type de manipulation qui participe à faire du texte vidéoludique un élément interactif n’est autre que la collection. En effet, il est très courant de rencontrer, dans les jeux vidéo, des textes qui ne sont pas immédiatement disponibles mais que le joueur doit débloquer en progressant dans la partie. Ceux-ci transmettent généralement des informations encyclopédiques sur l’univers, permettant au joueur de préciser la représentation qu’il s’en fait. Le jeu The Elder Scrolls V: Skyrim, par exemple, contient de très nombreux livres que le joueur a la possibilité de ramasser et de lire — s’il le souhaite. Ceux-ci peuvent contenir des informations utiles sur le plan ludique (des recettes d’alchimie que l’avatar peut reproduire, par exemple), mais se réduisent plus souvent à la révélation d’informations facultatives (et souvent laconiques) sur le passé ou le présent de l’univers fictionnel. Les récits contés dans ces textes constituent d’autres orientations possibles pour la diégèse : le cosmos y est présenté selon une organisation différente, en suivant un autre personnage, un autre conflit, etc. Mentionner leur existence a pour effet de présenter l’aventure du joueur comme un possible parmi d’autres. L’unicité du récit qu’il déroule est relativisée par rapport aux nombreuses potentialités que recèle l’univers. Cependant, rien n’oblige le joueur à prendre connaissance de ces textes (leur longueur et leur nombre sont, d’ailleurs, assez dissuasifs, puisque les lire tous demanderait un temps considérable). L’actualisation du récit qu’ils contiennent est donc totalement soumise au degré d’investissement du joueur dans la narration.
46Le type de texte facultatif à vocation encyclopédique évoqué ci-dessus n’est pas nécessairement présenté sous la forme de livres dispersés dans le jeu : certains menus de l’interface peuvent aussi jouer ce rôle en proposant au joueur un récapitulatif des événements, un bestiaire, un lexique, etc. Ces menus se remplissent progressivement au fil de la progression du joueur et lui donnent des précisions supplémentaires sur les péripéties auxquelles il a déjà assisté, sur les monstres qu’il a déjà rencontrés, etc. Dans les menus du jeu Ōkami, par exemple, les textes qui n’ont pas encore été lus sont marqués d’un point d’exclamation. Ce dispositif est donc pensé pour encourager le joueur à prendre connaissance de ces informations secondaires. Une deuxième illustration peut être trouvée dans Plantes Vs Zombies, un jeu de stratégie en temps réel dont l’objectif est de protéger sa maison d’une invasion de morts-vivants en utilisant des plantes aux capacités diverses. Après avoir franchi quelques niveaux, le joueur y reçoit comme récompense un livre à vocation encyclopédique : le « Suburban Almanac ». Celui-ci recense l’intégralité des plantes possédées par le joueur ainsi que l’ensemble des morts-vivants qu’il a rencontrés au fil de sa partie. Bien que les descriptions proposées comportent quelques conseils de jeu (ils révèlent les faiblesses de certains zombies, par exemple), leur fonction demeure principalement humoristique, dans le sens où elles suggèrent des prolongements narratifs à l’aventure principale qui sont, pour la plupart, complètement loufoques. Le texte associé au « Zombie Yeti », pour preuve, se présente comme suit : « little is known about the Zombie Yeti other than his name, birth date, social security number, educational history, past work experience and sandwich preference (roast beef and Swiss) ». Cet exemple constitue une véritable parodie des encyclopédies que le joueur est habitué à rencontrer dans les jeux vidéo puisqu’il confère ironiquement un passé narratif à des éléments qui ne sont pas censés en avoir. Ces brèves informations textuelles suffisent cependant à donner à l’univers du jeu une certaine profondeur, à le faire déborder du récit enchâssé (presque inexistant) transmis par l’aventure principale, et ainsi à susciter chez le joueur un investissement dépourvu de toute considération performative89.

Figure 14. L’un des livres dispersés dans l’univers de The Elder Scrolls V: Skyrim

Figure 15. Capture d’écran du « Suburban Almanac » de Plantes Vs Zombies
47Les quelques exemples évoqués ci-dessus invitent à souligner que le texte facultatif et encyclopédique ne se présente pas de manière abstraite mais est porté par d’autres éléments tels que les objets ou l’interface. Dans les deux cas, il s’offre au joueur sur le mode de la collection puisque, pour pouvoir le lire, il est d’abord nécessaire de se l’approprier (soit en le ramassant, soit en le débloquant). La nature concrète et manipulable du texte vidéoludique instaure, entre le récit qu’il véhicule et le joueur, un rapport très concret, incarné : le joueur prend possession du récit plus qu’il ne le reçoit. Cette forme de texte mérite donc bien l’appellation d’« élément » de narrativisation puisque, au lieu de guider linéairement le joueur à travers la diégèse, il disperse la narration dans des objets ou des menus qui attendent d’être investis.
3.5. La fonction ludique du texte
48En conclusion, la nature partiellement interactive du texte vidéoludique détermine, pour cet élément, des fonctions et des conventions qui le différencient des dialogues cinématographiques ou du texte littéraire.
49Premièrement, il médiatise une participation très concrète du récepteur dans sa propre énonciation, puisqu’il engage ce dernier dans des actions telles que le contrôle du rythme ou le choix de réponses. Cet engagement constitue un facteur d’immersion dans le récit. Deuxièmement, l’alternance qui existe, au sein des jeux, entre les textes soumis aux manipulations du joueur et ceux qui se déroulent de manière autonome confère un statut différent aux événements selon qu’ils sont contés de la première manière ou de la seconde. En effet, les textes qui échappent au contrôle du joueur sont reçus par celui-ci comme des éléments fondamentaux du récit, qui existent intrinsèquement et sur lesquels il n’a pas prise. Par contraste, les textes dont il contrôle le rythme ou qu’il peut choisir d’ignorer apparaissent alors comme secondaires, mais aussi comme laissant plus de place à un investissement personnel, à une appropriation. Enfin, on l’a vu, le texte vidéoludique a une valeur d’indice par sa seule existence, en dehors même des informations qu’il transmet, puisqu’il délimite l’action et organise la tension dramatique en fonction de ses apparitions et disparitions. Ce rouage représentationnel entretient donc avec les phases du récit un contact direct.
4. L’avatar
50Le terme « avatar » désigne, dans le cadre du jeu vidéo, le corps virtuel qui va permettre au joueur de s’incarner dans le jeu et dans l’image. Cet élément peut prendre des formes très diverses, allant de la plus désincarnée (comme un simple curseur qui s’assimile alors à l’interface) à la plus caractérisée (comme un personnage ayant sa propre personnalité et son rôle à jouer dans l’histoire). Signalons, à ce propos, que nous n’envisagerons ici que les avatars qui sont intégrés à leur diégèse et qui y jouent un rôle d’actant ; les curseurs ou autres manifestations schématiques du joueur seront, quant à eux, commentés dans le point sur l’interface. La distinction entre ces deux catégories semble nécessaire (car un avatar-actant exerce sur la narration une influence tout autre qu’une interface désincarnée) mais reste poreuse90.
51L’importance de l’avatar au sein de notre questionnement est fondamentale : non seulement parce qu’il médiatise la relation entre le joueur et l’univers mais aussi car il constitue généralement un centre autour duquel tout le jeu se structure. D’un point de vue sémiotique, cette unité comporte de nombreuses spécificités qui déterminent et complexifient la relation du jeu au joueur, et qui demandent donc quelques précisions.
4.1. Un embrayeur mixte
52Avant d’entamer la description de l’avatar en tant que signe, il convient de revenir rapidement sur la question de l’énonciation vidéoludique. Le jeu vidéo a pour particularité, on l’a vu, d’intégrer partiellement le joueur dans son processus énonciatif : contrairement à un échange traditionnel (où les deux interlocuteurs prennent tour à tour la position d’énonciateur), ce médium engage simultanément deux instances différentes — le joueur et la machine — dans un acte de « co-énonciation »91. En effet, pour exister, le jeu doit nécessairement être produit par la machine, mais il doit aussi être investi par le joueur. De plus, cet investissement ne se résume pas à une simple actualisation de l’énoncé (ce qui ne différencierait pas le jeu vidéo des autres types de texte) mais constitue une véritable production : même dans les jeux les plus directifs, le joueur conserve toujours une part de liberté (ne serait-ce que celle d’échouer) qui modifie le rythme du jeu. L’énonciation vidéoludique est donc d’un naturel complexe puisque chaque énoncé y est simultanément déterminé par deux instances potentiellement antagonistes : le joueur et la machine. Néanmoins, une remarque importante doit être ajoutée à ce qui précède : s’il est vrai que le joueur participe à l’énonciation (le jeu s’adapte aux signaux qu’il envoie), son action reste secondaire par rapport à celle de la machine puisqu’elle prend toujours place au sein d’un énoncé déjà débrayé92 par cette dernière. Dès le moment où il accepte d’investir le jeu, le joueur est donc contraint d’assumer un discours qui originellement n’est pas le sien. Ces quelques considérations préliminaires semblaient nécessaires pour comprendre le rôle joué par l’avatar dans cette co-énonciation.
53Pour remplir idéalement sa fonction et accueillir l’investissement du joueur, l’avatar est constitué comme une coquille vide. Cette nature le rapproche fortement des signes nommés embrayeurs : comme eux, il n’acquiert un sens que lorsqu’il est assumé par un énonciateur et réfère donc à la situation de communication. En conséquence, chaque actualisation de l’avatar est unique puisque le « je » qui l’investit n’est jamais tout à fait identique. Le jeu débute lorsque le joueur décide d’embrayer ce corps virtuel, de l’assumer comme propre et, dès ce moment, il devient un point de repère, un centre par rapport auquel tout l’espace va s’organiser.
54Néanmoins, ces premières remarques doivent être nuancées. En effet, contrairement aux embrayeurs, l’avatar n’est pas un signe complètement vide car il est préprogrammé : il reste toujours débrayé en prime instance par la machine. Ainsi, même si le joueur tente d’assumer ce signe comme un prolongement de lui-même, s’il tente de s’énoncer à travers lui et de se projeter dans l’univers virtuel, certaines constantes thématiques ou ludiques entraveront nécessairement sa tentative d’identification. Ces constantes sont nécessaires pour qu’il soit possible de reconnaître à l’avatar une identité propre : elles conditionnent sa mêmeté, sa permanence dans le temps93. Ainsi, peu importe la manière dont le joueur l’investit, peu importe ce qu’il vit à travers cet avatar, l’héroïne de Portal demeurera toujours une femme. Plusieurs procédés sont couramment utilisés pour réduire cette distance94 ou altérité : l’utilisation d’un point de vue subjectif (qui assimile le corps du joueur à celui de l’avatar), la possibilité de personnaliser l’avatar en choisissant son apparence, son nom ou ses capacités, l’utilisation d’un corps impersonnel, non caractérisé, qui n’est alors qu’une page blanche sur laquelle le joueur peut projeter ce qu’il souhaite… Pourtant, une assimilation totale demeure impossible en raison du caractère premier de l’énonciation faite par la machine : les marques de subjectivité du joueur sont toujours objectivées par le jeu. En d’autres termes, la mêmeté de l’avatar (qui permet de le reconnaître à travers ses diverses actualisations) entre nécessairement en conflit avec celle du joueur. Leurs ipséités (leurs identités dynamiques, narratives95), à l’inverse, s’entremêlent et s’entre-construisent au fil de la partie (le joueur évolue à travers la progression de l’avatar), si bien que ces deux instances élaborent tout de même une part d’identité commune, définie par la variabilité qu’ils partagent.
55L’avatar se caractérise donc par une certaine impureté : il établit avec le joueur un rapport complexe d’identité-altérité, qui pousse d’ailleurs Carl Therrien à définir la configuration énonciative du jeu vidéo comme « un système mixte, je-il »96 dans lequel les deux pôles énonciatifs sont impliqués « conjointement (mais non symétriquement) »97.
56En somme, l’embrayage opéré par le joueur est nécessaire mais toujours imparfait. Cette disposition peut entraîner divers conflits énonciatifs qui semblent très spécifiques au jeu vidéo. Par exemple, Patrick Mpondo-Dicka observe que, dans le cadre du jeu vidéo :
[…] parler d’un point de vue « à la troisième personne »98 est inexact. Si le joueur voit à la troisième personne, il bouge à la première. Il réalise un débrayage visuel où il remplit le rôle d’un il et un embrayage kinésique où il remplit le rôle d’un je. C’est donc un point de vue « à la première personne du pluriel », constitué d’un je+il […]99.
57L’avatar est, en premier lieu, le vecteur d’une forme d’énonciation complexe ainsi que d’un rapport à l’univers du jeu fondé sur un mélange de projection et de distance. Cette mixité a une influence directe sur le plan de la narration.
4.2. Effets sur la narration : la compétition actancielle
58En adaptant le schéma actanciel de Greimas au jeu vidéo, Aymeric de Guillomont100 constate que l’impureté de l’avatar se manifeste aussi dans son rôle d’actant. En effet, lorsque l’avatar est représenté sous la forme d’un personnage caractérisé, il est parfois difficile d’identifier qui, du joueur ou de sa marionnette, assume le rôle de héros, et qui assume celui d’adjuvant. Entre ces deux instances s’installe une sorte de « compétition actancielle »101 qui peut être diminuée ou exacerbée par les concepteurs : l’avatar peut être développé ou assimilé au joueur, avoir une identité ou n’être qu’un véhicule…
59Plus précisément, Aymeric de Guillomont relève, dans son article, nombre d’exemples illustrant ces deux cas de figure. Il mentionne, tout d’abord, l’ensemble des jeux qui proposent au joueur un contrat d’adjuvant : ce contrat se manifeste notamment dans les formulations visibles sur les jaquettes, qui offrent au joueur de « rejoindre », « d’aider » ou de « suivre » tel héros connu. « Dans l’imaginaire narratif, le joueur se retrouve accessoirisé. Pour un peu, le programme fonctionnerait sans lui »102. À l’inverse, certains jeux s’attachent plutôt à « héroïser » le joueur, en le présentant comme l’élément déterminant qui a la capacité de révolutionner leur univers (exemple toujours emprunté à Aymeric de Guillomont : l’interpellation « dominez le monde du rallye », présente dans le jeu de course automobile Colin McRae Rally103).
60Entre les deux extrêmes que sont la suppression de l’avatar (voir exemple précédent) ou la négation du joueur (l’histoire existe avec ou sans lui), il existe des alternatives pour réduire au minimum cette compétition actancielle : nous avons déjà mentionné la possibilité de personnaliser l’apparence de son avatar, ou l’importance jouée dans ce rapport par le choix de la vue subjective ou de la vue objective. Les concepteurs peuvent également jouer sur une connivence axiologique entre le joueur et son avatar (en insistant sur les valeurs qu’ils partagent) ou sur un rapprochement dans leurs personnalités : Squall, par exemple, le protagoniste taciturne et silencieux du RPG Final Fantasy VIII, confie rarement ses émotions aux autres personnages. Ce mystère a permis de susciter chez de nombreux joueurs une forte identification à cet avatar qui conserve, pourtant, une véritable densité. Dans le même ordre d’idées, Guillomont mentionne le recours à des personnages amnésiques, avec lesquels le joueur se sent plus facilement en adéquation puisqu’ils découvrent l’univers et le jeu en même temps que lui.
61Un exemple encore plus subtil a été esquissé par Guillomont dans son analyse du jeu d’aventure-action Ico. Le joueur y incarne un enfant à cornes, que son village a livré en sacrifice à une reine maléfique. L’enfant parvient néanmoins à sortir du sarcophage où il a été enfermé et rencontre, dans sa fuite, une jeune fille à l’aspect angélique nommée Yorda. Les deux enfants vont alors tenter de s’échapper de l’immense château de la reine. Ils seront confrontés à de nombreuses énigmes et à une armée d’ombres envoyées par la reine à la poursuite de Yorda. Le protagoniste devra faire mille détours pour aider cette dernière à franchir les obstacles, sauter au-dessus de précipices, ou la protéger de ses poursuivants. Dans ce jeu, une connivence profonde s’établit donc entre le joueur et son avatar puisque tous deux ont en commun l’attention continue qu’ils portent à la jeune fille : tous deux assument un rôle d’adjuvant.
62La compétition actancielle évoquée se retraduit à un niveau supérieur : celui des instances du récit. En effet, il est courant de voir le joueur et l’avatar se disputer, outre le rôle de protagoniste, la position de narrateur : la plupart des jeux oscillent entre la tentative de faire croire au joueur qu’il mène le récit et oriente la diégèse comme bon lui semble (un jeu tel que Heavy Rain propose continuellement au joueur de choisir la voie à suivre et contient une vingtaine de fins différentes en fonction du parcours qui aura été emprunté) et celle de confier ce rôle à l’avatar (c’est alors lui, en tant que personnage, qui choisit la marche à suivre en laissant le joueur en assumer les conséquences). Le jeu d’action Prince of Persia fournit un exemple abouti de ce deuxième phénomène puisque l’avatar y est concrètement le narrateur du récit enchâssé. Ce personnage va même jusqu’à refuser au joueur de prendre part à la narration en niant les aléas de son récit vidéoludique. En effet, lorsque le joueur échoue et fait mourir le protagoniste, celui-ci s’exclame : « non, non, ce n’est pas ainsi que cela s’est passé ! ». Malgré tout, ce refus reste un artifice, car même un récit homodiégétique conserve, dans le cas du jeu vidéo, une certaine hétérogénéité due à la part d’énonciation qui se réalise dans l’action du joueur.
63Par ailleurs, si l’on résume les remarques précédentes, on remarque que, plus encore que celle de l’avatar, la position du joueur par rapport au récit est très fluctuante. En effet, parallèlement à ce qu’a remarqué Serge Bouchardon au sujet du récit interactif104, le jeu vidéo joue constamment sur la frontière entre joueur et personnage ou joueur et narrateur, mais aussi sur la limite entre joueur et narrataire (le jeu s’adresse parfois simultanément à lui et au personnage, comme le montrera plus bas l’exemple du Monde de Nemo), ou entre joueur et auteur (puisqu’on laisse fréquemment au joueur la possibilité de créer des niveaux, des objets, des macros, etc.). Selon Bouchardon, ce jeu continuel avec les frontières du dispositif narratif (qui est une conséquence de la combinaison de la narrativité et de l’interactivité) induit un rapport complexe entre le joueur et le récit, fondé sur une alternance entre adhésion et distanciation (car, si le joueur est un auteur : peut-il tout de même diégétiser ou s’immerger dans l’univers fictionnel ?).
4.3. Un rapport à l’univers fondé sur la transgression des niveaux
64La dualité joueur-avatar est donc déterminante dans la constitution des actants et des différentes instances de la narration, mais aussi dans le rapport qui s’établit entre le joueur et l’univers. Dans le cas où l’identification entre ces deux instances n’est pas favorisée (par exemple, lorsque le joueur incarne tour à tour plusieurs personnages), aucune place n’est construite pour ce dernier au sein de l’univers : son existence reste alors implicite et extradiégétique, comme si l’histoire se déroulait sans lui. À l’inverse, le joueur peut être fictionnalisé : son action peut être intégrée à la diégèse dans les tutoriels où — comme l’a remarqué Bernadette Nélide-Mouniapin105 — certaines instructions s’adressent parfois simultanément à l’avatar et au joueur. Les phrases suivantes, issues du jeu Le monde de Nemo, manifestent cette fictionnalisation :
« […] tu peux accélérer en appuyant sur la flèche de déplacement […] », « […] tu peux peut-être y arriver en appuyant sur la touche action ».
65À cause du pronom personnel « tu », embrayeur énonciatif, on est dans un dialogue, à la fois intra et extra-diégétique. D’un point de vue intra-diégétique, Nemo est envisagé par ses compagnons comme interlocuteur apte à saisir la pertinence de leurs propos. Cependant […] l’univers du récit ne comprend ni « touche d’action », ni « flèche de déplacement ». Celles-ci relèvent de l’univers empirique, des touches et manettes que le joueur (physique) actionne. Le véritable destinataire de ce message se trouve donc être extérieur au récit106.
66La fictionnalisation du joueur à travers son rapport à l’avatar peut être bien plus explicite : dans le jeu d’aventure en point-and-click nommé Les Chevaliers de Baphomet : Les Boucliers de Quetzalcoatl, le protagoniste se retrouve, à un certain stade de la partie, coincé dans une cellule de prison. Pour s’échapper, comme dans tout point-and-click, il va devoir collecter des objets et les combiner pour les rendre utiles. En discutant avec son voisin de cellule, le héros va notamment faire l’acquisition d’une corde. Or, lorsque le voisin en question lui demande à quoi cet objet va lui servir, l’avatar répond : « je ne sais pas, mais le joueur trouvera bien quelque chose ». Par sa situation intermédiaire (entre l’univers du jeu et celui du joueur) propre à sa nature d’interface, l’avatar permet donc d’opérer certaines transgressions entre les niveaux intra- et extradiégétique, c’est-à-dire des métalepses, au sens de Genette. Dans le cas précédent, le recours à cette figure construit une place pour le joueur dans une diégèse qui a priori lui est étrangère. Ici, la transgression a principalement une valeur humoristique : la diégèse pénètre brusquement dans la sphère d’expérience du joueur, ce qui a pour effet de le surprendre et de consolider le lien qui l’unit à l’avatar (ainsi qu’à l’univers), puisque celui-ci lui témoigne une marque de considération.
67Un exemple plus émouvant de métalepse apparaît dans le RPG Final Fantasy VII où, à un moment avancé de l’histoire, un personnage doit se sacrifier pour récupérer un objet dangereux et éviter qu’il ne tombe en de mauvaises mains. Le personnage qui sera désigné pour accomplir cette tâche est le dénommé Cait Sith, pour qui le sacrifice ne pose pas problème puisqu’il n’est, en vérité, qu’une peluche contrôlée à distance (à l’image d’un avatar, d’ailleurs) par un autre acteur du jeu nommé Reeves. Or, au moment du sacrifice en question, le personnage de Cait Sith acquiert une soudaine autonomie et parvient à se mouvoir seul pendant quelques minutes, en attendant sa mort, sans pour autant être manipulé par Reeves. À cet instant, Cait Sith se tourne directement vers le joueur en lui annonçant : « il y a plein de jouets en peluche qui me ressemblent tout autour, mais moi je suis unique ! Ne m’oublie pas, même si un autre Cait Sith fait son apparition ». En effet, quelques minutes après la mort de ce personnage, un second Cait Sith identique réintégrera l’équipe du joueur comme si rien n’était advenu.

Figure 16. L’avatar (à gauche) de Les Chevaliers de Baphomet : Les Boucliers de Quetzalcoatl, en train de dire : « je ne sais pas, mais le joueur trouvera bien quelque chose »

Figure 17. Cait Sith, la peluche de Final Fantasy VII, faisant ses adieux au joueur : « ne m’oublie pas, même si un autre Cait Sith fait son apparition »
68Dans ce cas de figure, la transgression entre les différents niveaux du récit a pour but de responsabiliser le joueur en lui présentant comme un devoir de mémoire le fait de s’investir émotionnellement dans le destin des personnages et de la diégèse représentée. En effet, dans cette scène où aucun autre acteur du jeu n’était présent, le joueur a été le seul à pouvoir percevoir l’unicité du premier Cait Sith : un rôle est donc construit pour lui au sein de la diégèse, qui ne peut être rempli que par lui.
69Les différentes stratégies évoquées ici ont pour effet d’inclure plus ou moins le joueur à la diégèse et au récit qui l’oriente : d’un point de vue général, les techniques de rapprochement entre le joueur et son avatar ont pour but de faire adhérer le premier aux règles de l’univers et, en le mobilisant, d’induire chez lui un investissement dans la narration.
70En conclusion, la métalepse peut servir à fictionnaliser le joueur et à réduire ainsi la distance qui le sépare de son avatar. Le recours à cette figure est loin d’être un cas isolé dans le jeu vidéo. Au contraire, il s’agit d’une constante due à la nature complexe de l’avatar qui a une fonction intradiégétique (puisqu’il s’agit de l’actant autour duquel vient se structurer l’histoire) et une fonction extradiégétique (puisqu’il joue le rôle d’un embrayeur en permettant, entre autres, de transférer les compétences du joueur vers l’acteur qu’il incarne). Cette nature complexe de l’avatar introduit donc une certaine perméabilité entre les différents niveaux de la narration, qui se traduit par les différents cas évoqués plus haut.
4.4. Contrôle, investissement et responsabilité
71Malgré ces différents phénomènes conflictuels, le lien qui unit le joueur à l’avatar conserve toujours une certaine importance à cause de l’embrayage kinésique nécessairement présupposé par le jeu : en effet, les mouvements de l’avatar sont assumés comme propres par le joueur qui, lui-même, est en train de bouger dans le réel (ses doigts sur le clavier, ou même tout le corps dans le cas des consoles telles que la Wii ou de périphériques tels que le capteur Kinect). Cette parenté dans le geste suffit à susciter un fort sentiment d’identification puisque, comme l’a écrit Roland Barthes : « l’identification ne fait pas acception de psychologie ; elle est une pure opération structurale : je suis celui qui a la même place que moi »107.
72Par ailleurs, en tant que sujet d’un faire, l’avatar oscille constamment entre deux états. Lors des phases de jeu, il est une poupée plus ou moins inerte et dépourvue de vouloir-faire108, qui est alors délégué au joueur. En revanche, comme le signale Patrick Mpondo Dicka109, cet être vide peut se remplir durant les phases de récit enchâssé non interactif (que sont la plupart des dialogues et cinématiques) et manifester ses propres aspirations. Le va-et-vient entre ces modalisations entraîne, chez le joueur, une alternance de positionnement. Le fait qu’il soit la source du vouloir-faire pendant les phases de jeu entraîne chez lui une certaine forme de responsabilisation puisque les actions réalisées par l’avatar n’auraient pu l’être sans sa participation. Au contraire, lors des scènes cinématiques ou dialogues, les deux alter ego se retrouvent face à face ; une distance est rétablie, qui permet au joueur d’évaluer les actions réalisées depuis un point de vue extérieur. Le joueur est donc alternativement poussé à juger moralement les actes du personnage et à les assumer comme propres.
73Cette alternance de positionnement est régulièrement utilisée par les concepteurs pour mettre le joueur dans des positions inconfortables (notamment quand l’avatar est un personnage explicitement mauvais). Ainsi, par exemple, dans la série des jeux God of War, le joueur incarne Kratos, un capitaine spartiate dont l’aspiration profonde est de se venger des dieux de l’Olympe, qui sont à l’origine de la mort de sa famille. Même s’il ne peut être qualifié de « mauvais », Kratos reste un héros à la morale discutable, dans le sens où il commet de nombreux crimes — pas tous justifiables — pour assurer sa vengeance et va même, dans le dernier opus, jusqu’à déclencher l’apocalypse. Le joueur est, d’une part, soumis aux décisions cruelles de son avatar et obligé d’assister, impuissant, à leurs conséquences dans les cinématiques ; mais il est également, d’autre part, celui qui devra réaliser les actes de violence impliqués par les choix de Kratos s’il veut survivre et remporter la partie. Cette alternance entre adhésion et distanciation construit donc, pour le joueur, une position de lecture intenable, puisqu’elle l’oblige sans cesse à changer d’obédience et l’empêche d’évaluer l’univers de façon univoque.
74Ce type de conflit intérieur est également utilisé dans le jeu d’aventure-action Ico. Au fil de cette œuvre — comme évoqué ci-dessus — le joueur doit combattre et occire nombre de créatures à l’aspect sombre pour protéger son amie Yorda. Cependant, vers la fin du parcours, peu avant de se retrouver face à la reine (le boss de fin) et ses sbires, il découvre que les ombres qui l’attaquaient sont, en réalité, les âmes des autres enfants qui, comme lui, avaient été offerts en sacrifice. Cette découverte n’est pas soutenue par une phase de récit enchâssé, mais bien par une phase ludique puisqu’elle a lieu lors du dernier affrontement entre le protagoniste et les ombres. La prise de conscience provient tout simplement du fait que ces créatures sortent directement des sarcophages où l’avatar avait été enfermé au début du jeu et ont, précisément, la forme d’enfants à cornes.

Figure 18. Le protagoniste de Ico (à gauche) accompagné de Yorda

Figure 19. Les ombres des enfants à cornes encerclant Yorda
75L’intégration de cette révélation dans l’action du joueur a pour effet principal de reporter intégralement sur ce dernier une responsabilité qu’il aurait dû partager avec l’avatar : l’absence de récit enchâssé empêche, en effet, le protagoniste de manifester son émotion et, ainsi, de la prendre en charge. Au contraire, le joueur se retrouve ici seul face à ses actes, ce qui rend particulièrement sensible le poids narratif des combats qu’il a menés jusque-là.
76La relation qui unit le joueur et l’avatar — fondée sur une assomption nécessaire mais parfois difficile à maintenir — rend donc possible le développement de tensions dramatiques spécifiquement vidéoludiques. Ce lien complexe a été étudié par James Paul Gee110, qui relève trois types d’identité pouvant s’installer entre l’avatar et le joueur : l’identité virtuelle (virtual identity) qui est celle de l’avatar tel qu’il a été préconçu, comprenant son histoire, sa personnalité, ses caractéristiques, etc. ; l’identité réelle (real-world identity) qui est celle du joueur tel qu’il est dans le monde réel, avec ses compétences et ses habitudes ; et, enfin, l’identité projective (projective identity). Cette identité — projetée par le joueur sur l’avatar — constitue une jonction entre les deux premières : elle combine les valeurs propres au joueur et ce que le jeu lui a appris sur l’essence de son avatar ou ce qu’il tend à devenir. Résumant la pensée de Gee, Jean-François Bélanger-Gagnon note :
ainsi, même si le joueur peut commencer la partie en considérant l’avatar comme un simple outil pour ses propres actions, l’information fournie par le jeu à propos du personnage virtuel influencera ses décisions. Au fur et à mesure que le joueur avancera dans le jeu, l’identité projective se construira en accumulant des propriétés, des traits et une histoire nés du mélange des identités distinctes de l’avatar et du joueur. Une fois immergé dans l’univers narratif, le joueur se sent responsable du personnage et projette une identité relative à ce que l’avatar devrait être et ce à quoi la trajectoire de ses actions dans le monde virtuel devrait ressembler […]111.
77La relation joueur-avatar est, en somme, une donnée fondamentale pour comprendre la nature particulière de l’engagement dans le récit qui est rendu possible par le jeu vidéo. Néanmoins, son caractère complexe et variable (puisqu’elle engage une partie de l’identité de chaque joueur) rend ardue toute tentative d’en réduire les possibilités à quelques cas de figures schématiques et à une liste d’effets.
4.5. Une donnée supplémentaire : la focalisation
78Il existe un autre aspect de la relation entre joueur et avatar qui exerce une influence directe sur la narration, à savoir la focalisation. Ce concept, qui désigne le foyer cognitif via lequel est transmis le récit, doit être distingué (dans le cas du jeu vidéo comme dans celui du cinéma) de l’ocularisation et de l’auricularisation qui posent les questions de la vue et de l’ouïe et qui seront donc traitées dans les points correspondants (celui sur la caméra et celui sur les sons). Nous ne nous appesantirons pas sur ce concept, déjà maintes fois décrit par d’autres, et qui semble s’adapter au jeu vidéo sans trop de difficultés112. Signalons simplement l’importance que comporte cette donnée supplémentaire dans la construction d’un univers : une focalisation interne, par exemple, accentuera généralement l’identification du joueur à son avatar, tandis qu’une focalisation externe (comme dans les jeux de stratégie en temps réel, « où le joueur ne connaît pas les agissements des autres protagonistes de la partie113 et ne prend pas uniquement connaissance des événements par l’intermédiaire d’un seul personnage »114), représente plutôt l’univers comme une réalité autonome. En d’autres termes, l’accent peut être mis davantage sur l’intériorité de l’avatar, la façon dont il reçoit les événements, ou sur le développement d’un univers comme système, au sein duquel l’avatar n’est qu’un élément parmi d’autres.
79Revenons un instant sur le jeu Ico pour illustrer plus précisément l’impact du choix du foyer cognitif sur la narration. La focalisation adoptée par ce jeu peut être qualifiée d’« externe » car, bien que le point de vue du joueur soit assujetti aux déplacements du protagoniste, il aura tout de même accès à des informations inconnues de ce héros (notamment dans la cinématique de fin du jeu, où l’on voit Yorda faire sortir l’avatar du château alors qu’il est inconscient) et ne pénètrera jamais l’intériorité des personnages115. Ses connaissances se limiteront aux scènes auxquelles il a assisté au fil du jeu et laisseront donc de nombreuses questions en suspens. Une telle absence de connexion entre le joueur et son avatar accentue considérablement le sentiment de solitude généré par le caractère vide et silencieux du château parcouru. Le manque d’informations claires sur les tenants et aboutissants du récit génère, de plus, un sentiment d’insécurité, auquel participent également le caractère mystérieux de l’environnement, ainsi que l’inquiétude constante de mettre Yorda en danger (certaines énigmes imposent, en effet, de s’éloigner d’elle quelque temps et de la laisser à la merci des ombres qui la poursuivent). Enfin, l’inconnue qui entoure les sentiments des personnages (qui sont rarement exprimés, mais que le joueur devine et participe à construire) évite de focaliser l’attention sur leur intériorité et invite à déplacer l’identification du joueur vers l’extérieur, c’est-à-dire vers l’environnement et l’univers. Cette disposition s’oppose radicalement à un jeu tel que Les Chevaliers de Baphomet : Les Boucliers de Quetzalcoatl — pour reprendre un exemple déjà cité — où la connaissance que le joueur peut avoir de l’univers passe systématiquement par le prisme de la personnalité des avatars.
4.6. L’avatar en tant que support d’un récit
80Enfin, l’avatar n’est pas uniquement le vecteur d’un certain rapport à l’univers et au récit qui l’oriente : il peut aussi être le support via lequel une diégèse se développe ou s’active.
81En effet, dans les RPG et MMORPG, le corps de l’avatar lui-même évolue souvent selon des modalités qui ressemblent à un récit116 : il devient plus fort, acquiert de nouvelles capacités, augmente ses points de vie… Ces métamorphoses peuvent être plus ou moins contraintes par le récit enchâssé ou plus ou moins libres. Dans Final Fantasy XIII, par exemple, les personnages ne montent de niveau que lorsque le joueur atteint certaines phases de l’histoire117. Dans le RPG The Elder Scrolls V: Skyrim, au contraire, le joueur doit constamment effectuer de nombreux choix au sujet de l’évolution de son avatar (apparence, manière de combattre…). Chaque action réalisée augmente les caractéristiques du personnage : combattre un ennemi à la hache, choisir de l’éviter discrètement ou utiliser la magie pour le vaincre améliorera les compétences correspondantes (maniement des armes à deux mains, furtivité, magie…). L’avatar garde donc en mémoire la façon dont le joueur mène son récit vidéoludique, il en porte les traces concrètes.
82Si les avatars peuvent témoigner d’un récit vidéoludique particulier, d’autres peuvent également constituer le support d’un récit enchâssé dans le cadre d’un renvoi intertextuel. Par leur seule présence, certains personnages très narrativisés ou caractérisés peuvent activer tout un univers connu préalablement par le joueur. Par exemple, le fait de pouvoir incarner Link (le protagoniste de la série The Legend of Zelda118) dans la version GameCube du jeu de combat SoulCalibur 2, alors que ce personnage ne fait pas partie de l’univers de ce jeu119, suffit à convoquer toute la diégèse qui lui est propre (d’autant plus qu’il conserve les aptitudes acquises dans les jeux The Legend of Zelda : il peut lancer des objets emblématiques de la saga, effectuer des attaques apprises dans ces mêmes jeux, etc.).

Figure 20. Link (à droite), protagoniste des jeux The Legend of Zelda, présent ici dans le jeu de combat SoulCalibur 2
83En conclusion, l’utilisation de la notion d’univers a permis de mieux profiler le rôle rempli par l’avatar au sein de la narration et d’en cerner l’aspect composite. Par son caractère double, intermédiaire et transitionnel, celui-ci est au centre de nombreuses tensions qui orientent, supportent ou développent le récit dans des directions parfois contradictoires. La multiplicité des données à prendre en compte dans l’analyse de cet élément rend d’ailleurs très ardu l’établissement d’une catégorisation des avatars sur base de leur importance narrative ainsi que le recensement d’effets globaux pour ces différentes dispositions. Dit autrement : chaque avatar est le résultat de la combinaison d’un grand nombre d’aspects120 et génère un rapport à la diégèse chaque fois particulier.
5. Les personnages
84Bien que ce point soit principalement consacré à la description de ce que l’on appelle couramment les PNJ (c’est-à-dire les personnages non joueurs), certaines remarques pourront, à l’occasion, être généralisables au cas de l’avatar. La distinction entre ces deux types d’éléments est, en vérité, loin d’être nette, notamment à cause du caractère fluctuant du statut de PNJ. Il arrive couramment, par exemple, que l’un des personnages secondaires d’un jeu particulier se retrouve être l’avatar du joueur dans une autre adaptation tirée du même univers (Yoshi, le petit dinosaure que peut monter Mario a, pour preuve, eu droit à son propre jeu : Super Mario World 2: Yoshi’s Island sur Super Nintendo). Certains cas équivoques peuvent également être rencontrés au sein d’un même jeu : les personnages secondaires du RPG Final Fantasy X, par exemple, sont utilisables pendant les combats, mais seul le protagoniste, Tidus, sert d’incarnation au joueur pendant le reste du jeu. À quelle catégorie appartiennent-ils donc, puisqu’ils ne sont ni réellement des PNJ, ni réellement des avatars ? Cette ambiguïté de statut apparaît également lorsque le joueur change d’avatar au fil de la partie, comme dans les jeux de combat, où il doit sélectionner lui-même le personnage qu’il souhaite incarner. Dans le cas où il joue en mode solo, son adversaire sera alors pris en charge par la machine, devenant ainsi un PNJ alors qu’il était au départ un avatar potentiel.
85Il est donc important de garder à l’esprit que — comme dans tout découpage scientifique — les catégories d’éléments de narrativisation esquissées ici restent des modèles théoriques et sont loin d’être totalement imperméables les unes aux autres.
5.1. Personnages et émotions
86Les personnages rencontrés au fil d’un jeu comportent un intérêt certain dans notre questionnement. Ils « assume[nt], par le biais des fonctions qu’il[s] rempli[ssent], les transformations nécessaires à l’avancée de l’histoire »121 (ils sont donc au cœur du récit qui oriente la diégèse) et incarnent la dimension « humaine » de l’univers représenté, son caractère habitable.
87D’autre part, si le joueur-spectateur s’investit initialement dans l’image par le biais d’une identification primaire au dispositif (identification à la mise en scène et au point de vue représenté), cette première reconnaissance permet le développement d’une identification secondaire (symbolique) pour laquelle les personnages sont d’importants catalyseurs122. En d’autres termes, l’inclusion répétée des personnages dans certaines situations ainsi que la perspective qui en est offerte au joueur chargent ces icônes d’enjeux affectifs forts, faisant d’eux la médiation privilégiée de l’identification secondaire du joueur au récit. Ainsi, un personnage régulièrement inscrit dans un dispositif angoissant deviendra le point focal d’une émotion particulière : la peur.
88Ce principe de représentation est loin d’être spécifique au médium vidéoludique ; il est plutôt le propre de toute narration. Or « ce qui distingue […] Lara Croft (ou tout autre héros de jeux vidéo) de Julien Sorel est que celle-ci est simultanément personnage de fiction et personnage de jeu »123. Une telle dualité implique l’existence de deux niveaux d’identification aux personnages de jeu vidéo : l’un narratif, l’autre ludique. D’où l’intérêt de distinguer, à l’instar de Bernard Perron124, les deux types d’émotions que ces différents investissements peuvent susciter. Les émotions fictionnelles, tout d’abord, sont les « émotions enracinées dans le monde fictionnel et émergeant des préoccupations issues de ce monde »125. Les émotions vidéoludiques, quant à elles, découlent des actions du joueur ainsi que des conséquences de celles-ci. Ce découpage proposé par Perron différencie donc, en quelque sorte, les émotions générées par le récit enchâssé de celles suscitées par le récit vidéoludique. En pratique, les deux types d’émotions se confondent dans la présence unificatrice du joueur (allant parfois jusqu’à introduire une indistinction entre les faits proprement ludiques et les composantes de la fiction). Toutefois, leur distinction dans la théorie permet de rendre compte de certains jeux narratifs propres au médium.
89Ainsi, émotions fictionnelles et émotions vidéoludiques peuvent, à l’occasion, entrer en résonnance : la mort du personnage adjuvant Aerith dans Final Fantasy VII, par exemple, crée simultanément une émotion sur les deux plans car la tristesse de cette disparition est renforcée par la perte qu’elle représente d’un point de vue ludique. À l’inverse, ces affects peuvent également entrer en conflit, comme en témoigne le jeu BioShock. Dans ce FPS, le joueur est confronté à des petites filles d’environ sept ans, les « petites sœurs », qui ont été génétiquement modifiées et conditionnées par des dirigeants totalitaires126. Face à elles, deux choix s’offrent au joueur : les exterminer pour collecter sur elles une substance appelée ADAM, qui permet d’augmenter les capacités de l’avatar, ou les sauver en les débarrassant du parasite qui les contraint à obéir. En fonction de la décision prise par le joueur, le jeu se terminera différemment : en happy end s’il les sauve, ou en drame s’il les tue (son avatar deviendra alors lui-même un tyran). L’empathie pour ces personnages (que le récit enchâssé présente comme des victimes) entre donc en contradiction avec les émotions vidéoludiques qu’ils suscitent (la satisfaction d’une victoire et de l’acquisition d’un pouvoir plus important). La concurrence entre ces deux stratégies de lecture est, en outre, exacerbée par le point de vue depuis lequel sont représentées les « petites sœurs » et les situations dans lesquelles elles s’intègrent. En effet, leur nature de fillettes (propre à susciter l’empathie) est contrebalancée par leur aspect effrayant et leur inscription dans un décor noir et cauchemardesque. Cet équilibre place le joueur dans une position intenable : les prescriptions formelles contradictoires l’empêchent d’adhérer radicalement à une interprétation plutôt qu’à une autre, l’obligeant ainsi constamment à remettre en question son parcours interprétatif et à s’interroger sur la portée de ses actes.

Figure 21. L’une des « petites sœurs » du FPS Bioshock
90Dans cet exemple, en somme, l’orientation générale de la diégèse et l’identité du personnage principal dépendent directement du type d’émotion que le sort des fillettes suscitera chez le joueur — dispositif qui n’est possible que grâce à l’interactivité propre au jeu vidéo.
5.2. Identités visuelle, sonore, ludique et narrative
91Un rapide parcours des différents aspects qui participent à construire l’identité des personnages vidéoludiques permettra de montrer que ceux-ci ont la particularité de se constituer comme des mosaïques, des conglomérats d’éléments. Le fait que leur essence, leur personnalité sont ainsi réparties et transmises par plusieurs niveaux distincts rappelle, d’ailleurs, la manière générale dont se construisent l’univers et la narrativité vidéoludique.
92L’identité des personnages (qu’ils soient joués ou non) se construit principalement sur quatre niveaux.
93Le niveau visuel, tout d’abord, comprend le design graphique et les animations (démarches, attitudes pendant les dialogues127, postures d’inactivité128…), qui font tous deux passer de nombreuses informations sur la personnalité, l’origine ou la position des personnages dans l’univers. Les mimiques et attitudes infantiles de la collégienne Ling Xiaoyu — l’une des combattantes de la série de jeux de combat Tekken — ajoutées à sa tenue souvent excentrique, en disent long sur sa personne et correspondent bien à ses aspirations puériles (dans le premier opus où elle apparaît, c’est-à-dire Tekken 3, la motivation qui la pousse à combattre est simplement de gagner assez d’argent pour pouvoir construire son propre parc d’attractions). Plus largement, le design des personnages permet souvent de montrer explicitement leur adéquation avec un environnement, un milieu particulier. Cette fonction indicielle de l’apparence est particulièrement visible dans le jeu World of Warcraft, où certaines créatures sont rencontrées dans plusieurs endroits de l’univers. Celles-ci changent d’apparence (et souvent de nom129) en fonction de l’environnement dans lequel elles se trouvent, de la faction à laquelle elles appartiennent et du statut qu’elles y occupent (le canal visuel donne donc des informations tant sur leur identité narrative que sur leur intérêt ludique). Ainsi, dans la race des Furbolgs, les PNJ se distingueront selon qu’ils sont gardes ou chamans, qu’ils se trouvent dans une région enneigée ou boisée, etc.

Figure 22. Ling Xiaoyu, l’une des combattantes de la série Tekken

Figure 23. Deux types de Furbolgs (l’une des nombreuses races de créatures qui peuplent le monde de World of Warcraft)
94Le niveau sonore, ensuite, contribue également à construire l’identité des personnages : il comprend leurs différentes prises de parole (déterminées tant par le contenu que par la voix et le ton), et certains éléments plus ponctuels tels que les répliques récurrentes, les bruitages ou encore les musiques qui leur sont associées. Dans bien des RPG, les personnages secondaires disposent de leur propre thème musical, qui donne — sans les raconter — des informations sur le rôle qu’ils vont jouer (selon que la musique est enjouée, épique, effrayante…).
95En troisième lieu, ce que nous avons nommé plus haut l’ « identité ludique » est déterminée par ce que les personnages peuvent ou ne peuvent pas faire au sein de l’univers. De nombreux PNJ se définissent uniquement par leur fonction ou leurs capacités, comme l’ont remarqué Henry Jenkins et Mary Fuller pour les jeux Nintendo en particulier : « in Nintendo®’s narratives, characters play a minimal role, displaying traits that are largely capacities for action : fighting skills, modes of transportation, preestablished goals »130. La nature instrumentalisée des personnages va parfois jusqu’à entraîner une certaine confusion entre cette classe et celle des objets131 : dans le jeu de plates-formes Kirby’s Adventure, par exemple, le héros (Kirby, qui a la forme d’une petite boule rose) a la faculté d’avaler les ennemis qu’il rencontre pour absorber leurs capacités. Les monstres rencontrés au fil du jeu ne sont donc considérés que pour leurs propriétés ludiques, ce qui leur confère un statut très ambigu, intermédiaire entre celui d’objets et celui de personnages (bien que certains se rapprochent plus que d’autres de la seconde catégorie, comme le boss nommé « Meta Knight », dont l’apparition est quelque peu scénarisée132). L’identité ludique d’un personnage n’est pas sans lien avec le rôle qu’il joue dans le récit enchâssé (opposant, adjuvant…), mais n’est pas suffisante pour générer des émotions fictionnelles. Les personnages chez qui l’identité ludique prend le pas sur l’identité narrative semblent donc — globalement — moins aptes à susciter chez le joueur un investissement dans la narration et déterminent davantage un comportement performatif.
96L’identité proprement narrative des personnages, enfin, ne peut réellement être considérée de manière isolée puisqu’elle n’est autre que le conglomérat de ce qui vient d’être décrit, ajouté aux informations qui ont été transmises au joueur par d’autres biais (les cinématiques, les renvois intertextuels, etc.). Néanmoins, nous insisterons ici sur un aspect typiquement vidéoludique de cette identité, à savoir la difficulté de déterminer précisément le rôle de certains PNJ au sein du schéma actanciel (difficulté principalement due au fait que tous les actants, excepté une part du héros, sont gérés par la machine). Une réelle indistinction existe entre la classe des adjuvants et celle des opposants, dans le sens où les membres de la deuxième catégorie fournissent très souvent au joueur des éléments nécessaires à sa progression (ou, au moins, la facilitant). L’on a déjà cité l’exemple de Kirby’s Adventure, où le protagoniste peut absorber les capacités de ses ennemis. On pensera aussi à l’intégralité des RPG, où chaque combat remporté rapporte à l’avatar des points d’expérience, qui le font progresser et gagner en puissance. Cette expérience est nécessaire pour venir à bout des différents boss, avancer dans le jeu, et donc aussi pour actualiser la suite du récit enchâssé. Dans ces cas de figure, la notion d’« opposants » devient problématique puisque les adversaires ne constituent pas vraiment des obstacles mais sont plutôt des ressources essentielles. Les ennemis plus coriaces ou les boss, quant à eux, constituent, sur le plan ludique, des moments d’évaluation de la progression du joueur : ils vérifient que les points d’expérience accumulés par ce dernier (et donc son investissement dans le jeu) sont suffisants pour poursuivre l’aventure133. Le phénomène est loin de se limiter au genre des jeux de rôle : dans la plupart des FPS, shoot’em up, jeux d’aventure-action, etc., il existe des ennemis qui laissent derrière eux, lorsqu’ils sont vaincus, des objets utiles au joueur (des trousses de soins, des bonus, etc.).
97Or les opposants sont déterminants dans l’élaboration de la tension dramatique, dans la pression qui s’exerce sur le joueur. Le caractère versatile de ces actants génère donc chez celui-ci un rapport très particulier à la narration et au conflit qui l’oriente (puisqu’il est possible de développer une certaine sympathie vis-à-vis de ses propres adversaires). L’ambiguïté de cette relation est renforcée par le fait que le comportement du joueur pourra, à l’occasion, influencer le nombre ou la disposition de ses opposants. Dans les RPG, par exemple, les combats sont multipliables à l’infini (il suffit, en général, de tourner en rond dans une zone en attendant que des adversaires apparaissent). Ou encore : dans les jeux d’infiltration, comme le remarque Emmanuel Guardiola134, le fait de se faire voir par un garde patrouillant entraîne, bien souvent, l’apparition de renforts qui n’existaient pas auparavant et n’auraient pas été générés par la machine sans cette action. De nouveau, le joueur est ainsi constitué comme partiellement responsable du conflit qui l’occupe.
98Les différents paramètres décrits plus haut influencent tous, à leur manière, la représentation qui est donnée de la diégèse : l’utilité des opposants, la possible instrumentalisation des personnages, leur aspect et leurs animations… modifient le statut du récit enchâssé auquel ils participent et donc le sens vers lequel évoluent les éléments du cosmos. Par exemple, l’utilité d’avaler les adversaires dans Kirby’s Adventure implique que l’univers ne problématise pas la disparition de ses habitants — ce qui est modalisé très différemment dans la diégèse de Ico.
5.3. Les éléments d’attraction
99La description de l’identité des personnages vidéoludiques qui vient d’être faite a permis d’envisager celle-ci comme un conglomérat d’éléments disposant tous de leurs propres enjeux. Les personnages, qui constituent déjà un élément précis de la diégèse, sont eux-mêmes conçus comme des assemblages de propriétés visuelles, sonores, ludiques et narratives. Ce mode de construction rappelle les théories de Hiroki Azuma au sujet de la culture Otaku135. Celui-ci remarque que les œuvres liées à cette nouvelle forme de culture ne sont plus conçues comme des portes d’entrée vers une vérité profonde mais comme un système, un agencement chaque fois particulier d’éléments qui sont tous puisés dans une même « base de données » implicite et abstraite. Ce phénomène est particulièrement visible dans la constitution des personnages de mangas, réels pots-pourris d’éléments qui existent déjà et que les consommateurs ont déjà appris à aimer : « ces signes qui se sont développés pour stimuler habilement la fascination des consommateurs envers les personnages, je les désignerai […] par le terme générique d’“éléments d’attraction” »136. Ceux-ci vont même parfois jusqu’à se substituer au récit traditionnel en permettant au spectateur de se projeter sur eux ou de les investir à sa guise.
100Les observations d’Azuma, loin de se limiter à la culture Otaku, rendent compte d’un nouveau mode d’élaboration et de réception du récit137, et même, plus généralement, d’une nouvelle conception de la narration dans son ensemble. Cet auteur remarque l’importance fondamentale prise par les personnages dans cette nouvelle culture : ceux-ci portent bien souvent l’univers à eux seuls et peuvent, à l’occasion, remplacer tout bonnement le récit. Dans le cas du jeu vidéo, on peut penser aux personnages « mascottes » tels que Lara Croft138, Sonic, Kirby, etc., qui représentent à ce point leurs univers respectifs qu’ils peuvent être transposés dans d’autres cosmos sans que cela ait de réel impact. Le jeu Super Mario Bros 2, par exemple, recycle un univers qui n’a rien à voir avec celui de cette série (il est issu d’un jeu qui s’appelait initialement Yume Kōjō: Doki Doki Panic).

Figure 24. Kirby (à gauche) se préparant à avaler un ennemi

Figure 25. Une comparaison entre Yume Kōjō: Doki Doki Panic (à gauche) et Super Mario Bros 2 (à droite) où l’on voit que seul l’avatar change. Source : « Rarezas : Yume Kōjō Doki Doki Panic » sur Ecetia. URL : http://ecetia.com/2009/07/rarezas-yume-kojo-doki-doki-panic
101Le fait d’y avoir réintégré les personnages de la série Mario (transfert qui avait essentiellement pour but de donner une plus grande portée commerciale au titre) a réorienté le jeu en une nouvelle diégèse sans le moindre mal. Ainsi, comme l’a noté Azuma :
[…] dans le cadre des produits multimédias, l’œuvre originale est maintenue dans une position ambiguë puisque des produits de genres divers sont développés simultanément. En conséquence, ce qui constitue le lien entre tous les développements, ce n’est ni la personnalité de l’auteur, ni le message, mais un univers ou des personnages communs, voire, dans des cas extrêmes, uniquement des personnages sans aucune référence à un contexte139.
102Une dernière remarque concernant le rôle des personnages vidéoludiques dans l’orientation de la diégèse mérite cependant d’être esquissée.
5.4. Une fonction encyclopédique
103S’il est vrai que l’identité des personnages représente à elle seule une part importante de la diégèse (puisqu’ils en sont la face « humaine », et puisqu’ils font bien souvent office de charnières entre les événements, qu’ils les causent ou les subissent), les PNJ participent également à la sélection et à l’organisation des éléments du cosmos en transmettant au joueur le récit qui l’oriente. Dans bon nombre de jeux, les PNJ représentent la principale source d’information concernant la diégèse ou les tenants et aboutissants du récit qui l’oriente. Leur fonction de transmission se marque de manière particulièrement flagrante dans les RPG, où les villes sont assimilables à de grandes encyclopédies dont chaque habitant serait une entrée140, puisque tous livrent des informations ponctuelles sur l’organisation de l’univers. Le jeu de rôle Fable: The Lost Chapters, dans lequel le joueur peut choisir en permanence la manière dont évoluera son avatar (s’il servira le bien ou le mal, s’il sera mince ou gros, aimable ou effrayant…) fait un usage particulier de ce rôle d’indicateur des PNJ, puisque ceux-ci rendent compte de l’évolution de l’avatar en adoptant des attitudes qui reflètent sa progression. Ainsi, si le joueur s’est montré brutal au fil de sa partie, les villageois qu’il rencontre s’enfuiront sur son passage. Ou encore, s’il a participé à une certaine quête annexe, à savoir la compétition de « latte-poulet » (qui consiste à donner des coups de pied à des poulets pour les envoyer le plus loin possible), les PNJ se moqueront de lui en l’interpellant par des sobriquets tels que « shoote-poulet ».
104En conclusion, tout comme l’avatar, les personnages de jeu vidéo constituent un élément de narrativisation doté d’une certaine complexité. Ceci est dû à leur nature composite, mais aussi au caractère global de l’approche selon laquelle nous les avons étudiés : ce point mériterait, en vérité, d’être déplié et divisé en fonction des différentes catégories de personnages ou d’actants. La description qui précède avait donc principalement pour but d’aménager un domaine encore à construire.
6. Les renvois intertextuels
105Une part importante de la narration vidéoludique est véhiculée sous la forme de renvois intertextuels. Ceux-ci peuvent être transmédiatiques (dans le cas des adaptations de films en jeux vidéo, par exemple), mais peuvent également être internes au médium vidéoludique. En effet, celui-ci se caractérise par une forte tendance à recourir aux stéréotypes, à la sérialité et à la citation (la combinaison entre sérialité et citation est d’ailleurs le principe même du crossover, déjà abordé plus haut).
106La citation d’éléments de narrativisation propres à un autre univers, voire de schémas canoniques (que ce soit pour les conforter ou les subvertir) introduit dans le jeu une part de narration latente, qui n’est pas racontée au joueur mais se contente d’exister, en attente d’un potentiel investissement narratif. Cette narrativité relève bel et bien du récit enchâssé (car elle est prédéfinie), mais d’un récit parallèle, qui constitue une autre orientation possible pour la diégèse, voire qui relève d’un autre univers. La fréquence avec laquelle le jeu vidéo recourt à ces renvois s’explique par l’intérêt ludique qu’ils comportent. Ceux-ci permettent, en effet, d’articuler la narration et l’interactivité de manière particulièrement souple : « [ils] offrent un récit préexistant (mais latent) au joueur sans avoir à le développer, et permettent d’économiser les éléments de fiction dirigée »141.
107Nous ne nous attarderons pas sur ce point car, les renvois étant supportés par d’autres éléments de narrativisation (les personnages, les objets, les éléments du décor…), la description de leurs caractéristiques et des conséquences de leur intégration dans le jeu apparaîtrait ici comme redondante. Citons simplement, à titre d’exemple, deux cas où les renvois intertextuels remplissent un rôle prépondérant dans la portée sémantique de l’œuvre.
108Le premier cas n’est autre que la série de RPG Final Fantasy. Pour rappel, ces jeux (au nombre de quatorze, sans compter les suites qu’ont connues certains épisodes) mettent chacun en scène un univers différent et indépendant des autres. Malgré tout, il existe entre les différents titres de très nombreux renvois ou points de passage. Certains éléments du gameplay se retrouvent dans la plupart des épisodes (l’utilisation des magies, l’invocation de créatures dont le nom change dans chaque jeu…), mais aussi certaines musiques, certains personnages (comme Cid, déjà mentionné plus haut, ou comme les soldats Biggs et Wedge142, qui apparaissent au cinquième opus), de nombreux objets (les aéronefs, certaines armes…) et plusieurs créatures (comme les sortes d’autruches jaunes nommées Chocobos). Ces éléments communs sont connus et attendus par les joueurs de la série, et confèrent une certaine unité aux univers de chaque épisode qui, pourtant, sont parfois très éloignés thématiquement les uns des autres (l’univers heroic fantasy de Final Fantasy IX, par exemple, diverge fortement de celui de Final Fantasy VII, plus orienté cyberpunk). La série constitue donc un cas très particulier d’univers, puisque plusieurs cosmos différents sont associés par des éléments qu’ils partagent en une sorte de « méta-univers » — qui n’est défini que par ces éléments-phares. On retrouve ici une actualisation originale de la conception d’Azuma143, selon laquelle les univers fictionnels relèvent tous de la même « base de données » abstraite, où ils piochent des « éléments d’attraction » qui n’ont de valeur que par leur caractère reconnaissable. Cette logique a d’ailleurs été poussée encore plus loin dans le jeu d’action-RPG Kingdom Hearts, qui constitue un gigantesque crossover entre les univers de Final Fantasy et de Disney.

Figure 26. Un Chocobo, créature présente dans presque tous les Final Fantasy et emblématique de la série (il sert à se déplacer plus vite dans les environnements)

Figure 27. Le jeu Kingdom Hearts mêle les univers de Final Fantasy et Disney au sein d’une tierce diégèse
109Le deuxième exemple que nous esquisserons est issu du jeu de réflexion et de plates-formes nommé Braid. Cette œuvre met en place un renvoi intertextuel qui est proprement vidéoludique, puisqu’il se fait via le gameplay. En effet, la manipulation de l’avatar de Braid rappelle sensiblement le fonctionnement des grands classiques du jeu de plates-formes et, plus spécifiquement, celui des premiers jeux Mario : le gameplay se fonde sur des déplacements simples et sur l’utilisation du saut pour vaincre les ennemis, mécaniques auxquelles Braid ajoute toutefois la possibilité de remonter le temps (faculté nécessaire à la résolution des énigmes). Cette citation ludique est renforcée par la similarité de l’objectif des deux jeux (le héros doit sauver une princesse) ainsi que par certains clins d’œil, comme le fait que, à la fin de chaque niveau, une créature vient annoncer au protagoniste que « la Princesse est dans un autre château ». Bien que le repérage de ces citations ne soit pas nécessaire à la bonne compréhension du jeu et de l’histoire, il comporte un certain poids dans l’interprétation, car le fait de renvoyer précisément au très célèbre Mario constitue un retour à la genèse du jeu vidéo, une citation de l’histoire du médium.
110Or Braid est un jeu qui provient d’un secteur particulier du domaine vidéoludique, actuellement en plein essor : le jeu vidéo indépendant. Cette catégorie rassemble les jeux qui sont créés avec peu de moyens, par un nombre réduit de personnes (voire une personne seule) et qui sont distribués, pour quelques euros généralement, de manière dématérialisée (ils n’ont pas de support physique et sont vendus via internet). Ayant peu de ressources, les concepteurs indépendants choisissent de mettre en avant l’originalité de leurs jeux, de miser sur leurs concepts plutôt que sur d’éventuelles prouesses techniques. Cette nouvelle scène se caractérise par sa tendance à développer, à travers les jeux, « un propos méta-discursif sur leurs prédécesseurs, remettant conjointement en cause les discours dominants de sorte à faire évoluer les formes ludiques »144. À ce titre, l’exemple de Braid est représentatif puisqu’il cite les codes d’un jeu emblématique de l’histoire du médium pour les subvertir en profondeur (nous verrons plus loin que la princesse de cet univers ne veut pas être « sauvée »). L’association du gameplay de Mario avec un principe de manipulation du temps témoigne originalement de cette volonté de remettre en question et de reformuler les bases sur lesquelles s’est développé le jeu vidéo à travers toute son histoire.
Notes de bas de page
61 Le cosmos n’est qu’un ensemble d’éléments non hiérarchisés : ceux-ci peuvent recevoir leur organisation soit du récit vidéoludique du joueur (dans le cas des jeux qui ne possèdent pas de récit enchâssé, comme Les Sims), soit d’une combinaison de ce récit vidéoludique et d’un récit enchâssé (il s’agit alors de jeux pourvus d’une diégèse).
62 Voir point 3.1. du chapitre III.
63 Signalons, au passage, l’existence d’une cinématique possédant un statut particulier : la cinématique d’introduction. Il s’agit d’une séquence vidéo qui précède le lancement du jeu (elle introduit généralement l’apparition de l’écran-titre) et qui joue le rôle de « bande-annonce » de l’œuvre. Il s’agit donc d’un élément du paratexte qui prédétermine potentiellement la réception que le joueur fera de l’univers.
64 Le débrayage est un procédé énonciatif par lequel « l’énonciateur, lors de l’événement de langage, projette hors de lui des catégories sémantiques qui vont installer l’univers du sens. […] Par le débrayage, le sujet énonçant crée des objets de sens distincts de ce qu’il est hors langage. Il projette dans l’énoncé un non-je (débrayage actantiel), un non-ici (débrayage spatial) et un non-maintenant (débrayage temporel), séparés du /je-ici-maintenant/ qui fondent son inhérence à lui-même ». L’embrayage, ensuite, est une opération seconde par laquelle l’énonciateur peut installer le discours à la première personne. « Elle consiste alors pour le sujet de la parole à énoncer les catégories déictiques qui le désignent, le “je”, l’“ici” et le “maintenant” : leur fonction est de manifester et de recouvrir le “lieu imaginaire de l’énonciation” par le moyen des simulacres de présence que sont je, ici, maintenant. […] L’embrayage suppose donc le débrayage antérieur auquel il s’ajoute ». Voir : Bertrand (Denis), Précis de sémiotique littéraire, Paris, Nathan, 2000, p. 57–58.
65 Que nous distinguerons — sauf mention contraire — en utilisant de manière stricte les termes cut-scenes (pour les scènes calculées par le moteur graphique du jeu) et cinématiques (pour les vidéos d’une qualité visuelle supérieure). L’expression « scène cinématique », quant à elle, sera utilisée pour désigner l’ensemble de ces séquences de manière générale.
66 Ou, du moins, qui sont reçus comme tels en raison de la présence des cinématiques : le choix de ce qui sera ou non présenté sous cette forme a donc d’importantes conséquences diégétiques, puisqu’il est à la base de la distinction entre récit enchâssé et récit vidéoludique. Par exemple : l’action ludique de vaincre un boss est, d’un point de vue narratif, un événement important. Pourtant, c’est, bien souvent, la conséquence de cette victoire qui est montrée au joueur via une scène cinématique, et non le combat en lui-même (qui appartient au jeu). Cette alternance permet au joueur de s’immerger dans le combat pour ensuite se distancier dans les cinématiques (et s’émouvoir, se positionner…) vis-à-vis des conséquences de ses actes.
67 Ce jeu d’horreur met en scène Leon, un agent spécial qui part à la recherche de la fille du président, enlevée par un groupe aux intentions inconnues. L’intrigue se déroule dans une région rurale d’Espagne dont tous les habitants sont atteints d’un virus qui les rend agressifs.
68 Ce qui est, d’ailleurs, renforcé par le fait que ces séquences sont calculées par le moteur du jeu, et ne sont donc pas différenciées, par leur aspect, des phases jouables.
69 La seconde guerre mondiale n’a pas eu lieu grâce à l’intervention d’Albert Einstein (qui a neutralisé Hitler en remontant le temps via l’une de ses inventions), mais l’URSS est devenue aussi puissante que les États-Unis et les deux nations entrent en guerre.
70 Jost (François), L’œil-Caméra. Entre film et roman, Lyon, Presses Universitaires de Lyon, 1987, p. 19.
71 Elles présentent l’univers, établissent une ambiance pour ce dernier et font évoluer le récit en marquant le passage d’une phase à l’autre (ou d’un décor à l’autre). Elles soulignent — on l’a dit — l’importance de certains événements, ou renseignent le joueur sur le passé de l’univers via des paralepses… D’un point de vue plus stylistique, elles permettent également d’introduire du suspense ou une certaine tension dramatique dans les actions du joueur, ou, plus généralement, de renforcer la portée émotionnelle des événements (en donnant au joueur l’occasion de s’y arrêter passivement quelques instants).
72 Bélanger-Gagnon (Jean-François), La conjonction de la narrativité et de la performativité dans le jeu vidéo, Mémoire en Design, animation et cyberculture, Université Laval – Québec, 2010, p. 30. Disponible en ligne sur Mémoires et thèses électroniques de l’Université Laval. URL : www.theses.ulaval.ca/2010/26894/26894.pdf.
73 Letourneux (Mathieu), art. cit., p. 203.
74 Ou, plus rarement, aux dessins animés ou à la bande dessinée. C’est, par exemple, le cas des jeux qui utilisent le procédé du cel-shading, tels que la série des Dragon Ball Z: Budokai Tenkaichi. Dans cette saga, l’utilisation du cel-shading se justifie par la volonté de conserver une cohérence graphique pour l’univers fictionnel (puisque ces jeux sont tirés d’un manga). Néanmoins, dans certains cas, la référence à la bande dessinée peut également constituer un véritable choix artistique, comme dans la suite de jeux Max Payne, où certaines cinématiques sont remplacées par des planches de bandes dessinées lues par des voix off.
75 Genvo (Sébastien), Introduction aux enjeux artistiques et culturels des jeux vidéo, op. cit., p. 52.
76 Schaeffer (Jean-Marie), Pourquoi la fiction ?, Paris, Éditions du Seuil, 1999, p. 152.
77 Loc. cit., p. 162–163.
78 La présence d’une « caméra fictive » est aussi régulièrement simulée à l’intérieur des phases de jeu : dans Metal Gear Solid 2: Sons of Liberty, par exemple, lorsque l’avatar sort de l’eau, l’écran se couvre de gouttelettes, comme si celles-ci s’étaient collées à l’objectif. Les jeux de football ont également la particularité d’imiter le point de vue que l’on donne habituellement des matchs à la télévision (même si, dans ce cas précis, il s’agit plus d’un marqueur de réalité que d’un marqueur de fiction).
79 Genvo (Sébastien), « Caractériser l’expérience du jeu à son ère numérique : pour une étude du “play design” », Colloque « Le jeu vidéo : expériences et pratiques sociales multidimensionnelles », Québec, 2008. Disponible en ligne sur Ludologique. URL : http://www.ludologique.com/wordpress/wp-content/uploads/2012/03/play_design.pdf.
80 Les affinités entre jeu et fiction ne sont, d’ailleurs, plus à démontrer.
81 Smith (Greg M.), « Computers Games Have Words, Too: Dialogue Conventions in Final Fantasy VII », dans Game Studies, vol. II, n° 2, décembre 2002, non paginé [en ligne]. URL : http://www.gamestudies.org/0202/smith/.
82 Ces espaces vides laissés par le texte et l’image constituent d’ailleurs une importante stimulation pour la rédaction de fanfictions, dans le sens où ils encouragent les joueurs à combler eux-mêmes les lacunes laissées par le récit enchâssé.
83 Dont une part importante de l’imaginaire provient d’une culture livresque, en particulier des œuvres de J.R.R. Tolkien.
84 Bouchardon (Serge), « Les récits littéraires interactifs », dans Formules, no 10, juin 2006, p. 8. Disponible en ligne sur UTC (Université de Technologie de Compiègne). URL : http://www.utc.fr/~bouchard/articles/bouchardon-formules.pdf.
85 Ce caractère concret du texte se marque également dans l’attention qui est souvent portée à la matière scripturale elle-même. Dans le jeu Ōkami, par exemple, lorsqu’un personnage mentionne, dans un dialogue, un objet ou un endroit qui va avoir une certaine importance sur le plan ludique, celui-ci apparaît en rouge dans le texte.
86 Si les exemples ci-dessus proviennent tous deux de RPG, cela ne signifie pas pour autant que les choix de répliques soient l’apanage de ce seul genre : les jeux d’aventure (tels que Heavy Rain) ou les nombreux représentants du sous-genre des point-and-click en font aussi un usage très régulier. Certains FPS (tels que S.T.A.L.K.E.R.: Shadow of Chernobyl ou Dark Messiah of Might and Magic) recourent également à ce dispositif.
87 En vérité, cet événement connaît quatre variantes : l’avatar peut y être accompagné de l’une des trois jeunes filles, mais peut également choisir pour compagnon un personnage masculin — l’imposant Barret — dans le cas où le joueur aurait refusé d’adresser la parole à ses trois prétendantes, ou aurait choisi systématiquement les répliques les plus désagréables. Selon le personnage, la scène du téléphérique peut passer de hautement dramatique à totalement humoristique.
88 Remarquons que seule l’une des deux options demande au joueur une confirmation textuelle : s’il souhaite détruire l’épée, celui-ci devra répondre affirmativement à un message lui demandant s’il est sûr de son choix. Dans le cas contraire, il lui suffit d’utiliser l’épée contre sa sœur, sans autre forme de procès. Il est donc intéressant de noter que, dans cet exemple précis, le choix le plus avantageux du point de vue ludique (le fait de conserver l’épée) est posé via un acte qui est lui aussi ludique, tandis que le choix qui témoigne d’un investissement émotionnel dans les personnages du récit (sauver la sœur) se fait par l’intermédiaire d’un texte (c’est-à-dire moyennant une légère distanciation vis-à-vis de l’action).
89 Le jeu a d’ailleurs, étonnamment, suscité la création de quelques fanfictions.
90 Où situer, par exemple, le curseur du jeu Black and White ? Dans ce god game, le joueur incarne un dieu qui doit gérer un petit monde et accumuler un maximum de fidèles (soit en les aidant, soit en les terrorisant). Or le curseur y a la forme d’une main : sans pouvoir réellement être considéré comme un actant, il n’en reste pas moins une incarnation synecdochique du joueur, qui a pour effet de fictionnaliser et de thématiser ce dernier.
91 Concept adapté au jeu vidéo par Sébastien Genvo, notamment dans Genvo (Sébastien) et Pignier (Nicole), « Comprendre les fonctions ludiques du son dans les jeux vidéo. Pour la formulation d’un cadre théorique de sémiotique multimodale », dans Communication, vol. 28, n° 2, 2011, non paginé [en ligne]. URL : http://communication.revues.org/1845.
92 Voir la note numéro quatre de ce chapitre pour les définitions d’embrayage et de débrayage.
93 « Toute la problématique de l’identité personnelle va tourner autour de cette quête d’un invariant relationnel, lui donnant la signification forte de permanence dans le temps » ; voir Ricœur (Paul), Soi-même comme un autre, Paris, Éditions du Seuil, 1990, p. 142–143.
94 Dans sa description de la relation du joueur à l’avatar, Vincent Mabillot emploie les termes de « condensation » (lorsque l’avatar est une extension du joueur, que leurs corps se superposent) et de « distanciation » (lorsque l’avatar est une marionnette manipulée par le joueur). Voir Mabillot (Vincent), « Points d’action et points de vue, artifices de la perméabilité entre réel et symbolique illustrés dans la mise en scène de trois jeux vidéo : Tomb Raider, Myst et Duke Nukem 3D », Séminaire « A.S.I. — L’action sur l’image », Paris, 2000, non paginé. Disponible en ligne sur L’action sur l’image — pour l’élaboration d’un vocabulaire critique. URL : http://hypermedia.univ-paris8.fr/seminaires/semaction/seminaires/txt99–00/05text.htm.
95 « À la différence de l’identité abstraite du Même, l’identité narrative, constitutive de l’ipséité, peut inclure le changement, la mutabilité, dans la cohésion d’une vie » ; voir Ricœur (Paul), Temps et récit, tome 3. Le temps raconté, Paris, Éditions du Seuil, 1985, p. 355.
96 Therrien (Carl), « Le jeu vidéo : point de vue sur la narratologie », sur Gregory Chatonsky : Notes et fragments, non paginé. URL : http://chatonsky.net/fragments/le-jeu-video-point-de-vue-sur-la-narratologie/.
97 Ibid.
98 Nous reviendrons plus en détail sur la question du point de vue — très imbriquée à celle de l’avatar, puisqu’elle conditionne notamment le rapport que le joueur entretient avec ce personnage — dans le point sur la caméra.
99 Mpondo-Dicka (Patrick), « Les scènes cinématiques dans les jeux vidéo. Analyse sémiotique de quelques formes et fonctions », dans Genvo (Sébastien), dir., Le game design de jeux vidéo. Approches de l’expression vidéoludique, Paris, L’Harmattan, 2005, p. 226.
100 Guillomont (Aymeric de), « Les jeux dont vous êtes le héros. Analyse sémio-actantielle des jeux vidéo en solo », dans Genvo (Sébastien), dir., Le game design de jeux vidéo. Approches de l’expression vidéoludique, Paris, L’Harmattan, 2005, p. 137–160.
101 Loc. cit., p. 152.
102 Ibid.
103 Jeu dans lequel, de plus, on ne peut voir le conducteur de la voiture.
104 Bouchardon (Serge), Littérature numérique. Le récit interactif, Paris, Hermes Science Publications, 2009, p. 115–121.
105 Nélide-Mouniapin (Bernadette), « Exemple d’énonciation dans un jeu vidéo », dans Genvo (Sébastien), dir., Le game design de jeux vidéo. Approches de l’expression vidéoludique, Paris, L’Harmattan, 2005, p. 239–251.
106 Loc. cit., p. 245.
107 Barthes (Roland), Fragments d’un discours amoureux, Paris, Éditions du Seuil, 1977, p. 153.
108 Il existe néanmoins quelques exemples d’avatars possédant un vouloir-faire minimal. Dans certains shoot’em up, notamment, le vaisseau qui est mis à disposition du joueur avance en permanence, même sans l’aide de ce dernier. Dans ce cas, il incombe au joueur de prendre en compte ce déplacement autonome dans sa façon de jouer. Pour plus de précisions, voir Mpondo-Dicka (Patrick), art. cit., p. 209–236.
109 Ibid.
110 Gee (James Paul), What Video Games Have to Teach us About Learning and Literacy, New-York, Palgrave Macmillan, 2007 ; dont la pensée est résumée par Bélanger-Gagnon (Jean-François), op. cit., p. 31.
111 Ibid.
112 Voir les analyses de Genvo (Sébastien), « Transmédialité de la narration vidéoludique : quels outils d’analyse ? », art. cit., version en ligne non paginée.
113 Dans ce type de jeux (dont le but est généralement de construire une base et de détruire celle des adversaires), les agissements des ennemis sont souvent dissimulés au joueur : l’exploration y constitue donc une phase déterminante dans l’élaboration d’une stratégie.
114 Ibid.
115 Cet exemple illustre donc la nécessité — déjà remarquée à propos du cinéma — de distinguer la focalisation par un personnage de la focalisation sur un personnage : la première équivaut, en vérité, à une focalisation interne (les informations sont filtrées par la conscience du personnage), tandis que la seconde (qui est à l’œuvre dans Ico) consiste simplement à isoler et à suivre l’acteur principal du récit, en lui laissant le monopole de l’écran et en centrant donc les informations autour de lui (sans que cela ne corresponde nécessairement avec une focalisation interne). Voir pour plus de précisions : Aumont (Jacques), Bergala (Alain), Marie (Michel) et Vernet (Marc), Esthétique du film, Paris, Nathan, 1983, p. 84.
116 Cette évolution narrative de l’avatar se retrouve, à l’occasion, dans d’autres genres que le jeu de rôle : il existe des FPS, des jeux d’action ou même des jeux de sport qui utilisent ce principe. Néanmoins, ceux-ci sont généralement catégorisés comme des genres hybrides : l’on parle alors de FPS avec « des composantes de RPG », par exemple.
117 Les niveaux des personnages correspondent, dans ce jeu, à un agrandissement des « arbres de talents » qui permettent de perfectionner leurs compétences. Or ces niveaux ne peuvent être acquis qu’en passant d’un chapitre à l’autre de l’histoire. Tourner en rond dans la même zone pour entraîner son équipe est donc inutile (du moins dans les premières phases du jeu) puisque les personnages resteront bloqués à un certain plafond tant que le joueur n’aura pas progressé dans l’histoire.
118 Très fameuse série de jeux d’aventure-action développée par Nintendo.
119 Il s’agit donc d’un crossover.
120 Il peut être plus ou moins narrativisé, médiatiser le rapport du joueur à l’univers via différents types de focalisation, jouer le rôle de héros ou celui d’adjuvant, être assimilé au joueur ou conserver son autonomie…
121 Aumont (Jacques), Bergala (Alain), Marie (Michel) et Vernet (Marc), op. cit., p. 93.
122 Voir Metz (Christian), Le signifiant imaginaire : Psychanalyse et cinéma, Paris, Christian Bourgois Éditeur, 1993, p. 67–79.
123 Genvo (Sébastien), Le game design de jeux vidéo. Approche communicationnelle et interculturelle, Thèse de doctorat en Sciences de l’information et de la communication, Université Paul Verlaine – Metz, 2006, p. 124. Disponible en ligne sur Ludologique. URL : http://www.ludologique.com/wordpress/these_sebastien_genvo.pdf.
124 Perron (Bernard), Au cœur du cercle magique, Conférence présentée à l’Université de Laval en février 2008 ; cité par Bélanger-Gagnon (Jean-François), op. cit., p. 30.
125 Ibid.
126 Le jeu se déroule dans les ruines sous-marines d’une société initialement utopique qui a dégénéré.
127 Soulignons, à ce propos, que les contraintes ludiques imposent bien souvent le recours à des attitudes ou des postures exagérées ou caricaturales. En effet, le point de vue du joueur étant généralement associé, d’une manière ou d’une autre, à l’avatar, il est rare de voir l’image se centrer sur le visage des personnages secondaires. Pour transmettre leurs états d’âme, ceux-ci sont donc contraints de mobiliser tout leur corps ou de répéter plusieurs fois le même mouvement (rire en se penchant ostensiblement en arrière, se recroqueviller et regarder constamment de chaque côté sous le coup de la peur, etc.).
128 « Animation d'un personnage s'exécutant lorsque ce dernier est passif ou, pour un avatar, lorsqu'aucune commande de mouvement en provenance du joueur n'est transmise au jeu par l'entremise de l'interface physique », selon Bélanger-Gagnon (Jean-François), op. cit., p. 32.
129 Un « Worg » (sorte de loup) prend, par exemple le nom de « Worg affamé » dans une autre zone où son niveau est bien plus élevé.
130 Fuller (Marie) et Jenkins (Henry), « Nintendo® and New World Travel Writing. A Dialogue », dans Jones (Steven G.), ed., Cybersociety. Computer-Mediated Communication and Community, Thousand Oaks, Sage Publications, 1995, p. 61. Disponible en ligne sur Stanford University. URL : http://www.stanford.edu/class/history34q/readings/Cyberspace/FullerJenkins_Nintendo.html.
131 Nous reviendrons plus longuement sur cette indistinction dans le point consacré aux objets.
132 Il apparaît plusieurs fois au fil du jeu, prête une épée à Kirby avant de le combattre, perd son masque avant de s’enfuir lorsqu’il est battu…
133 Les boss sont, en somme, des étapes du jeu qui obligent le joueur à se rapprocher d’un « lecteur modèle », qui est celui dont les capacités ludiques se développent au même rythme que la progression narrative de l’œuvre.
134 Guardiola (Emmanuel), art. cit., p. 164.
135 Le terme « Otaku » est utilisé, au Japon, pour désigner les passionnés de mangas, jeux vidéo, figurines, science-fiction, dessins animés, etc. Ce phénomène culturel japonais — qui comporte de nombreuses similitudes avec ce que l’on appelle ici la « culture geek » — a été décrit pas Azuma dans Azuma (Hiroki), Génération Otaku. Les enfants de la postmodernité, Paris, Hachette Littératures, 2008.
136 Loc. cit., p. 76.
137 Une réception sous forme de consommation, comme nous le verrons dans le point traitant des objets.
138 L’héroïne pulpeuse de la saga des Tomb Raider.
139 Azuma (Hiroki), op. cit., p. 81.
140 Comme l’ont remarqué les rédacteurs de Les Cahiers du Jeu Vidéo, dans Fortin (Tony), dir., Les Cahiers du Jeu Vidéo no 3. Légendes Urbaines, Cergy, Éditions Pix’n Love, 2010, p. 84.
141 Letourneux (Mathieu), art. cit., p. 198.
142 Dont les noms revoient, d’ailleurs, à deux personnages des films Star Wars.
143 Azuma (Hiroki), op. cit.
144 Genvo (Sébastien), « La princesse est une bombe atomique. Approche ludologique du personnage de la princesse dans Braid », Colloque « Genre et jeux vidéo », Lyon, 2012. Disponible en ligne sur Ludologique. URL : http://www.ludologique.com/publis/ColloqueLyonGS.pdf.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Une brève histoire de la science-fiction belge francophone et autres essais
Recueil d’articles
Dominique Warfa
2018
Parler le jeu vidéo
Le ludème comme unité minimale d’une grammaire vidéoludique ?
Damien Hansen
2023