5.3 Attribution automatique des figurines au moyen d’un système expert
p. 281‑296
Texte intégral
1L’identificaton des provenances permet d’affecter un coroplathe à un centre de production, de vérifier que les objets de même typologie correspondent tous à la production exclusive d’un atelier ou qu’ils ont été imités par un autre atelier à partir d’un moule identique ou copiés par surmoulage d’un objet semblable. La datation archéologique par stratigraphie d’objets identifiés par leur typologie et leur composition chimique permet d’établir des repères chronologiques qui serviront ensuite à dater l’ensemble de la production céramique.
2Toutefois, comme il est déraisonnable d’envisager d’analyser en laboratoire l’ensemble des figurines gallo‑romaines, la mise au point d’un système expert adapté à chaque type d’objets permettra de rattacher les pièces non analysées au moyen d’un fichier de référence comportant les critères d’identification jugés pertinents. Ces critères sont basés principalement sur la typologie semi‑fine, établie à partir d’un certain nombre d’objets ou de moules, signés ou non. L’aspect de la terre peut également servir à distinguer les productions.
3Nous exposerons ici un premier test établi sur un nombre de critères limités appliqués aux Vénus anadyomènes ou pudiques, au moyen du système expert Systex développé par Bernard Deloche en vue de l’attribution automatique des œuvres d’art anonymes.
5.3.1 Un logiciel d’attribution automatique : Systex
4Systex a été initialement conçu dans un contexte parfaitement étranger –au moins en apparence– aux préoccupations des archéologues. Il s’agissait de vérifier l’hypothèse d’esthétique théorique selon laquelle la création artistique, loin d’être livrée à l’arbitraire d’une sorte de « coup de dés », procédait d’une logique parfaitement rigoureuse et objectivement repérable : une logique des séries, des modulations et des combinaisons. Loin d’engendrer ses œuvres d’une façon discontinue et presque aléatoire, le créateur, peintre, poète ou modeste artisan –coroplathe par exemple–, fidèle à la logique des formes, opérerait des choix cohérents à l’intérieur d’un registre propre (son « projet fondamental », aurait dit Sartre) qu’il aurait implicitement défini au départ. De là, l’idée d’une éventuelle reconnaissance par le calcul des productions d’un artiste ou d’une école, c’est‑à‑dire la mise au point d’une technique d’identification ou d’attribution automatique complétant l’intuition, apparaissait comme l’instrument le plus évident de cette vérification.
5Problématique et discours vraiment étrangers aux archéologues ? Voilà qui n’est pas si sûr, car dans son esprit la méthode est empruntée à l’archéologie et, dans une moindre mesure sans doute, à l’ethnologie. Pour se constituer comme une science à part entière, alors qu’elle était demeurée le refuge des sentimentaux et des rêveurs, l’esthétique a dû chercher des modèles dans des sciences opérationnellement déjà constituées. Ainsi la rencontre de l’esthéticien et de l’archéologue n’est certainement pas le fruit du hasard, mais s’enracine dans l’histoire relativement récente des sciences de l’Homme, tant il est vrai que ce sont des archéologues qui, les premiers, sans en avoir toujours la pleine conscience, ont traité scientifiquement des œuvres d’art. C’est, en effet, auprès des archéologues et des ethnologues, que les esthéticiens ont appris à traiter une œuvre d’art comme un document objectif, sans surépaisseur symbolique ni valorisation abusive d’aucune sorte, un document appartenant à des séries plus ou moins complexes qu’il est permis de soumettre au calcul. Avec les archéologues en effet, chaque objet est soigneusement disséqué, décomposé en unités discrètes, avant d’être soumis à une description conventionnelle et normalisée, selon un procédé tabulaire. Ainsi transformé et traduit, au prix d’une incontestable simplification dont la validité représentative réclame chaque fois une évaluation critique, l’objet se prête à l’application de procédures formelles. Il en va de même de la pièce d’orfèvrerie ou du siège Louis XV, voire du tableau ou de l’édifice architectural, qu’on ne peut traiter statistiquement qu’après les avoir réduits à une combinaison de formes transcrite dans un code descriptif1 (fig. 119).

FIG. 119 – Systex : organigramme.
6Plus concrètement, Systex est né de l’idée que connaître, c’est pouvoir reconnaître et que, si l’on peut, en toute connaissance de cause, par des procédés non intuitifs, reconnaître ce que l’on connaît, il devient alors possible d’étendre la démarche à l’identification de l’inconnu. D’où l’idée de formaliser, voire d’automatiser, les procédures d’attribution des spécimens anonymes. Deux outils se proposaient alors : les typologies et les systèmes experts.
5.3.2 Examen critique de deux démarches d’attribution
Fragilité des typologies
7La première idée consistait à fonder l’attribution des spécimens inconnus sur une mise en ordre systématique du corpus des objets connus : un individu capable d’entrer dans une classification, c’est‑à‑dire possédant les constantes et les principales options d’une classe, serait tenu pour identifié.
8Que fait l’archéologue des données qu’il a souvent laborieusement rassemblées ? On répondra qu’il s’efforce de les ordonner afin d’en extraire des conclusions pertinentes susceptibles d’accroître la connaissance. Les exemples ne sont pas rares et les méthodes non plus : Jacques Bertin a montré dans La graphique combien les données brutes sont en elles‑mêmes insignifiantes et comment le seul remaniement de leur disposition mutuelle peut suffire à en révéler la signification. De leur côté Vadim Elisséeff ou Marie‑salomé Lagrange ont exploité avec succès des techniques de sériation comme la scalogrammatique2.
9La question se pose toutefois d’évaluer la portée cognitive des différentes méthodes (hiérarchiques ou non) de classification automatisée. En un mot, les typologies, très efficaces lorsqu’il s’agit de communiquer un savoir (car elles mettent en évidence des groupes distincts et homogènes, selon un principe délibéré de discontinuité), sont‑elles des outils satisfaisants de construction de la connaissance et permettent‑elles son application sans défaut ? En fait, il semble bien qu’elles ne conviennent vraiment ni à l’un ni à l’autre des objectifs suivants.
10● Dans l’organisation des données, la discontinuité typologique se révèle être un obstacle majeur car elle se heurte sans cesse à la casuistique de l’affectation des hybrides : si le réel n’a pas la claire limpidité d’un tout ordonné en classes nettement isolables, alors où ranger tel spécimen bâtard ? Le plus souvent, le typologue ne construira son édifice qu’au prix d’une amputation plus ou moins sévère du corpus initial, notamment en négligeant les variantes secondaires.
11● Même difficulté lorsqu’il s’agit d’appliquer les connaissances. Par l’ordonnance systématique qu’elle introduit dans le corpus, la typologie semble, au premier regard, offrir un appui substantiel à l’interpolation (combler les lacunes) et à l’extrapolation (étendre potentiellement le champ des individus connus).Or, ici encore, la discontinuité typologique ne cesse d’entraver la démarche cognitive ; si l’on ne peut déterminer sans discussion à quelle classe appartient l’individu à identifier, il sera bien difficile d’affirmer qu’il est bien homogène au corpus de référence.
12Bref, la difficulté majeure des typologies tient à ce qu’elles sont des constructions artificieuses –autant qu’artificielles– et, de ce fait, incapables de gérer la connaissance des hybrides, car inaptes à maîtriser les relations fines entre les individus ou les propriétés3. C’est de l’indécision, voire de l’indétermination des typologies qu’est née l’idée de recourir à un système expert pour résoudre les questions d’attribution, car le système expert est conçu pour gérer des relations logiques complexes.
Insuffisance des systèmes experts classiques
13Comment reconnaître, sur description codée, la production d’un artiste, d’une école, d’une région, etc., et comment distinguer cette production de celle d’altistes ou de régions voisines ? Il s’agit simultanément d’identifier et de discriminer des spécimens objectifs, et le recours aux systèmes experts peut être considéré aujourd’hui comme une solution logique satisfaisante, dans la mesure où ces logiciels représentent généralement la forme la plus cohérente et la plus élaborée de l’application d’un savoir.
14En dépit d’un certain nombre de variantes dans leurs modalités de fonctionnement, les logiciels reconnus habituellement sous le nom de systèmes experts se présentent toujours de la même manière :
– les connaissances de l’expert humain sont réunies dans une base de règles (du type « si... alors...») ;
– la situation à traiter à un moment donné est définie comme base de faits (du type «Or... ») ;
– un moteur d’inférence, c’est‑à‑dire un système de liaison logique entre les propriétés, pourra, par chaînage des règles appliquées à la base de faits, déduire diverses conclusions (il en résultera un diagnostic, une attribution, une discrimination, etc.). Ce moteur d’inférence fait intervenir les règles au moment où elles sont utiles dans le raisonnement, et cela de façon non procédurale, sans suivre un algorithme stéréotypé (le terme de procédure désigne en effet un ensemble d’opérations soumises à un ordre unique et prédéterminé). Un fait étant posé, le logiciel cherche dans la base de règles la ou les règles dont ce fait constitue la prémisse, après quoi il recherche quelles sont les règles dont la prémisse est constituée par la conclusion de la première règle, et ainsi de suite jusqu’à la conclusion finale. Selon un principe de simulation de l’intelligence humaine, capable d’inventer des démarches logiques, les règles n’interviennent donc qu’en fonction des faits donnés pour construire le raisonnement.
15Quelles que soient les options de leur concepteur –chaînage avant ou chaînage arrière ; modus ponens ou modus tollens, etc.4–, tous ces logiciels ont pour caractéristique essentielle d’exploiter un ensemble de connaissances acquises préalablement et par des voies étrangères au système. Ce qui signifie que les systèmes experts n’exploitent pas tout le potentiel logique des objets connus, d’où l’idée de substituer à la base de règles construite par l’expert humain l’analyse complète d’un ensemble d’individus connus préalablement décrits selon des normes convenues.
5.3.3 L’originalité de Systex, l’expert automatique
16« Un système expert nécessite l’étape fastidieuse de la création d’une base de règles décisionnelles que l’informaticien arrache par bribes à l’expert qui, le plus souvent, ne les a pas formalisées. »5 Comment parer à cette difficulté ? C’est sur deux points principalement que systex, en différant des systèmes experts classiques, offre une solution.
17Au lieu de recevoir une base de règles conçue de façon extrinsèque et faite de connaissances expérimentales souvent arbitrairement mêlées à un savoir empirique, Systex traite un corpus d’individus connus, c’est‑à‑dire parfaitement identifiés quant à la question posée (on connaît par exemple l’auteur, la région, etc., bref la classe d’appartenance par référence à laquelle on voudrait situer des spécimens inconnus). Ce corpus doit avoir été décrit selon un code dont on a préalablement vérifié la pertinence, chaque individu constituant une ligne dans un tableau plus ou moins important dont les colonnes forment les propriétés. Pour un auteur donné, Priscus ou Pistillus par exemple, le programme explore la totalité des individus du tableau répondant à cette classe et extrait deux types de règles :
– toutes les propriétés qui sont exclues (Priscus n’a jamais fait cela) ;
– toutes les relations d’implication entre les propriétés représentées (si Iuli a fait D = 6, alors il a fait B = 3 et C = 3)6.
18La base de règles est donc intégralement construite par l’analyse d’individus réputés connus. L’avantage de cette technique est l’exploitation exhaustive des relations logiques du corpus, relations que l’expert humain est incapable de calculer directement7. L’attribution ou la reconnaissance se fonde donc exclusivement sur le système logique intrinsèque au corpus, ce qui permet de mettre en œuvre directement des paramètres dont l’intuition pouvait négliger l’importance.
19Contrairement aux systèmes experts habituels, l’algorithme de Systex est entièrement procédural, c’est‑à‑dire conforme à un ordre constant : lorsqu’on lui décrit un nouvel objet présumé inconnu, il explore la totalité de la base de règles et vérifie arc après arc (segment après segment) la conformité de l’objet testé avec les règles de reconnaissance d’un auteur donné ; chaque fois que cet objet ne contredit aucune des règles de l’auteur à reconnaître, il affiche le nom de cet auteur, sinon il passe à l’examen du lot de règles suivant. La base de règles répond à un graphe de dépendance orienté, que parcourt le programme ; lorsque l’individu testé contredit l’une des règles, tout se passe comme s’il interrompait la lecture du graphe. L’exploration des règles se faisant par lots, un individu testé peut recevoir plusieurs attributions successives (ce qui marque une difficulté de discrimination). A contrario, Systex pourra donner les raisons d’un refus d’attribution : la formulation d’une hypothèse initiale, si elle se trouve infirmée, entraîne l’affichage de la liste des règles contredites par l’individu testé.
20Le programme peut en outre évaluer lui‑même la fiabilité et la pertinence du système de reconnaissance ainsi élaboré.
21Il est possible de faire un test séquentiel (ou traitement en continu) du corpus d’où on été extraites les règles, ce qui permet de vérifier que le système reconnaît bien ce qui constitue la source de sa base de règles.
22Ce test séquentiel sert aussi à évaluer le pouvoir discriminant de la base (le programme calcule le pourcentage des attributions doubles ou multiples, c’est‑à‑dire des intersections d’ensemble).
23Il gère également un fichier d’individus anonymes, auquel il est possible d’appliquer le test séquentiel ; ainsi, lors de chaque accroissement du corpus des individus connus, on fera extraire à nouveau les règles et on les appliquera aux spécimens anonymes du fichier afin d’observer les modifications éventuellement intervenues dans les attributions.
24Enfin, et surtout, le programme est fécond, dans la mesure où il est capable de reconnaître des objets qui ne répondent à aucune description connue. En effet, si un spécimen testé ne présente aucune propriété exclue et ne contredit aucune implication, il sera reconnu : il y a des cas où des propriétés ne sont les prémisses d’aucune implication, c’est‑à‑dire où la présence de certaines propriétés n’entraîne pas ipso facto celle de propriétés connexes. Par le jeu des inclusions –« B or not A »–, l’absence de A autorise l’existence de B : ainsi une occurrence étrangère à la règle « A implique B » peut parfaitement être admise, à condition qu’elle ne tombe pas sous le coup des exclusions. Cette propriété logique de l’implication permet en particulier l’attribution d’individus fragmentaires (pièces mutilées ou tessons).
5.3.4 Typologie des Vénus
25Lorsqu’on doit étudier un abondant matériel (archétypes, moules, figurines, du moindre fragment aux pièces complètes) représentant un même sujet, Vénus dans le cas présent, on est naturellement amené à opérer un tri ; celui‑ci sera effectué selon des critères personnels qui deviennent de plus en plus nombreux et affinés au fur et à mesure de la progression de l’étude ; et ceci pour plusieurs raisons :
– d’une part parce que l’œil s’éduque et distingue mieux dans un lot de figurines obtenues à partir d’un même archétype, donc apparemment identiques, d’imperceptibles nuances dans des détails qui, de prime abord, ne paraissaient pas suffisamment significatives pour être prises en compte (forme des yeux, des paupières, présence d’une pupille, etc.) et qui vont aider à identifier une nouvelle série ; chaque série peut être le reflet d’une particularité de fabrication spécifique à tel coroplathe ou atelier ;
– d’autre part, parce que le matériel de référence s’accroît continuellement de représentations nouvelles et souvent inattendues qui peuvent mettre en échec les prévisions des esprits les plus imaginatifs ;
– et enfin, pour tenter de découvrir la logique de l’association de ces critères.
26Ces critères vont former l’armature d’une typologie. Pour la réaliser, la démarche essentielle consiste à les choisir avec logique, dans un système ouvert permettant d’abord une classification en types, puis en groupes, eux‑mêmes divisés en sous‑groupes (Rouvier‑Jeanlin 1973 : 115). Pour répondre exactement à la définition du type, les changements d’attitude (debout, assis, allongé, etc.) ont été adoptés dans les premiers essais de typologie ; c’était oublier qu’une attitude unique caractérise certains sujets, telle la Vénus anadyomène toujours figurée en station debout ; pour ces quelques cas, les détails de la pose devenaient alors déterminants : aussi avons‑nous choisi la disposition des mains et le point d’attache de la draperie comme critères prédominants (la draperie passe sur le poignet, la main repose sur la draperie, etc.). Le premier tri des types effectué, la division en groupes s’imposait. Pour les établir il fallait choisir un élément commun à toutes les Vénus, dont les détails fussent soumis à des variations stylistiques (que nous espérions d’origine chronologique), telle la forme de la coiffure. Parce qu’une cassure (accidentelle ou rituelle) du cou, partie la plus fragile du corps, a souvent séparé la tête du corps, bien des Vénus acéphales ne pouvaient être caractérisées par le groupe ; mais elles furent identifiées par le sous‑groupe réservé aux formes des plis de la draperie (plis rectilignes, plis en V superposés, plis vermiculés, etc.).
27Une fois ce classement achevé, des intuitions se confirmèrent, des évidences devinrent criantes : par exemple, tel type de draperie accompagnait‑il toujours le même type de coiffure ? y avait‑il une corrélation entre certaines typologies et la production de certains ateliers ? En associant ces typologies aux informations archéologiques de datation pouvait‑on espérer arriver à transformer en fossiles directeurs certaines séries de figurines ? Comme nous l’avons signalé plus haut, toutes ces questions nous amenèrent à rechercher de plus en plus de critères sélectifs, dont le nombre croissant allait en compliquer la gestion. Les tableaux descriptifs devenaient difficilement exploitables. L’utilisation de l’ordinateur nous a offert la possibilité d’étendre encore la sélection et rendait illimitée la capacité de stockage des figurines typologiées en y associant les attributions de provenance obtenues par analyse physico‑chimique de l’argile. On pouvait alors passer d’une typologie sommaire à une typologie fine.
28Cependant, ce progrès allait faire surgir une autre difficulté : l’obligation de faire appel à des collaborateurs pour remplir rapidement des centaines de bordereaux à partir de cette typologie fine. Une des difficultés pour appliquer une typologie par d’autres personnes que l’inventeur vient des divergences d’interprétation. Ainsi, malgré les explications et les dessins, il est difficile pour certains utilisateurs d’établir une typologie des différentes formes de mèches de la chevelure ou de plis de la draperie. Il est également fréquent de voir des lecteurs, malgré l’avertissement placé en tête des catalogues, confondre la gauche et la droite d’un personnage. Une première définition qui s’impose est celle de ce qu’on entend par côté gauche ou droit de la figurine : par rapport au spectateur et, pour une figurine vue de face, le bras gauche du personnage sera vu à droite et appelé « bras droit » ; au contraire par rapport à la figurine, le bras gauche sera également vu à droite, mais conservera son appellation « bras gauche ». Cette ambiguïté disparaît pour les figurines vues de dos, puisque le bras gauche, que ce soit par rapport au spectateur ou par rapport à la figurine, reste le « bras gauche » dans la description. Personnellement, nous avons opté pour la description par rapport à la figurine.
29L’utilisation de la typologie fine réclame beaucoup d’attention et de temps à son auteur ; il en faut encore plus à d’autres utilisateurs. Fallait‑il pour autant supprimer ce système ? Après concertation, il fut décidé d’adopter une typologie semi‑fine (fig. 123), avec un nombre limité de critères par comparaison avec la typologie fine, mais plus élaborée que la typologie sommaire des débuts. Sa mise en œuvre nous dira quels résultats on peut en espérer, quelles améliorations on peut y apporter.
Formule générale de la typologie des Vénus
30La formule décrite ci‑dessous correspond à l’expression figurant dans le champ Typol. de la base de données des figurines implantée sur Mistral. Il s’agit ici de la typologie « semi‑fine » des Vénus.
31Face antérieure :
TYPE... AB.CD GR.EFGH. IJKL.MN.OPQRSTUVW
32Face postérieure :
TYPE... AB.CD GR.EFGH.IJKL.MN.STUVW
33Les lettres OPQR ne figurent pas dans la description de la face postérieure car elles correspondent à des caractéristiques présentes uniquement sur la face antérieure.
Liste des catégories d’informations
34A : position de la main droite
B : position de la main gauche
C : présence d’un accessoire associé à la déesse
D : position de la draperie
E : forme générale de la coiffure
F : subdivision de la coiffure
G :forme générale associée à la coiffure
H : subdivision de la forme générale associée à la coiffure
I : forme de la mèche gauche
J : subdivision de la forme de la mèche gauche
K : forme de la mèche droite
L : subdivision de la forme de la mèche droite
M : forme des plis de la draperie
N : détail de la draperie sous la main
O : forme des yeux
P : forme de la pupille
Q : forme du sexe
R : forme de la main sur la draperie
S : couleur de la terre
T : consistance de la terre
U : dureté de la terre
V : présence d’inclusions
W : provenance identifiée par le laboratoire
35La fiche descriptive des Vénus comporte deux parties, l’une concernant la face antérieure et l’autre la face postérieure.
Liste des modalités de la face antérieure
36A : position de la main droite
1 : sur le sein gauche
2 : sur le sein droit
3 : sur la draperie qui descend sur le côté droit de la jambe
4 : sur ou avec un objet autre qu’une draperie
5 : entre les deux seins
6 : sur le ventre
7 : sur le haut de la cuisse
8 :tient une mèche de cheveux
37B : position de la main gauche (se conférer aux rubriques de la position de la main droite)
38C : présence d’un accessoire associé à la déesse
1 : objet autre qu’une draperie placé à la gauche de la déesse
2 : objet autre qu’une draperie placé à la droite de la déesse
3 : draperie placée à la gauche de la déesse
4 : draperie placée à la droite de la déesse
5 : ni draperie ni objet placé aux cotés de la déesse
39D : position de la draperie
1 : la draperie passe sur le poignet et/ou sur l’avant‑bras
2 : la draperie part du creux du coude
3 : la draperie retombe sur la main
4 : pas de draperie
5 : la draperie enveloppe la hanche et/ou la jambe de face
6 : la draperie part de la main et tombe le long de la jambe.
5.3.5 L’application de Systex à un problème archéologique
40FIG. 120 À 124
41Il était légitime que la méthode revînt au champ de connaissance dont elle était issue, c’est dans cette perspective que Systex a servi à traiter un certain nombre de spécimens de figurines gallo‑romaines, plus précisément des Vénus. Pour ce premier essai, on s’est limité à un échantillon restreint en vue de déterminer à la fois la fécondité et les limites de ce type d’approche. Deux catégories de moules ont été décrites selon un code conventionnel de 23 questions pour la partie. antérieure de la figurine et de 19 questions pour la partie postérieure (les questions 0, P, Q, R, touchant à la description du visage, du sexe ou de la main, étant sans objet pour la face postérieure).

FIG. 120 – Typologie des draperies (face antérieure).

FIG. 121 – Typologie des draperies (face postérieure).

FIG. 122 – Typologie Systex : coiffures (face et revers). E forme générale de la coiffure ; F subdivision de E ; G coiffure associée ; H subdivision de G. En ce qui concerne les modalités E. F. G. H., la typologie de référence citée plus haut et publiée dans le catalogue de Bourbon‑Lancy (dAf no 25) a dû être présentée différemment. En effet, les données qui n’occupent qu’un seul champ dans la base Mistral doivent avec Systex se présenter sous forme de tableaux ne comportant, pour chaque objet, qu’une possibilité de réponse par colonne/modalité. Ceci a entraîné la dislocation de la typologie de départ (uniquement pour la coiffure) dont la codification est rappelée entre parenthèses.

FIG. 123 – Typologie semi‑fine : coiffures (face et revers).

FIG. 124 – Typologie semi‑fine des mèches.
Liste des 23 questions concernant la partie antérieure
42(entre parenthèses figure le nombre maximum de modalités admises pour chaque question)
43A : Position de la main droite ? (8 modalités)
B : Position de la main gauche ? (8 modalités)
C : Accessoire associé à la déesse ? (5 modalités)
D : Position de la draperie ? (6 modalités)
E : Forme générale de la coiffure ? (39 modalités)
F : subdivision de la forme générale de la coiffure (8 modalités)
G : Complément à la forme générale de la coiffure ? (39 modalités)
H : Complément à la subdivision de la forme générale de la coiffure (8 modalités)
I : Forme de la mèche gauche ? (39 modalités)
J : subdivision de la mèche gauche ? (39 modalités)
K : Forme de la mèche droite ? (39 modalités)
L : subdivision de la mèche droite ? (38 modalités)
M : Forme de la draperie sous la main ? (38 modalités)
N : Détail de la draperie ? (4 modalités)
O : Forme des yeux ? (6 modalités)
P : Forme de la pupille ? (4 modalités)
Q : Forme du sexe ? (3 modalités)
R : Forme de la main sur la draperie ? (2 modalités)
S : Couleur de la terre après nettoyage de la surface ? (10 modalités)
T : Consistance de la terre ? (3 modalités)
U : Dureté approximative de la terre ? (4 modalités)
V : Présence d’inclusions rouges ou noires ? (4 modalités)
W : Provenance déterminée par le laboratoire ? (25 modalités)
Tableau des données
44Le tabl. xxxiv compte 65 spécimens, mais deux de ces spécimens (4902 et 4922) sont répétés deux fois afin d’inclure les incertitudes relatives à la provenance déterminée en laboratoire : la description est intégralement reprise avec une variation de la réponse à la question W.

TABL. XXXIII – Listage des données brutes de la description codée des 65 individus du fichier associé. La colonne ID indique le no de la signature, les spécimens anonymes sont codés 22. SYSTEX : tableau des données du fichier associé C : ANTER à la date du 20.09.89. Rappel des codes des 23 questions et du nombre de leurs modalités : A Position de la main droite ? (8 modalités) ; B Position de la main gauche ? (8 modalités) ; C Existe‑t‑il un accessoire associé à la déesse ? (5 modalités) ; D Position de la draperie ? (6 modalités) ; E Forme générale de la coiffure ? (39 modalités) ; F Voir subdivision forme générale de la coiffure (8 modalités) ; G Quel complément à forme générale de la coiffure ? (39 modalités) ; H Complétez la subdivision forme générale de la coiffure (8 modalités) ; I Forme de la mèche gauche ? (39 modalités) ; J Subdivision de la mèche gauche ? (39 modalités) ; K Forme de la mèche droite ? (39 modalités) ; L Subdivision de la mèche droite ? (38 modalités) ; M Forme de la draperie sous la main ? (38 modalités) ; N Quel détail présente la draperie ? (4 modalités) ; O Forme des yeux ? (6 modalités) ; P Forme de la pupille ? (4 modalités) ; Q Forme du sexe ? (3 modalités) ; R Forme de la main sur la draperie ? (2 modalités) ; S Couleur de la terre après nettoyage de la surface ? (10 modalités) ; T Consistance de la terre ? (3 modalités) ; U Quelle est la dureté approximative de la terre ? (4 modalités) ; V Présence d’inclusions rouges ou noires ? (4 modalités) ; W Provenance déterminée par le laboratoire ? (25 modalités). Liste des identités ou marques à reconnaître (cf. tabl. XXXIV) –ici en l’occurrence les inscriptions laissées vraisemblablement par les coroplathes : 1 MARTINI 2 UBERARIS 3 CERTUD AN 4 PRISCVS 5 THIO 6 IVLI 7 PISTILLVS 8 TRITOGENO 9 VRBICVS 10 BEUNICCI 11 BALLVS 12 TIBERIVS 13 IIIII 14 LVCANVS 15 ... RINVS 16 AN 17 SEVERIANVS 18 Mill 19 X 20 R 21 M

TABL. XXXIV – Application de SYSTEX au tableau des données. Test de reconnaissance sur les individus connus.
Conditions du traitement
45Le travail sur les données brutes n’est pas nécessairement ni directement fécond. Une première série d’essais s’est révélée relativement infructueuse en ne fournissant aucune attribution sur les spécimens anonymes : les individus connus étaient reconnus, et les anonymes ignorés. Il fallait donc formuler des hypothèses et jouer sur les propriétés perturbatrices afin de limiter voire d’éliminer leur effet. C’est ainsi que les mesures énumérées ci‑dessus ont été prises.
46● Il a d’abord fallu modifier le programme pour l’adapter aux conditions particulières d’un problème archéologique, le caractère lacunaire des descriptions. Alors que Systex donnait des résultats parfaitement féconds quand il s’agissait de traiter un tableau pratiquement sans lacunes, les nouvelles données du problème ont imposé d’introduire une clause supplémentaire dans l’application des règles : lorsque l’occurrence de la proposition impliquée est nulle dans l’objet à tester, la règle correspondante est ignorée : ex. le spécimen à tester présente les traits suivants A = 2 et B = 0, et la base de règles comporte la règle A = 2 ‑> B = 1 ; dans ce cas, puisque B est nul (incertitude ou manque d’information sur ce point), la règle est ignorée.
47N. B. Pour des raisons de mise en page, il nous a fallu présenter les fig. de la typologie dans un ordre différent de celui de l’original. On trouvera donc les coiffures après les draperies.
48● La désactivation des propriétés S, T, D, V est très vite apparue comme la condition de l’efficacité ; précisément ces quatre questions concernent des informations dont l’appréciation demeure relativement subjective ou sujette à caution, alors que les autres questions (de A à R) correspondent à des descripteurs morphologiques. Cette désactivation s’est immédiatement révélée féconde en fournissant plusieurs attributions de spécimens anonymes.
49● Il est apparu également nécessaire de soustraire certaines propriétés à d’éventuelles exclusions : on peut décider d’admettre qu’une modalité qui n’est jamais représentée est cependant possible (cette désactivation a notamment permis les deux attributions à IVLI).
50● Enfin, le regroupement dans une classe unique d’individus morphologiquement différents portant la même marque s’est avéré directement fructueux : à la demande de M. Lahanier, une première étude avait consisté à traiter tous les spécimens connus comme s’il s’agissait de signatures différentes et à chercher les règles de reconnaissance de chacune de ces marques ; cette première démarche s’est révélée très lourde (soit 51 signatures à reconnaître dont Systex a extrait 23 503 règles) ; dans un deuxième temps, on a regroupé les divers individus portant une marque unique (priscvs, pistillvs, etc.) sans se soucier des différences distinguant les spécimens, ce qui a eu pour effet d’alléger les données (seulement 21 signatures reconnaissables par 9633 règles). Les résultats se sont montré suffisamment voisins pour justifier la préférence accordée à cette deuxième hypothèse.
Résultats du test
51Sur les tabl. xxxiv à xxxv on notera d’abord que l’ensemble des spécimens connus se trouvent reconnus et que le taux de discrimination (de 45/52, soit 86,54 %) est assez satisfaisant8. En ce qui concerne les 15 spécimens anonymes, 7 seulement sont identifiés et 6 discriminés9. La distribution des spécimens identifiés se présente ainsi :
12181 PRISCVS, BEUIVICCI, IIIII, X, R, M (attributions multiples)
12181 PRISCVS
04937 : IVLI
03942 : IVLI
12863 TIBERIVs
F2190 : PISTILLVS

TABL. XXXV – Test de reconnaissance sur les individus anonymes.
52On pourra tirer de cette étude fragmentaire les enseignements suivants :
– le corpus est suffisamment riche et diversifié pour permettre l’identification de spécimens anonymes (tabl. xxxvi) ;
les objets portant la même signature, malgré leurs différences, forment, lorsqu’on les range ensemble, des classes assez homogènes pour servir d’outils de reconnaissance des spécimens anonymes (fig. 125 et 126) ;
– les limites actuelles du logiciel tiennent principalement à la durée des calculs et à la lourdeur du fichier des règles qui entraîne un temps de chargement relativement long (ces difficultés pourront être partiellement surmontées par une optimisation de l’algorithme d’extraction des règles), en revanche le temps de réponse pour un test ponctuel demeure relativement bref (voisin de 1 mn pour une base de 20000 règles sur un PC tournant à 10 MHz).

TABL. XXXVI – SYSTEX : descriptif et résultats. Statistiques sur les anonymes du fichier C : ANTER à la date du 20.09.89.
Rappel de la description codée de la Vénus testée no 12 863 (MMR 779, cf. fig. 33). Rappel de l’hypothèse déclarée : IVLI.
Contrevient aux règles suivantes de IVLI : D = 6 exclu ; M = 20 exclu ; N = 2 exclu ; R = 2 exclu ; C = 3 → D = 1.
Réponse de SYSTEX → TIBERIVS. Nom du fichier associé : ANTER.
Nombre de spécimens connus : 53.
Date de l’attribution : 20.09.89.
N.B. : La présente attribution, fondée sur l’analyse d’un fichier évolutif, est susceptible d’être ultérieurement remaniée en fonction de l’accroissement éventuel du fichier de données associé.

FIG. 125 – Graphe des implications de IVLI.

FIG. 126 – Graphe des implications de PRISCVS.
53Du point de vue méthodologique, deux conclusions s’imposent :
54– Systex ne doit pas être considéré comme un oracle aux réponses infaillibles : autant qu’un outil d’attribution des spécimens anonymes, il est un instrument destiné à évaluer la pertinence des descriptions et à vérifier la rigueur logique des hypothèses de l’archéologue ;
55– la désactivation de certaines questions, qui s’est révélée comme une condition de la fécondité du traitement, entraîne du même fait la réduction du nombre des questions pertinentes. Loin d’être une réelle amputation, la simplification exigée par la description codée tend à renforcer l’identité des objets, aussi serait‑il erroné de croire que la multiplication des informations soit la vraie condition d’une meilleure performance du système. L’accroissement du nombre des descripteurs ou des modalités de ces descripteurs peut avoir deux effets aussi fâcheux que contradictoires : soit l’excès de finesse de la description et l’inflation du nombre des traits tendront à isoler chaque individu comme unique, interdisant ainsi la constitution de classes vraiment homogènes ; soit, au contraire, ils risqueront de noyer les différences en introduisant trop de variables non discriminantes.
56L’enquête engagée lors de cette réunion internationale sur la validité de la typologie semi‑fine des Vénus permettra, grâce à une collaboration collective, d’accroître rapidement le nombre d’objets de référence, de tester la pertinence des critères choisis au moyen de la base de règles établie au moyen de systex, et de dégager les règles communes à la production d’un coroplathe ou peut‑être d’un atelier, d’une époque, voire d’une région.
Bibliographie
Bibliographie
Anonyme : Archéologie et calculateurs. ln : L’emploi des calculateurs en archéologie. Actes du colloque international du CNRS, Marseille, 7‑12 avril 1969. Editions du CNRS, Paris, 1970.
Bertin 1977 : BERTIN (I.). — La Graphique. Flammarion, Paris, 1977.
Deloche 1988 : DELOCHE (B.). — Reconnaissance automatique et systèmes experts : Systex, une application à l’art. Milieux, 31, 1988, p. 68‑75.
Deloche 1989 : DELOCHE (B.). — Vers une atypologie systématique. In : Actualité de la typologie architecturale. Actes de la Table ronde internationale. Centre de recherche sur l’habitat/Ecole d’architecture de Paris La Défense, 16‑17 mars 1989 (à paraître).
Journées « symbolique‑numérique » pour l’apprentissage de connaissances à partir de données (Actes). Université Paris Dauphine, 8‑9 décembre 1987.
Lagrange 1973 : LAGRANGE (M.‑S.). — Analyse sémiologique et histoire de l’art. Klincksieck, Paris, 1973.
Leredde‑Djindjian 1980 : LEREDDE (H.), DJINDJIAN (F.). — Traitement informatique des données en archéologie. Dossiers de l’archéologie, 42, 1980, p. 52‑69.
Rouvier‑Jeanlin 1973 : 111‑125.
Annexe
Glossaire
Typométrie : science qui cherche à établir mathématiquement l’existence de types à partir de caractères mesurés sur les objets.
Taxinomie numérique : mathématisation de la classification inventée par les Sciences naturelles, sciences des méthodes mathématiques de classification.
Sériation : méthode basée sur une hypothèse simple d’apparition et de disparition des objets qui permet d’ordonner chronologiquement des ensembles archéologiques.
Recherche opérationnelle : dans un sens limité, c’est la recherche des méthodes d’optimisation dans des situations variées, trop complexes pour être abordées par la seule intuition humaine.
Classification automatique : vaste ensemble de méthodes et de programmes informatiques qui ont pour objectif de faire apparaître des regroupements significatifs dans un ensemble d’éléments sur lesquels ont été observés différents caractères. Soit n objets sur lesquels nous avons mesuré p caractères. Les méthodes de classification fournissent alors comme résultat une ou plusieurs partitions de ces objets, ou éventuellement des critères eux‑mêmes.
Partition : ensemble de groupes (ou mieux de classes) dans ces n objets, qui sont tels qu’un objet ne peut appartenir qu’à une seule classe à la fois, et que la réunion de toutes ces classes forme l’ensemble de n objets.
Notes de bas de page
1 Cf. sur ce point les différentes études que nous avons consacrées à l’étude du siège lyonnais du XVIIIe s., ainsi que : DELOCHE (B.), BOUCAUD (P.). — Le Luminaire d’argent en France (1672‑1791). Contrat de recherche pour les Monuments historiques (multigr. 1988). On se reportera également aux divers codes descriptifs mis au point sous la responsabilité et sur l’initiative de Jean‑Claude Gardin (ex. Code pour l’analyse des formes de poterie, 1956).
2 FERNANDEZ DE LA VEGA (W.). — Deux algorithmes de sériation. In : Raisonnements et méthodes mathématiques en archéologie. CNRS, 1977, p. 157‑160. Cet article décrit l’algorithme de Tonnellier exploité par M.‑S. Lagrange (Lagrange, 1973).
3 Deloche (B.). 1989.
4 Le chaînage avant s’appuie sur le connu pour en tirer des conclusions portant sur l’inconnu ; le chaînage arrière remonte des conclusions aux faits qui les commandent. Modus panens et modus tollens sont des déterminations du raisonnement hypothétique dans la logique propositionnelle classique : dans le premier cas on pose la vérité de l’antécédent, qui entraîne celle du conséquent (ex. « Si P implique Q, et P, alors Q ») ; dans le deuxième cas, la négation du conséquent entraîne avec elle celle de l’antécédent (ex. « Si P implique Q, et non P, alors non Q" »).
5 MEGREDITCHIAN (G. der), A. SOULAN (A.). — Procédures automatiques d’extraction de l’information utile pour une analyse discriminante et un système expert. Journées Symbolique‑Numérique, 8‑9 décembre 1987, p. 49‑50.
6 La relation logique d’implication entre deux propositions est telle que la proposition impliquante ne se rencontre jamais sans la proposition impliquée (B or not A), ce qui revient à dire, en termes d’ensembles, que A est inclus dans B.
7 A titre indicatif, l’exemple analysé ci‑dessous (le corpus des faces antérieures des Vénus anadyomènes) utilise un code descriptif dont la somme des combinaisons possibles dépasse 100 000 milliards de milliards.
8 Beaucoup plus en tout cas que lors du premier traitement qui traitait chaque spécimen connu comme une identité à reconnaître, le taux de discrimination était alors seulement de 66,04 %.
9 Dans le traitement complet, les 7 mêmes spécimens étaient identifiés, mais deux seulement étaient discriminés.
Auteurs
Professeur à l’université Jean‑Moulins, Lyon III
Laboratoire de recherche des musées de France, Palais du Louvre
Ingénieur de Recherche CNRS Noisy‑le‑Roi, UMR 126.3
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Mottes castrales en Provence
Les origines de la fortification privée au Moyen Âge
Daniel Mouton
2008
Géoarchéologie de sites préhistoriques
Le Gardon (Ain), Montou (Pyrénées-Orientales) et Saint-Alban (Isère)
Dominique Sordoillet
2009
L’enceinte des premier et second âges du Fer de La Fosse Touzé (Courseulles-sur Mer, Calvados)
Entre résidence aristocratique et place de collecte monumentale
Ivan Jahier (dir.)
2011
Lyon, Saint-Georges
Archéologie, environnement et histoire d’un espace fluvial en bord de Saône
Grégoire Ayala (dir.)
2012
Les gisements précolombiens de la Baie Orientale
Campements du Mésoindien et du Néoindien sur l’île de Saint-Martin (Petites Antilles)
Dominique Bonnissent (dir.)
2013
L’Îlot du palais de justice d’Épinal (Vosges)
Formation et développement d’un espace urbain au Moyen Âge et à l’époque moderne
Yves Henigfeld et Philippe Kuchler (dir.)
2014
Bettencourt-Saint-Ouen (Somme)
Cinq occupations paléolithiques au début de la dernière glaciation
Jean-Luc Locht (dir.)
2002
Campements mésolithiques en Bresse jurassienne
Choisey et Ruffey-sur-Seille
Frédéric Séara, Sylvain Rotillon et Christophe Cupillard (dir.)
2002
Productions agricoles, stockage et finage en Montagne Noire médiévale
Le grenier castral de Durfort (Tarn)
Marie-Pierre Ruas
2002