4. Perspectives techniques et organisationnelles
p. 105-128
Texte intégral
1L’ensemble des variables mises en relief jusqu’à maintenant alimente notre réflexion sur les actions et les mesures à adopter. Cette réflexion s’inspire de l’état des débats sur la question de la publication numérique de corpus universitaires et du bilan des expériences en milieu universitaire ; elle bénéficie, parallèlement, de notre expérience dans la mise en route et le développement du Centre de publication et de diffusion numériques de revues, Erudit. Les enseignements que l’on en tire servent de point de départ aux perspectives qui sont esquissées concernant la mise en place d’infrastructures d’édition numérique. Ces perspectives s’inscrivent dans un mouvement beaucoup plus large qui se confirme dans plusieurs pays, dont aux États-Unis, au Canada et bientôt en France.
LE DÉFI DU NUMÉRIQUE
2Le défi de la publication numérique consiste à s’approprier les technologies de l’information pour les mettre au service de la communication scientifique. La transition touche tout autant la valorisation et l’exploitation des résultats de recherche, la communication des travaux, les instruments de recherche et le rôle de l’éditeur, que les composantes de la chaîne de la communication scientifique — partant des auteurs, en passant par l’éditeur et les bibliothèques, jusqu’au chercheur-lecteur.
3La diffusion numérique des revues fait en sorte que le repérage et la consultation de la documentation de recherche procèdent, pour une bonne part, selon des conditions entièrement renouvelées. Ce nouvel environnement a un impact majeur sur les pratiques d’exploitation et de formalisation des résultats de recherche dans la conception et la rédaction des articles. L’exploitation du numérique permettra d’explorer et de concevoir un nouveau modèle pour la revue lorsque, avec ou sans version imprimée en parallèle, la version numérique du document sera considérée première. Dans ces conditions, il sera possible de dépasser les possibilités d’une simple vitrine numérique d’un document imprimé, écrit en intériorisant les contraintes du papier1. Un document visant à rendre compte d’une démarche et de résultats de recherche sera alors conçu et réalisé en exploitant les possibilités du numérique. On ne peut pourtant se cacher qu’actuellement la version numérique de la revue est d’abord une translation de la version imprimée vers le numérique. C’est que, tout en étant dans un nouvel environnement, les pratiques de rédaction et d’édition restent assez conventionnelles. D’ailleurs, plusieurs revues uniquement numériques adoptent un comportement peu original eu égard aux usages confirmés dans l’environnement imprimé.
4Une réflexion sur la façon de concevoir la revue, sa forme d’existence et les pratiques que cela peut entraîner devrait s’imposer. Le chercheur et la revue sont appelés à participer au renouvellement des conditions d’élaboration et de transmission des contenus par lesquels ils communiquent les résultats de recherche. Cette réflexion, et les innovations qu’elle peut susciter, dépendent de la sensibilité des directions de revue, mais certainement des secteurs disciplinaires et des types de documents que cela suppose. C’est ainsi que, selon les secteurs, on jugera avec plus ou moins d’intérêt la possibilité d’intégrer dans le corps de la revue des éléments multimédias, des liens hypertextes, des données dynamiques, etc. L’effet de l’introduction des processus numériques ne sera certainement pas instantané et suivra des rythmes difficiles, à prévoir.
UNE TRANSITION, DIVERSES AVENUES
5Comment s’opérera la transition ? Pour y répondre, un ensemble de conditions sociales, institutionnelles, culturelles et techniques doivent être prises en considération. Par exemple, la simultanéité des deux supports, papier et numérique, est une contrainte avec laquelle on devra souvent composer. À la lumière des expériences locales et étrangères, la transition des revues imprimées, déjà bien établies, passe par le maintien dans la publication, la diffusion et la conservation des supports papier et numérique. Il appartient aux divers acteurs gravitant autour des revues de déterminer la durée de cette période, si tant est que nous devions assister à la disparition du papier.
La finalité visée
6De là, se pose la question de la finalité qui motive, aux plans intellectuel et institutionnel, l’adoption d’une version numérique de la revue. On peut esquisser deux cas de figure.
7D’un côté, l’accroissement de la diffusion est la motivation principale. Cette motivation, qui n’est pas absente dans l’autre cas de figure, a nettement préséance ici sur d’autres dimensions. L’accent mis sur la diffusion peut être inspiré, par exemple, par la vision concernant l’intérêt du numérique dans la communication scientifique, ou, autrement, par la rareté de ressources disponibles en expertise ou en équipement, ou encore par la volonté d’étaler dans le temps la transition, en ne modifiant pas, au moins provisoirement, la façon de produire la revue. Ces considérations pourront mener au choix de la production de fichiers pdf à partir des fichiers de mise en page des articles de la revue. Cette approche a le mérite d’assurer une large diffusion à peu de frais.
8D’un autre côté, le numérique est perçu, avec comme point de départ les nouvelles possibilités offertes, tout autant pour la production que pour la diffusion de la revue, et l’action est menée sur ces deux volets simultanément. L’introduction du numérique, dans le processus même de la publication de la revue, contribue à faire en sorte que la version numérique soit conçue comme la version première2, tout autant par les auteurs, que par les éditeurs et par les lecteurs.
9Entre ces deux cas de figure, on peut imaginer plusieurs scénarios et différentes façons de faire. Il est généralement admis, et nous sommes de cet avis, que la chaîne de traitement xml-intégrée assure une transition maîtrisée, à la fois des processus de publication et de diffusion, et offre les meilleures garanties pour la préservation des documents. Ce processus est « intégré » par la production de tous les formats de diffusion, papier et numérique, à partir d’un même fichier en xml. Cela dit, que la chaîne xml-intégrée puisse être perçue comme un scénario optimal ne doit pas conduire à rejeter d’autres façons de faire. C’est pour cette raison que nous considérons trois autres avenues, allant de la seule diffusion d’une version numérique — qui est une duplication de la version papier — jusqu’à une version en langage structuré, qui conserve, en parallèle, une chaîne de traitement pour le papier.
Différents modèles d’édition numérique
10Un tour d’horizon des pratiques sur le plan international montre une variété dans les choix qui sont faits pour publier numériquement une revue3. La production de la version numérique d’une revue va bien au-delà de la simple mise à disposition d’articles en ligne4. Pour chacune des trois fonctions — production, diffusion et gestion —, on observe une pluralité de pratiques, que ce soit pour les formats de production ou les choix concernant l’archivage des documents numériques ou les modèles économiques.
11Tout en reconnaissant d’entrée de jeu que le scénario XMLintégré est sans doute le plus porteur et le plus systématique pour la transition vers l’adoption de l’édition numérique, les autres méritent une mise en situation. Précisément, ces différentes façons de faire se caractérisent selon les enjeux de la publication numérique.
12Pour simplifier la discussion, nous avons ramené les options à quatre (pdf-texte, html, mise en page-xml, xml-intégré) et donné schématiquement les caractéristiques de chacune des options pour les principaux indicateurs, regroupés par grandes fonctions de l’édition numérique des revues. Nous apportons des précisions sur les quelque 13 indicateurs retenus. Ces indicateurs, réunis dans le tableau qui suit, permettent une mise en perspective des diverses options. Le choix d’un modèle se fera selon le contexte, l’expertise, les ressources et les équipements dont on dispose.
Modèle PDF (texte)
13Le modèle PDF (texte) implique peu de modifications à la majorité des processus de production. L’équipe de la revue reçoit des auteurs les articles en format traitement de texte, le plus souvent Word. Une fois terminés le processus éditorial, la révision linguistique et l’uniformisation selon le protocole de rédaction, la mise en page et les corrections d’épreuves sont réalisées à l’aide d’un logiciel de mise en page, tel que QuarkXPress, pour en citer un. De là, un fichier ou un prêt-à-photographier est produit pour l’impression des numéros.
14Dans ce modèle, la production des fichiers pdf est réalisée simplement à partir de l’application de mise en page en utilisant le logiciel Distiller de Adobe. Cette opération se déroule le plus souvent sans problème, particulièrement lorsqu’elle s’effectue à partir de l’ordinateur avec lequel la mise en page a été réalisée, garantissant, par exemple, la présence de tous les fichiers de fontes utilisés. Le résultat sera un fichier pdf représentant fidèlement à l’écran l’image du document papier, tel qu’il sortira des presses, constituant ainsi un format de diffusion qu’on peut qualifier de papier de verre.
15Ce modèle de production d’une version numérique, en s’appuyant sur le format pdf, ne permet que de mettre en ligne la translation de la version papier. Malgré les possibilités d’hypertexte du pdf, ce format est davantage considéré pour l’impression sur demande. De plus, les conditions de préservation à long terme sont plus difficiles à garantir en raison du fait que pdf est un format propriétaire. Bien que pdf soit un format normalisé de facto et que la compagnie Adobe, propriétaire de pdf, diffuse assez largement l’information et les détails techniques sur le format, seul Adobe peut apporter quelque modification que ce soit au pdf, et ce, sans avoir à consulter quiconque. Des recherches en cours sur cette question voient dans la conversion de pdf vers un autre format (image ou texte) la solution pour assurer la pérennité de l’information encodée en PDF5.
figure 2. Le modèle PDF (texte)
16Devant l’importance du xml dans l’industrie en général et plus particulièrement dans le milieu de l’édition, Adobe a développé un module (en phase Beta 2 en novembre 2001) de la suite Acrobat permettant de convertir un fichier pdf en xml6. Compte tenu de la nature des fichiers d’intrant, le résultat de ce traitement consiste essentiellement en un fichier xml « bien formé » selon les caractéristiques de mise en page, ce qui nécessitera une deuxième phase de conversion pour bénéficier des possibilités de fichiers xml « valides » selon une dtd ou un schéma. De plus, dans la mesure où pdf ne comporte aucune information structurée, la production des métadonnées ne peut se faire automatiquement et les possibilités de recherche sont limitées à la recherche plein texte.
17C’est le modèle le moins coûteux à mettre en place, autant pour l’équipement à acquérir, qui se limite à l’achat de Distiller, que pour l’expertise nécessaire.
Modèle HTML
18La plupart des applications de traitement de texte ou de mise en page permettent de produire une sortie en html. Cependant, l’utilisation de ces fonctions automatiques donne des résultats décevants. Le html ainsi produit est, par définition, calqué sur la représentation déterminée pour la forme papier. Il est alors nécessaire de retravailler les fichiers en élaguant les codes inutiles et en modifiant les balises automatiquement introduites. Cette procédure, bien que peu coûteuse en équipements et en logiciels, est fastidieuse et coûteuse en ce qui concerne les opérations à effectuer pour arriver à un format de diffusion minimal (html). Il sera souvent plus opportun d’utiliser des outils qui permettront de mieux contrôler l’insertion des balises.
figure 3. Le modèle html
19Le html, par son jeu de balises limité, ne permet pas de recherches structurées et des compromis sont souvent à faire pour identifier les différents éléments d’un texte. Bien que des balises comme « Hi » ou « Blockquote » puissent nous donner une indication de la nature de l’information qu’elles contiennent, leur utilisation non systématique et l’absence de balises pour identifier la majorité des éléments d’un article restreignent les possibilités de recherche et de représentation. Pour les mêmes raisons, la production automatique des métadonnées n’est pas possible. Dans la mesure où le html est une application du sgml et où son jeu de caractères de base est l’ascii (ou l’unicode pour le xhtml), une certaine pérennité peut lui être accordée. Toutefois, l’utilisation de balises propres à certains logiciels et la juxtaposition des informations concernant la représentation de l’information (« Center » ou « Bold », par exemple) ne font pas du html un format à privilégier pour la préservation à long terme. En fait, le html est essentiellement un format de diffusion. Il n’a pas été conçu pour la production ou l’archivage de l’information.
20Les solutions pdf et html sont souvent jugées limitées pour répondre aux besoins de la publication, de la diffusion et de la préservation des revues sous forme numérique. Toutefois, l’implantation d’une chaîne de traitement xml-intégrée, permettant de bénéficier pleinement des possibilités du numérique — que ce soit pour la production de tous les formats de diffusion, à partir d’un même document xml, ou la réalisation d’une véritable revue numérique intégrant des éléments multimédias —, implique des modifications importantes aux façons de faire. Pour des raisons justifiées d’expertise requise ou d’organisation, l’implantation d’une chaîne de traitement xml-intégrée peut s’avérer difficile.
Modèle mise en page vers XML
21Dans cette situation, la revue n’est pas condamnée à des choix contraignants. C’est cet aspect que le modèle mise en page versxml tente d'exploiter. La plupart des versions papier des revues sont produites à l’aide de logiciels de mise en page, tels QuarkXPress ou PageMaker. Ce modèle consiste à produire la version xml à partir du fichier de mise en page. Cette transformation peut s’effectuer de plusieurs façons. Certains outils, tels que Avenue.Quark ou LogicTran, permettent d’effectuer la conversion en xml. La conversion peut également se faire en utilisant des scripts qui transforment les fichiers de mise en page en xml. Il s’agit d’abord d’extraire le texte des fichiers de mise en page vers un format tel que rtf. Par la suite, des programmes permettent de convertir les textes vers xml. Cette programmation peut se faire en perl, en Omnimark, en java ou en VB, par exemple. L’utilisation d’un éditeur xml est souvent utile pour effectuer le balisage fin pour lequel la complexité couplée au nombre très grand de cas de figure ne justifie pas de concevoir et de créer un programme de conversion automatisé. Une fois le format xml des articles créé, les formats de diffusion seront générés automatiquement, en html, xhtml ou tout autre format de diffusion, à l’aide de feuilles de style xsl, par exemple.
figure 4. Le modèle mise en page vers XML
22Le premier désavantage de ce modèle tient à la dépendance pour un format propriétaire, tel que celui de Quark. Désavantage tout relatif, il faut bien l’avouer, puisque l’utilisation de logiciels propriétaires est courante et bien implantée pour la mise en page des revues. Dans ce scénario où la programmation pour la conversion se fait en dehors de l’application de mise en page, le format d’intrant sera un format « texte », produit à partir du format propriétaire. Le deuxième inconvénient est que cette option fait du numérique le produit d’un processus conçu pour le papier. La chaîne de production est en fonction du papier ; une fois réalisée la revue prête à imprimer, un fichier est à la fois acheminé à l’imprimeur et utilisé pour les opérations de conversion vers xml. Néanmoins, compte tenu de l’importance du papier, de l’expertise et des façons de faire éprouvées par les équipes des revues, l’option « mise en page vers xml » est certainement à considérer et plus facile à implanter qu’une chaîne de traitement xml-intégrée. Un troisième irritant de cette chaîne vient de la structure même des fichiers de mise en page. Plusieurs outils de mise en page fonctionnent de façon telle que le document ne constitue pas un « ruban » de texte déroulé à la suite d’un certain nombre de pages. Au contraire, différents éléments du texte constituent autant de « boîtes » indépendantes les unes des autres. Par exemple, les notes de bas de page sont dans une « boîte » distincte du texte, les appels de notes ne sont pas liés aux notes elles-mêmes, et de la même façon, les tableaux et les figures, par exemple, ne sont pas reliés aux textes. Ces caractéristiques propres à la conception d’un document destiné à l’impression font en sorte que l’extraction du texte complet et continu comporte certaines difficultés auxquelles on doit trouver des solutions diverses.
23Puisque la majorité des auteurs écrivent en fonction de la diffusion papier, ce modèle offre à la revue exactement les mêmes avantages que le modèle xml-intégré. Les variables touchant les possibilités de recherche, la génération automatique des métadonnées et l’indice de pérennité élevé sont du même ordre pour les deux modèles.
24Les ressources nécessaires à la mise en œuvre de ce modèle sont similaires à celles du modèle xml-intégré. Les expertises s’apparentent pour ce qui est de l’analyse de documents et des habiletés en programmation.
Modèle XML-intégré
25Le modèle de traitement xml-intégré est basé sur des principes permettant l’atteinte des objectifs reliés à la publication de revues savantes dans un environnement numérique.
26Cette chaîne de traitement utilise des formats normalisés pour la représentation de l’information et tente d’utiliser le plus souvent possible des mécanismes de traitement normalisés, sans mettre en péril l’efficacité et la souplesse de l’ensemble. La normalisation des formats d’encodage de l’information est nécessaire, car elle donne une certaine indépendance par rapport aux outils utilisés et garantit la pérennité de l’information. Aucune normalisation des outils n’est proposée, conservant ainsi l’indépendance par rapport aux logiciels et aux systèmes.
figure 5. Le modèle XML – intégré
27Une chaîne de traitement xml-intégrée peut comprendre les étapes suivantes7 : 1) les textes transmis par les auteurs sont uniformisés (références bibliographiques, etc.) et la révision linguistique est assurée dans un format texteur, Word le plus souvent ; 2) une version Word avec feuille de styles est réalisée en appliquant au texte des styles identifiant les différents éléments du texte (titre, auteur, intertitres, etc.) ; 3) les articles sont ensuite convertis en xml ; 4) à partir du xml, une première version mise en page est effectuée pour la réalisation des jeux d’épreuves ; 5) les corrections sont saisies directement dans le xml ; et 6) une fois le contenu approuvé par la revue, les différentes versions de diffusion sont produites, autant pour la version papier que pour la version numérique de la revue.
28Le mode de production d’une revue doit permettre l’exploitation du caractère multimédia et interactif de l’information numérique. Avec le modèle xml-intégré, l’exploitation du numérique est facilitée. Les documents numériques provoquent des changements dans les façons de faire, tout en ouvrant des perspectives nouvelles pour la création, la diffusion et l’exploitation des résultats de la recherche. Ils permettent d’inclure différents types d’information, du texte à l’animation 3D, en passant par l’image, la vidéo, le son et la réalité virtuelle.
29L’expertise requise pour la chaîne xml-intégrée est diversifiée et nécessite l’intervention de professionnels. Les coûts en personnel pour la mise en place et l’opération de ce modèle sont relativement élevés.
Remarques d’ensemble
30Les principaux constats que contient la section précédente sont repris dans le tableau se trouvant à la fin de cette section. Les quatre modèles y sont schématiquement caractérisés selon les indicateurs : production, diffusion, préservation et ressources.
31Le processus de production d’une publication imprimée s’effectue dans un contexte où l’on connaît et contrôle le support de diffusion de l’information. Par contre, dans le monde numérique, il existe une variété de formats de diffusion, mais surtout une grande variété de qualités ou de caractéristiques techniques de ces formats. La chaîne de traitement xml-intégrée répond au besoin de souplesse dans la production de l’information, numérique ou imprimée, afin de satisfaire le plus grand nombre de supports de diffusion, actuels et futurs, ainsi que le plus grand nombre d’expériences de consultation de l’information.
32Les documents structurés (selon les normes sgml ou xml) contiennent de l’information sur leur structure logique et sémantique (par exemple, différentes sections du document et leur titre ou certaines parties du texte comme des lieux géographiques ou des noms de personnes). Cette structure leur confère une grande richesse, car il est aisé de traduire une information de structure en une information de restitution. Ainsi, convertir une information telle que « ceci est un titre de section premier niveau » en une instruction telle que « ceci doit être imprimé en caractères gras et un corps de 14 pts » peut se faire aisément et, surtout, automatiquement. L’utilisation de documents structurés est la seule façon de respecter le principe « une source, plusieurs produits » dans un contexte numérique.
33Les modèles « mise en page vers xml » et « xml-intégré » permettent d’obtenir, pour chaque article, un document structuré, suffisamment riche pour permettre toutes les exploitations envisagées. L’intérêt économique de ces modèles repose sur l’automatisation des différents traitements effectués sur l’information. La création de l’information demeurera toujours un processus intellectuel. Mais une fois cette information créée, sa déclinaison en différents produits de gestion et de diffusion devrait toujours être réalisée automatiquement.
34Ces observations permettent de conclure que l’engagement dans l’édition numérique demande que soient précisées une série de paramètres et une démarche. Il y a certes des considérations techniques, mais cela suppose aussi l’établissement de priorités dans le cheminement à suivre et dans les formes organisationnelles à mettre en place. La définition d’une norme d’édition suppose la prise en compte du corpus ou de la nature du document à publier. La revue — sa vocation, le lectorat auquel elle s’adresse, l’importance de sa « vie utile » et sa position dans le processus de développement et d’accumulation des connaissances — suppose un traitement de qualité, une flexibilité d’utilisation et des garanties de conservation.
35Cela a évidemment des conséquences techniques, mais surtout pose la question centrale de la capacité organisationnelle de mettre en place une chaîne de traitement en langage structuré, s’appuyant fondamentalement sur un traitement numérique au début du processus de production, dont les différents formats de diffusion découleraient. Les autres avenues sous-entendent un traitement préalable pour le papier, puis un traitement numérique. Dans ce cas, les distinctions se font sur la base du type de traitement numérique en partant du traitement PDF texte vers un traitement pour le Web, avec le html, ou encore vers un langage structuré, mais issu d’un traitement préalable sur logiciel de mise en page, d’où le modèle « mise en page vers xml ».
36Ces choix conditionnent pour une bonne part les formats de production et de préservation, de même que les logiciels avec lesquels le travail est effectué. De façon générale, il est plus approprié, moins contraignant et plus économique d’utiliser des formats ouverts et des logiciels libres ou gratuits (pour le milieu de l’éducation, tout au moins). De là, la distinction fondée sur le caractère propriétaire et non propriétaire des logiciels et des formats.
37De même, le mode de production des métadonnées — qui décrivent les attributs et le contenu des articles et qui servent au repérage, à la gestion, à la description, à l’accès et à la conservation de l’information — doit, au mieux, procéder par extraction automatique de l’information des articles eux-mêmes, sinon cela impose une procédure manuelle qui est fastidieuse et exigeante. D’où, la prise en compte de cette dimension.
38Pour la diffusion, une série d’interrogations permet de qualifier les quatre options retenues. Selon le format de production utilisé, comme format maître, différents formats pourront éventuellement être produits. Dans certains cas, comme avec le pdf ou le html, cette possibilité n’existe peu ou pas, alors qu’à l’autre bout du spectre, l’utilisation d’un format riche, comme le xml, permettra de produire plusieurs formats dans une période donnée.
39Les formats ont aussi une incidence sur les capacités de recherche et les conditions pour améliorer l’efficacité des résultats, en ce qui concerne la diminution du bruit tout autant que du silence. Sur ce plan, la possibilité de procéder à la recherche structurée constitue un avantage sur la seule recherche plein texte. Notons au passage que le PDF-image ne permet ni la recherche plein texte, ni la recherche structurée.
40Les besoins pour la diffusion des documents évoluent et se diversifient dans le temps. Plus le format de production est riche, plus la gamme des possibilités s’élargit, ce qui constitue un avantage. Pour les besoins de comparaison, nous avons utilisé une variable dichotomique pour la réutilisation des données, en ce qui a trait à ce qui est facile et difficile.
41Tant et aussi longtemps qu’une procédure fiable d’archivage des documents ne sera pas établie publiquement, l’éditeur de revue conserve une responsabilité pour assurer la pérennité de la version numérique de sa revue. D’une façon plus modeste, l’éditeur de revue, dans le contexte de la diffusion numérique, doit s’assurer de la continuité et de la fiabilité du service de mise en ligne, ainsi que de la disponibilité des articles. Cela demande nécessairement la préservation des documents, en dépit et au-delà de l’obsolescence technologique, tant pour les logiciels que pour les supports. Il est, en ce sens, primordial de tenir compte d’un indice de pérennité lié aux differents formats.
42Les ressources qui doivent être mobilisées varient selon la chaîne de traitement retenue. Les coûts de production sont d’abord et avant tout fonction de l’expertise nécessaire à la réalisation du projet, alors que les coûts en équipement (machines et logiciels) sont relativement semblables : les machines sont comparables et les logiciels comptent relativement peu dans l’ensemble.
CONCEPTION ET DÉVELOPPEMENT D’UNE INFRASTRUCTURE
tableau 5. Indicateurs des différents modèles
43Comment doit-on penser et définir le rôle de l’édition dans le contexte d’une société de l’information et de l’implantation du numérique dans la communication scientifique ? La question n’est pas tant de situer le lieu ou le cadre organisationnel où peut se mettre en place le travail d’édition et de publication, mais bien de cerner ce travail et sa pertinence, compte tenu de la nature des textes et du rôle joué par les véhicules de transmission des résultats de la recherche dans la communauté scientifique.
44Le processus d’édition, au sens large, couvre la sélection des textes, leur traitement et leur mise en forme, leur diffusion et leur conservation. Dans le secteur des revues, la première fonction est assumée largement par les directions de revue qui maîtrisent le processus éditorial. Les autres fonctions participent davantage aux processus de publication et de diffusion ; ces derniers processus relèvent souvent d’intervenants professionnels, bien que l’on puisse rencontrer des directions de revue qui soient des acteurs importants sur ces plans. Le numérique, nous l’avons souligné, ne marginalise pas le travail d’édition dans son ensemble — encore là, quel que soit le lieu où il se pratique (éditeur professionnel, revue autonome, bibliothèque, etc.). Il l’enrichit plutôt et pose des défis que l’on peut relever en ayant recours à de nouvelles ressources, en comparaison de celles engagées dans les processus bien connus de l’imprimé. Il est moins question ici de dimensions techniques ou d’équipements, que de ressources humaines possédant une formation et une expertise en mesure de maîtriser certains procédés de publication et de se placer simultanément en situation de réalisation, d’apprentissage et de développement d’applications. D’où l’importance de pouvoir compter sur un noyau de personnes qualifiées qui participent pleinement à l’évolution des usages, des procédés et des conventions.
45En somme, la valeur ajoutée de l’éditeur (au sens générique du terme) dans la publication numérique suppose un investissement dans la conception et le développement de l’infrastructure (conception, savoir-faire, procédés) nécessaire pour une production et une diffusion numériques de qualité et efficaces. Pour un petit éditeur individuel, pour une revue et même pour un éditeur qui a un volume d’activité limité, les besoins en ressources ne sont pas sans poser de difficultés. On ne peut ignorer que, dans un projet de publication et de diffusion numériques de revue, la nécessité de combler des besoins en ressources assez diverses est particulièrement exigeante pour une revue seule, bien que l’on ne puisse pour autant conclure que cela soit hors de portée. Sans préjuger de la nature de l’organisation préconisée par les promoteurs, il importe de considérer les composantes de l’infrastructure à mettre en place et les fonctions qui doivent être remplies. D’où l’intérêt d’imaginer des formes de regroupement des ressources et des expertises. Quoi qu’il en soit, les présentes considérations s’adressent tout autant à une direction de revue, qui entend s’engager dans l’édition numérique, qu’à un promoteur de site collectif de revues.
Des services
46Les services participant à un projet d’édition numérique de revues supposent des composantes d’infrastructure, tout autant au plan intellectuel, organisationnel que matériel.
47Le service de publication, selon le modèle xml-intégré ou par la production du xml à partir des fichiers de mise en page, accomplit, dans sa version la plus ambitieuse, l’ensemble de ces tâches, et, dans d’autres versions, au moins une partie de celles-ci : recevoir les textes, préparer la copie, préparer les épreuves, numériser les figures ou photographies, saisir les corrections, préparer la version numérique et la mise en page pour l’imprimé. Dans la foulée, les métadonnées sont produites, idéalement de façon automatique, à partir de la chaîne de traitement.
48L’intérêt d’une collection d’articles de revues réside dans la qualité des articles mais aussi dans le nombre de revues et d’articles sur un sujet donné. Cela justifie la numérisation rétrospective des numéros antérieurs pour en faciliter l’accès et offrir une collection d’articles plus riche. Il s’agit alors de réaliser la numérisation des articles visés et de créer les métadonnées pour permettre aux lecteurs d’utiliser un même outil de recherche à travers les collections courante et rétrospective d’une revue.
49Le système de diffusion consiste en une interface d’accès dont l’objectif est de mettre à disposition une collection d’articles d’abord par sujets. Les outils proposés pour la mise en oeuvre des services de diffusion sont la création d’un site de diffusion, mais aussi l’utilisation d’un modèle de métadonnées, d’un outil pour l’identification et le référencement permanent de chacun des articles et éventuellement d’un service, tel que CrossRef, permettant de relier les références bibliographiques aux articles cités. À cela s’ajoutent la diffusion sélective de l’information (tables des matières des numéros de revues et des résumés) aux personnes intéressées ou abonnées à la publication, ainsi que la prise en considération des performances des différentes pages dans les outils de recherche les plus consultés et de la possibilité de la diffusion des articles par les differentes bases de données bibliographiques qui permettent les liens avec le plein texte.
50Le modèle et les pratiques n’étant pas encore établis sur un plan national (bibliothèques nationales), les revues doivent se doter d’un service d’archivage qui corresponde aux normes fixées par les bibliothécaires et les archivistes. Quel que soit le partage des responsabilités en matière d’archivage, la revue doit assurer la préservation de sa version numérique pour en garantir l’accès pendant tout son cycle d’utilisation.
51L’accès aux revues sous forme numérique peut être gratuit ou payant. Dans ce dernier cas, il faut voir à établir un service de gestion des abonnements.
Des ressources intellectuelles
52Des ressources intellectuelles de premier ordre sont nécessaires pour remplir ces diverses fonctions. Lorsqu’on se situe à l’échelle d’une seule revue, ces ressources peuvent être ramenées à une seule personne, particulièrement habile et polyvalente, et dont l’engagement ne fait pas défaut. À l’échelle de plusieurs revues ou d’un site fédérateur, une spécialisation des tâches est possible, sinon désirable, si bien que l’équipe réunit des qualifications complémentaires. Quel que soit le cas de figure retenu, l’interaction de diverses compétences (professionnelles et techniques) permet dans de bonnes conditions de concevoir, d’implanter et d’assurer la prestation de services, en tenant compte de l’évolution des normes et pratiques, ainsi que des ressources financières disponibles. Cela implique une direction intellectuelle arrimée aux conditions de réalisation et une gestion professionnelle en phase avec un programme de « livraison » de services.
53Quatre dimensions peuvent être mises en relief.
- L’accroissement de la visibilité, l’augmentation du nombre d’utilisateurs et l’impact du site sur la communauté scientifique internationale varient en fonction de la capacité de créer un lieu intellectuellement dynamique, qui nourrit, accueille et provoque des activités en mesure d’interpeller le milieu national et international des chercheurs. La meilleure promotion pour un site, c’est d’en faire un foyerintellectuel dynamique qui fait place à des activités et offre des services de premier ordre. Cela demande des ressources conséquentes en qualité et en importance.
- La publication numérique est un domaine dominé par l’innovation : tant les technologies utilisées que les usages et les pratiques dans le Web évoluent très rapidement et interpellent régulièrement les attentes et les prévisions concernant la publication et la diffusion numériques. On est loin d’un univers dans lequel les conventions relatives aux processus de publication, les outils logiciels ou autres, et l’interaction avec les utilisateurs seraient stables. Les activitésconsacrées à la veille sont fondamentales compte tenu de l’évolution des pratiques et des normes en matière de formats, d’outils de production et de diffusion, et de définition et de transformation des modèles de diffusion tant technique qu’économique.
- La nécessité de se situer à la frontière technologique a pour contrepartie de considérer les ressources dans la recherche et le développement d’applications comme le « nerf de la guerre ». On ne peut échapper à la nécessité d’investir dans la recherche appliquée, dans l’expérimentation et dans l’amélioration des fonctions de diffusion, surtout si on veut participer à la stabilisation prochaine du processus de production et au développement de services qui révèlent tout l’intérêt de la publication numérique en en exploitant les fonctionnalités. Dans ce contexte, l’expression « petit r grand D » rend compte de cette mission, car l’essentiel porte sur le développement et l'intégration d’applications pour la production et pour la diffusion.
- La grande mobilité des ressources humaines dans ce secteur rend nécessaire l’identification des conditions permettant d’assurer une redondance des expertises pour la gestion et le fonctionnement quotidiens des systèmes d’information. Consigner et partager l'information sur les procédures et les décisions deviennent, dans ce contexte, très importants. Cette pratique assure la stabilité des systèmes d’information développés et une documentation riche pour les membres d’une équipe.
Un environnement technique et matériel
54L’édition numérique des revues n’est possible que si l’on réunit les conditions pour assurer la sécurité, la stabilité et la constance des services, aussi bien pour l’hébergement des documents produits que pour leur diffusion et leur archivage. Ces caractéristiques sont à la fois techniques et organisationnelles.
55Le site, qui héberge une ou des revues, contient des données sensibles et stratégiques et devrait être installé sur sa propre machine (serveur). Les besoins et l’environnement du lieu d’hébergement, avec ses composantes matérielles et logicielles, se définissent en fonction d’une série de facteurs dont on peut faire l’énumération :
- estimation de l’espace disque nécessaire pour les contenus : les articles de revues (publications courantes et numérisation rétrospective) ainsi que l’espace requis pour le système d’exploitation, les divers ensembles logiciels pour la diffusion ;
- capacité d’ajouter diverses fonctionnalités au système de diffusion : un outil de recherche plein texte et exploitant les métadonnées, la personnalisation des accès des visiteurs en fonction de leurs intérêts et de leurs droits d’accès, l’enregistrement des habitudes d’usage et l’adaptation de l’affichage au profil matériel/logiciel/préférences du lecteur.
56L’hébergement devrait comprendre, en particulier, l’accès du serveur à une très large bande passante et une position stratégique sur les circuits d’interconnexion d’Internet, la surveillance continue des équipements et la continuité du service. Il devrait comprendre également la climatisation et l’alimentation électrique garantie, la prise de copie de secours, la maintenance des DNS pour établir les noms logiques de serveurs.
57Cet environnement technique vient compléter les ressources humaines qui seraient mobilisées. Il constitue une condition nécessaire de la mise en place d’une structure de production, de diffusion et d’archivage des revues numériques.
UN PROCESSUS DE TRANSITION MAÎTRISÉ
58On a tout avantage à aborder la transition en faisant preuve de pragmatisme. Cela signifie que s’exerce une tension constante entre un processus de changement et les contraintes à travers lesquelles le changement prend forme. Cette tension est dynamique, mais polymorphe, elle suit un rythme irrégulier et sa principale qualité est d’être soutenue. C’est sous cet angle que l’une des questions, présente dès le départ, a été traitée, soit la simultanéité des supports papier et numérique.
59Les documents produits par les quatre chaînes de traitement présentées dans ce chapitre, accompagnés de métadonnées, répondent — bien qu’avec des niveaux d’exploitation et avec des indices de pérennité différents — aux conditions nécessaires à la diffusion en ligne. La décision d’utiliser un modèle ou un autre relève des conditions d’opération, des moyens financiers et des ressources disponibles. Plus d’un parcours se justifie selon l’objectif de l’adoption d’une version numérique pour la revue : de la simple diffusion en ligne à la réalisation d’une transition vers le numérique, qui constitue un nouveau modèle pour la diffusion des résultats de la recherche.
60Toutefois, l’expérience acquise et les services auxquels nous donnons ou avons accès permettent déjà d’identifier des façons de faire qui maximisent les ressources à investir dans de tels projets. L’objectif essentiel est de favoriser l’adoption par les revues d’une nouvelle chaîne de traitement qui soit en mesure à la fois de maîtriser la transition et de faciliter l’adoption de la version numérique comme version première, et ce, en faisant des choix qui facilitent la gestion et la pérennité de l’information. Sur ce plan, il faut distinguer l’essentiel, c’est-à-dire ce qui est indispensable pour que cette trajectoire s’affirme, de l’accessoire qui prend souvent la forme de modalités, de procédures et de questions d’intendance. Loin d’établir des certitudes sur la voie tracée, l’expérience acquise permet de considérer la nécessité d’entretenir une tension soutenue visant les objectifs clairs de passage au numérique, mais en pratiquant la flexibilité comme vertu cardinale et en privilégiant les actions contribuant au développement de réseaux.
Notes de bas de page
1 Fletcher, Lloyd Alan, « Developing an Integrated Approach to Electronic Publishing: Tailoring Your Content for the Web », Leamed Publishing, vol. 12, no 2, 1999, p. 107-117; Bachrache, Steven M., Darin C. Burleigh et Anatoli, Krassivin, « Designing the Next-Generation Chemistry Journal: The Internet Journal of Chemistry », Issues in Science and Technology Librarianship, hiver 1998 ; <http://www.library.ucsb.edu/istl/98-winter/article1.html>.
2 Fletcher, Lloyd Alan, « Developing Integrated Approach to Electronic Publishing: Tailoring Your Content for the Web », Learned Publishing, vol. 12, no 2, 1999, p. 107-117.
3 On peut consulter aussi : Clément, Caroline et Marc Bonvin (sous la direction de Françoise Khenoune), Les périodiques en sciences humaines et sociales, mars 2000, Bibliothèque cantonale et universitaire de Lausanne-Dorigny ; <http://www.unil.ch/BCU/recherches/I_ar_bi.htm>.
4 Ce chapitre porte spécifiquement sur la production courante d’une revue. Les techniques, les formats et les procédures pour la numérisation rétrospective de documents pour lesquels les fichiers informatiques n’existent plus est tout autre.
5 Ockerbloom, John Mark, « Archiving and Preserving pdf files », rlgDigiNews, vol. 5, no 1, février 2001 ;
<http://www.rlg.org/preserv/diginews/diginews5-1.html>.
6 Voir à ce sujet : Save As XML Plug-In (beta 2) :
<http://www.adobe.com/downloads/detail.jsp?hexID=89a2>.
7 Évidemment, ici encore, des variantes peuvent être introduites selon un ensemble de facteurs propres à l’environnement de production. La chaîne xml-intégrée pourrait être adaptée selon des conditions particulières.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Elles étaient seize
Les premières femmes journalistes au Canada
Linda Kay Robert Laliberté (trad.)
2015
Pascasius ou comment comprendre les addictions
Suivi du Traité sur le jeu (1561)
Pâquier Joostens d'Eeklo Louise Nadeau et Marc Valleur (dir.) Jean-François Cottier (trad.)
2014
La médecine des preuves
Une histoire de l’expérimentation thérapeutique par essais cliniques contrôlés
Othmar Keel
2011
La pauvreté
Quatre modèles sociaux en perspective
Gérard Boismenu, Pascale Dufour et Sylvain Lefèvre
2011
Femmes philanthropes
Catholiques, protestantes et juives dans les organisations caritatives au Québec (1880-1945)
Yolande Cohen
2010