1 [https://www.tripadvisor.fr/Attraction_Review-g187147-d188757-Reviews-or30-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023. Les commentaires sont retranscrits tels qu’ils apparaissent sur la plateforme.
2 [https://www.tripadvisor.es/Attraction_Review-g187147-d188757-Reviews-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023.
3 [https://www.tripadvisor.es/Attraction_Review-g187514-d190143-Reviews-or10-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
4 [https://www.tripadvisor.fr/Attraction_Review-g187514-d190143-Reviews-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
5 [https://www.tripadvisor.fr/Attraction_Review-g187147-d188757-Reviews-or30-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023.
6 [https://www.tripadvisor.es/Attraction_Review-g187147-d188757-Reviews-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023.
7 [https://www.tripadvisor.es/Attraction_Review-g187514-d190143-Reviews-or10-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
8 [https://www.tripadvisor.fr/Attraction_Review-g187514-d190143-Reviews-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
9 [https://www.tripadvisor.fr/Attraction_Review-g187147-d188757-Reviews-or100-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023.
10 [https://www.tripadvisor.es/Attraction_Review-g187514-d190143-Reviews-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
11 Les exemples sont tous exprimés sous leur forme lemmatisée.
12 [https://www.tripadvisor.es/Attraction_Review-g187514-d190143-Reviews-Prado_National_Museum-Madrid.html], consulté le 3 janvier 2023.
13 [https://www.tripadvisor.fr/Attraction_Review-g187147-d188757-Reviews-or10-Louvre_Museum-Paris_Ile_de_France.html], consulté le 3 janvier 2023.
14 Les articles, définis et indéfinis, constituant la classe des mots-outils ne seront pas étudiés.
15 La concordance est une manière de présenter les résultats d’une recherche contextuelle d’une forme, où chacune de ses occurrences apparaît centrée sur sa propre ligne, au milieu de son contexte.
16 En statistique textuelle, il y a une cooccurrence spécifique quand des attractions significatives entre des unités textuelles sont détectées à partir d’un calcul de fréquence statistique basé sur l’indice de spécificité (Lafon 1980). Nous reviendrons plus en détail sur cet indice.
17 Sans entrer dans le débat s’il faut lemmatiser ou non un texte (Mellet 1996, Brunet 2000, 2002), la lemmatisation représente certains avantages : elle permet de rapporter automatiquement à leur lemme des variations morphologiques ou graphiques parfois très grandes, comme nous le verrons. De plus, dans notre corpus, la lemmatisation permet d’uniformiser les variations morphologiques dues à des fautes de syntaxe (tout est bien organisée*, les entrées sont chère*, un des plus beau* musée* du monde). En outre, l’homonymie des formes (l’appartenance de nombre d’entre elles à plusieurs lemmes) est résolue par la lemmatisation [parti > partir (verbe), parti > parti (nom)], ce qui exclut la production de bruit, tout comme le classement par catégorie grammaticale (exemple : devoir / deber nom ou VERBE). Toutefois, si la lemmatisation ne permet plus de distinguer le singulier du pluriel, elle peut s’avérer alors dangereuse pour des formes textuelles où cette distinction est porteuse de sens. Pensons, par exemple, à peuple/peuples, lumière / lumières, esposa / esposas, humo / humos, etc. Il convient alors d’être prudent. Les approches peuvent être complémentaires en fonction des objectifs d’analyse et du type de requête.
18 Monde synonyme de gens concerne 830 occurrences sur les 1 632 répertoriées. En espagnol, mundo n’est pas employé dans ce sens au sein du corpus.
19 Pour rappel, la commande Cooccurrences calcule le tableau des différents cooccurrents des occurrences d’une requête CQL, trié par défaut par l’indice de spécificité (Lafon 1980) (un indicateur statistique de présence, appliqué ici aux attractions de formes). Elle permet donc de calculer les cooccurrents d’une forme, d’un lemme, de la succession d’un lemme et d’une catégorie, etc.
20 Il s’agit, en statistique textuelle, du retour au cotexte plus ou moins large, d’un item textuel. L’ensemble des concordances s’appelle un concordancier.
21 L’index hiérarchique calcule la liste hiérarchique des combinaisons de valeurs de propriétés correspondant aux occurrences d’une requête CQL cherchée dans un corpus ou un sous-corpus (la fréquence de chaque lemme de substantifs, des formes graphiques des occurrences de la séquence Adj + Nom, etc.
22 Dans (xx/+yy), xx indique le nombre de co-fréquence et +yy l’indice de spécificité positive.
23 Pour rappel, FrLouvre compte 356 346 occurrences et EsLouvre, 461 522 occurrences.
24 Monde synonyme de gens concerne 101 occurrences sur les 196 répertoriées. En espagnol, mundo n’est pas employé dans ce sens au sein du corpus.
25 Pour rappel, les commentaires pris en compte vont du 01/2010 au 12/2019.
26 Pour le français : Nølke (1990), Nøjaard (1993), Guimer (1996), Molinier (1990), Molinier (2009), Molinier & Levrier (2000), entre autres. Pour l’espagnol : Alarcos Llorach (1973), Carbonero Cano (1978), Hallebeek (1985), Álvarez Martínez (1994), González García (1997), Satorre Grau (2005, 2009), entre autres.
27 Vu la très grande surface textuelle occupée, nous choisissons de traiter les 15 premiers rangs.
28 Les adverbes en question n’ont pas d’astérique.
29 Formes sans astérique.
30 Les adjectifs relationnels indiquent les relations du nom avec d’autres éléments (Arrivé et al., 1986 : 33). Ils peuvent souvent être remplacés par un groupe prépositionnel (l’élection présidentielle — l’élection du président).
31 Borodina 1963, Brunot 1953.
32 Par exemple, dans le corpus Fr : FrLouvre [beau (1 493), grand (1 132), bon (500), petit (489), long (245), vrai (174), cher (117)].
34 Pour la distinction entre le quantitatif masculin singulier (grande) et le qualitatif masculin singulier [gran (413)], ici, grande (931) n’est pas le lemme.
35 Nous étudierons le contexte des 15 premiers adjectifs qualificatifs du sous-corpus FrLouvre car le total des occurrences des 15 premiers couvre 8 148 occurrences du total des 11 924 occurrences des 40 adjectifs, soit plus de 68 % du total.
36 Pour rappel, les formes en gras sont celles qui ont leur correspondance dans le sous-corpus EsLouvre.
37 Pour rappel, les formes en majuscules sont celles qui ont une équivalence de traduction dans le sous-corpus EsLouvre.
38 Selon le Trésor de la langue française. En ligne : [https://www.cnrtl.fr/definition/magnifique], consulté le 3 janvier 2023 ;
39 Selon le Trésor de la langue française. En ligne : [https://www.cnrtl.fr/definition/superbe], consulté le 3 janvier 2023 ;
40 Les données statistiques sont présentées selon la transcription suivante (xx/+yy) où xx indique la fréquence, + signale l’indice de spécificité positive, et y la valeur de cet indice.
41 Selon la définition du Trésor de la langue française. En ligne : [https://www.cnrtl.fr/definition/GRAND], consulté le 3 janvier 2023.
42 Pour rappel, les formes accompagnées d’un * signalent des discordances thématiques dans EsLouvre.
43 Le Trésor de la langue française répertorie plus de 7 acceptions de bon. En ligne : [https://www.cnrtl.fr/definition/bon], consulté le 3 janvier 2023.
44 Pour rappel, nous avons conservé l’orthographe originale des commentaires.
45 Sur la méthode des spécificités, voir Lafon (1980), Lafon & Salem (1984), Lebart & Salem (1994).
46 Sur les 9 307 commentaires postés en français sur le Louvre, 716 ont reçu une réponse, ce qui représente moins de 10 %, le taux de réponses est plutôt faible.
47 Nous verrons que dans la catégorie suivante, « excellent », cet excès, à polarité négative peut se transformer en polarité positive.
48 Nous n’étudierons le contexte que des 15 premiers adjectifs qualificatifs du sous-corpus EsLouvre car ils totalisent à eux seuls 9 860 occurrences des 15 831 occurrences totales des 40 premiers adjectifs, soit plus 62 %.
49 Nous étudierons le contexte des 15 premiers adjectifs qualificatifs du sous-corpus EsPrado car le total des occurrences de ces 15 premiers adjectifs qualificatifs couvre 18 459 occurrences du total des 28 251 occurrences des 40 adjectifs qualificatifs, soit plus de 65 % du total.
50 ‘Excelente’, Diccionario de la Real Academia Española. Version en ligne. https://dle.rae.es/excelente
51 [https://www.rae.es/dpd/menos#10], consulté le 3 janvier 2023.
52 Goes (2017 : 33).
53 La modalité épistémique est l’expression du degré de certitude par un locuteur par rapport au savoir communiqué. Le degré peut varier de la certitude à l’incertitude.
54 La négation comme spécificité commençait déjà à apparaître dans les catégories 1-2 mais à un indice plus faible (+6,3).
55 Les trois index hiérarchiques par catégorie de notes qui suivent présentent pour chaque item textuel, dans la deuxième colonne, la fréquence totale (T), la fréquence dans les parties sélectionnées, ici, dans la troisième colonne, les catégories 1-2, et dans quatrième colonne, la catégorie 5, selon un tri décroissant de fréquence 5.
56 Nous n’étudierons le contexte que des 15 premiers adjectifs qualificatifs du sous-corpus FrPrado car le total des occurrences des 15 premiers adjectifs qualificatifs est de 3 234 occurrences sur les 4 472 occurrences des 40 premiers adjectifs qualificatifs, soit plus 72 %.
57 Pour rappel, les formes en gras relèvent de discordances thématiques par rapport à EsPrado, les formes en majuscules indiquent des équivalences de traduction dans des thématiques concordantes par rapport à EsPrado, et les formes en avec * signalent des correspondances thématiques entre EsPrado et FrPrado.
58 VER:infi est l’étiquette morphosyntaxique qui correspond aux verbes à l’infinitif, PRO :clsi, aux pronoms clitiques sujet et DET:ind aux déterminants indéfinis.