Mots-clés

, , , , , ,

Je me trouvais ce samedi 24 janvier aux Archives nationales, à Peyrefitte, pour l’assemblée générale de l’association Mnémosyne, suivie d’une demi-journée d’étude organisée par la même « Association pour le développement de l’histoire des femmes et du genre », dont je suis modeste adhérent de base (l’un des 6 hommes parmi une centaine d’adhérentes [1]). Après un après-midi passionnant et des débats trop courts, présidée avec une grâce compétente[2] par Michelle Perrot, vint la dernière table ronde et son débat conclusif, dirigés par Julie Verlaine.

Allez savoir pourquoi, il me parût opportun de faire une remarque publique et critique sur le moteur de recherche de Gallica, bibliothèque numérique de la BN, lequel, à mon grand dam, fait mal la différence entre le masculin et le féminin. Ainsi, lorsque je tape citoyennes dans le cartouche prévu à cet effet, Gallica m’assène une quantité (voir calculs ci-après) de citoyens, parmi lesquels surnagent des citoyennes, que mes yeux irrités ont du mal à distinguer. Certes, on rencontre parfois un « citoyens de l’un et l’autre sexe », mais j’ai épuisé depuis longtemps le charme pittoresque de la formule.

Or, la recherche de ce mot est un moyen de sondage assez commode et efficace, quoique grossier, dans une masse de millions de documents, régulièrement augmentée. Sachant qu’il y a beaucoup plus d’occurrences du mot au masculin (ce qui s’explique aisément), on mesure le temps et l’énergie gaspillés.

Il ne s’agit nullement d’un défaut qui serait inhérent à tout moteur de recherche, puisque d’autres moteurs fréquentés distinguent le masculin du féminin, et même le pluriel du singulier. Bref, ils tiennent compte de l’objet précis de la recherche, ce dont le moteur de Gallica est incapable.

Deux intervenantes de la table ronde prirent la peine de me répondre.

Nathalie Clot, directrice de la bibliothèque universitaire d’Angers et membre du conseil de pilotage du Centre des archives du féminisme, m’informa de la possibilité d’indiquer le motif de ma recherche entre guillemets, ce qui devait permettre, m’assura-t-elle, « d’alléger [ma] recherche ».

Pauline Chougnet, précisément conservatrice à la Bibliothèque nationale (« département de l’information bibliographique et numérique, pôle sur les données d’autorités ») m’informa de son côté qu’il existe à la BN des « stages de formation à l’utilisation de Gallica ». Sans doute, si j’avais pris la précaution de fréquenter l’un de ces stages, j’aurais appris l’astuce des guillemets, ce qui m’aurait évité de formuler publiquement une critique infondée et de me ridiculiser passablement.

Je précise que cette dernière phrase est de moi, qu’elle n’est pas sortie de la bouche de Pauline Chougnet, et que je ne fais là qu’interpréter le ton, qui m’a paru légèrement condescendant, de sa réponse. Je ne reprocherais à personne de considérer que je verse ici dans une légère paranoïa.

J’espère être cru, cependant, quand j’ajouterai avoir tout particulièrement apprécié les communications, précises, instructives et pleines d’humour, de ces deux intervenantes au cours de la table ronde.

Mais quoi, il ne restait que dix minutes avant de conclure et de quitter en hâte les locaux, plusieurs mains s’étaient levées… je n’allais pas endosser — face à deux spécialistes patentées — le costume du fâcheux obsessionnel. Je me tins coi.

D’ailleurs, si j’étais bien certain, hélas ! d’avoir été contraint dans un passé relativement récent, de visionner des centaines de pages inutilement, au cas où une occurrence de citoyennes se serait dissimulée parmi tant de citoyens, avais-je vérifié le fait, disons dans le mois écoulé ? Eh bien, à vrai dire, non. J’étais bien obligé de le reconnaître. J’étais venu à cette demi-journée d’étude, les mains dans les poches, sans savoir que je prendrai la parole et quelle remarque je ferai. Je n’avais, pour commencer, qu’à m’en prendre à moi-même.

Ça n’est donc qu’aujourd’hui, et après une fort mauvaise nuit (Gallica n’y est pour rien, mais une toux violente et persistante) que j’ai vérifié la validité actuelle du conseil qui m’a été donné.

Pour limiter, autant que possible, les fastidieux décomptes nécessaires, j’ai procédé à un test sur un numéro de la revue d’Alphonse Aulard La Révolution française (le trentième, janvier-juin 1896)

Si je vous encourage à vérifier, je ne peux que vous encourager également à la patience, attendu que la présentation des numéros est fautive (les tomaisons indiquées sont parfois inexactes; j’ai indiqué le lien par principe, ça ne fonctionne pas toujours très bien).

Des résultats intéressants… et déroutants

Lorsque je tape comme motif de recherche, comme c’est mon premier mouvement, citoyennes, sans guillemets, j’obtiens 12 occurrences du mot — au singulier ou au pluriel ; je n’y reviens pas dans la suite, le moteur ne fait pas la différence entre les deux, quel que soit le mot et/ou sa présentation.

Pour la même demande, le moteur me propose, en fait m’impose dans le rectangle à gauche de l’écran 21 occurrences de citoyens (singulier et pluriel).

Si je tape, comme on me l’a conseillé « citoyennes », entre guillemets (ce ne sont pas des guillemets typo qui s’affichent, peu importe), j’obtiens 13 occurrences de « citoyennes ». Je précise qu’une erreur de une ou deux occurrences est sans signification, vu la difficulté à compter en faisant défiler le texte dans un rectangle trop petit.

Je considère donc que j’obtiens le même nombre d’occurrences que je demande citoyennes ou « citoyennes ».

En revanche, le moteur me propose/impose 99 occurrences de citoyens.

C’est presque 5 fois plus (4,7 fois plus) de réponses erronées que lorsque je n’utilisais pas de guillemets.

Le moteur ne me fournit plus que 12% de réponses pertinentes.

Si je tape maintenant « citoyens », au masculin et entre guillemets, le moteur indique 153 occurrences de citoyens, un record… et 4 de citoyennes.

Si je tape, pour finir, citoyens, au masculin et sans guillemets, le moteur indique 152 occurrences (soit le même chiffre que précédemment en tenant compte d’une erreur de comptage) et 4 de citoyennes.

Essayons de nous résumer

a) On peut supposer que le nombre d’occurrences du mot citoyennes, au singulier et au pluriel, se situe dans ce document autour de 12 (pour le vérifier, il faudrait lire l’ensemble du numéro, ce que personne ne fera).

b) On peut également supposer que le nombre d’occurrences du mot citoyens se situe autour de 153.

c) Si je tape le mot féminin demandé sans guillemets, j’obtiens, par hypothèse, le nombre exact d’occurrences, mais « parasité » par presque le double de réponse inappropriées (le mot au masculin).

d) Si je tape le mot féminin demandé entre guillemets, j’obtiens toujours le nombre exact d’occurrences. Mais il se trouve maintenant parasité par un nombre beaucoup plus important (4,7 fois plus) de réponses inappropriées.

À l’inverse de ce que l’on m’a assuré, ma recherche ne se trouve pas « allégée », mais très significativement « alourdie ».

e) Le moteur de Gallica ne réserve pas le même traitement à une demande du mot s’il est indiqué au féminin et au masculin. L’alourdissement ne se retrouve pas pour le mot citoyens. En effet, que celui-ci soit indiqué avec ou sans guillemets, les résultats sont identiques.

Pour paraphraser une formule de Judith Butler, c’est bien ici le féminin qui met le trouble dans le genre !

Je suis bien incapable de proposer une explication.

Rétif aux thèses complotistes, dans tous les domaines, je ne suppose évidemment pas que l’on a programmé le moteur de Gallica pour qu’il « enfume » les malheureuses et malheureux qui font une recherche sur l’emploi du terme citoyennes, et non du terme citoyen.

Il serait intéressant, mais je ne suis pas certain que cela serait éclairant, de vérifier si le phénomène se vérifie avec d’autres termes — ce qui me paraît plus que probable, mais ma réserve de méticulosité fanatique est épuisé pour aujourd’hui !

On retiendra que le moteur de recherche de la bibliothèque numérique de la Bibliothèque nationale de France a un sérieux problème avec le féminin, ce qui, de quelque façon que l’on envisage la question, est très regrettable.

Un premier pas, qui ne coûterait rien, n’était à l’amour-propre de quelques-un(e)s, serait de reconnaître l’existence du problème.

__________________

[1] Aucune forfanterie, un étonnement tout au plus, et une incitation de genre à l’adhésion.

[2] Inutile de compulser frénétiquement vos manuels de théologie, la « grâce compétente » ne figure nulle part entre la « grâce suffisante » et la « grâce nécessaire ».

 

Dernière minute

Via Twitter, il m’a été répondu par Gallica (soi-même!) ce 26 janvier. La personne qui a eu l’amabilité de le faire m’a recommandé la chose suivante: aller dans «Recherche avancée» et cocher «Recherche exacte» (case en haut à droite; je précise parce qu’elle se situe en dehors du cadre qui contient toutes les commandes possibles).

J’ai donc testé la recherche de ce type dans la même livraison de La Révolution française. Je retombe sur le chiffre de 12 occurrences de citoyennes. Le nombre d’occurrences de citoyens est légèrement plus faible qu’auparavant (140, au lieu de 153).

Mais, et même sans tenir compte d’une probable erreur dans mon décompte (quelques occurrences de citoyens omises), la différence est minime, la «pollution» équivalente, et le problème entier.