« Mémoires du web – Le web à la première personne : quelles traces conserver ? »

A la BnF, le 17 juin 2010, l’après-midi était animée par Arnaud Laporte de France culture.
-Récits de soi
Philippe Lejeune, APA
En 1999, on dénombrait 68 journaux personnels. C’est un paysage qui a déjà disparu. Quand Philippe Lejeune a commencé à travaillé sur le sujet, il a eu l’impression d’être à la fois un pionnier et un archéologue, face à une réalité vivante et à un paysage fantôme qui s’évaporait au fur et à mesure. Les journaux ont souvent disparu, incinérés d’un coup de souris. Pour lui, l’espace a remplacé le temps et pour reprendre Régis Debray, la communication a remplacé la transmission.
La forme même du blog, par son ordre antéchronologique, favorise cette absence de transmission, la nouveauté relègue le passé dans l’oubli. Toutefois, la sauvegarde de tout aboutirait au chaos. En 1999, rares étaient ceux qui se souciaient des journaux en ligne. Un orphelinat avait été créé par « Mongolo » [orthographe approximative], un diariste qui s’est préoccupé très tôt de la sauvegarde de ces journaux. Mais les orphelinats sont eux-mêmes mortels, ce qui a conduit à la création de l’APA.
Très vite, le constat était que l’APA n’était pas en mesure de réussir la sauvegarde des journaux en ligne seule, d’où partenariat avec la BnF.
Christine Genin, BnF
La BnF, par le biais d’un robot nommé Heritrix, procède à des collectes larges automatisées sur le net pour les domaines en .fr et elle organise également des collectes plus ciblées, en fonction de thématiques (comme celle sur les sites concernant les élections). Des bibliothécaires sont chargés d’établir des listes de sites pour des collectes plus précises, environ 20.000 sites à l’heure actuelle.
Les blogs, carnets de voyages et autres qui sont reliés à une discipline précise sont collectés dans les départements. Ceux qui ont une dimension personnelle échappaient au classement disciplinaire de la BnF et c’est pour cette raison qu’ils sont collectés directement par le service du DL du web.
Bernard Massip, APA
La BM d’Ambérieu offre un espace à l’APA. L’association publie une revue « La faute à Rousseau ».
Pour la collecte, l’APA procède souvent par la consultation des blogrolls des blogs déjà connus mais elle ne s’y limite pas. Les sites sont sélectionnés selon des critères de durée (au moins un an) et de qualité d’écriture. Il s’agit de sites personnels, pas forcément intimes, mais avec une expression de la subjectivité de la personne. Dès qu’une forme d’écriture est singulière ou que le thème sort de l’ordinaire, le blog est proposé pour l’archivage (exemple : Le paysan heureux). Les blogs sont classés par catégories : intime relationnel (vie intérieure), culturel, air du temps/société politique), convivial familial, art de vivre/loisirs (mode, beauté, déco, bricolage, cuisine), graphique.
L’APA est confrontée à deux tensions contradictoires : le droit à la mémoire et le droit à l’oubli. Le droit à la mémoire est important pour le blogueur lui-même (souvent la perte du site). La situation se révèle paradoxale pour l’APA : en général, l’association répond à des demandes d’archivage. Pour ce qui est du web, c’est elle qui transmet à la BnF des adresses de sites sans que les auteurs en soient forcément informés. Finalement, la solution retenue est un communiqué qui explique ce qu’est le DL du net sur le site de l’association.
Beaucoup des premiers diaristes étaient dans une prolongation d’une pratique papier, donc dans une idée de conservation. Depuis, beaucoup de personnes sont dans une logique de communication immédiate. Bernard Massip pense qu’avec l’avènement des réseaux sociaux, ces personnes vont peut-être désinvestir les blogs.
Christine Genin
La BnF procède à deux collectes par an. A chacune de ces collectes, une cinquantaine de sites est ajoutée.
Christine Genin a ensuite montré des copies d’écrans de plusieurs des premiers journaux intimes mis en ligne sur le web, puis de blogs anciens. Elle a ensuite présenté le module de recherches pour les archives de l’internet. A l’heure actuelle, seulement 5% des documents archivés sont accessibles par ce module. Il n’existe pas encore d’indexation par sujet : pour pallier ce manque, la BnF a mis en place de parcours guidés. Quand un blog a eu plusieurs états successifs, les états successifs sont présentés sur le site des archives. Voilà qui me donne envie d’aller d’être accréditée pour la consultation de ces archives.
Gilda Fiermonte, Traces et trajets
Gilda Fiermonte est une blogueuse consciente des traces qu’elle peut laisser sur le web, elle n’a donc pas été surprise ni gênée de savoir que son blog était archivé par la BnF. Par contre, son lectorat s’étant étendu au fil des ans, elle fait désormais attention à ne pas mettre de liens vers des blogueurs qui ne sont pas conscients de la question des traces sur le web, notamment ceux qui évoquent des difficultés au travail. De même, elle veille à ne jamais évoquer ses enfants sans leur en parler auparavant.
Martine Sonnet, CNRS, Institut d’histoire moderne contemporaine
Les blogs sont une source précieuse pour les historiens. Il s’est produit un grand changement entre le moment où l’historien devait aller en bibliothèque pour faire des recherches et aujourd’hui où il a la possibilité d’accéder à de très nombreuses sources à portée de clic. Entre émerveillement et sidération devant cette situation inédite, il peut accéder très facilement aux documents, ce qui ne va pas sans générer de nouveaux problèmes : cette matière prolifique est souvent éphémère. Il s’est ainsi opéré un passage de la rareté à une profusion fugace. Face à un blog, le travail de l’éditeur n’est plus le même que celui que l’historien pouvait faire à partir des sources papier : avec une source papier, l’édition du texte devait être accompagnée par des notes de bas de page, etc. Le blogueur procède souvent lui-même d’emblée à ce travail par des liens et des notes. Par contre, un travail d’un autre type naît pour l’historien : la profusion de traces laissées par les blogueurs est à rechercher car ces derniers interviennent beaucoup en divers endroits de la toile (traces sur des sites de photos, commentaires, etc.). Le travail de l’historien se modifie profondément. Martine Sonnet a également évoqué sa pratique personnelle de blogueuse avec L’employée aux écritures et elle est revenue sur la complémentarité entre son site et son blog. Elle a aussi mentionné l’importance de twitter comme traces que l’on laisse sur le web.
Arnaud Laporte s’est interrogé pour savoir, finalement, de quel soi on parlait sur le web tant l’identité était fragmentaire et fragmentée.
Une collection d’éphémères
Gildas Illien, BnF
Gildas Illien a présenté ensuite le dépôt légal du web dans ses aspects techniques juridiques et techniques. Je n’ai pas pris de notes, j’avais déjà fait un billet sur la question suite à une conférence. A noter que la BnF n’a pas eu pour l’instant d’opposition au dépôt légal de l’internet mais plutôt des demandes d’explications. Pour ce qui est de la consultation dont beaucoup regrette qu’elle soit limitée aux sites de Tolbiac et Richelieu, Gildas Illien a expliqué qu’il s’agissait d’une question juridique. La BnF a par exemple archivé L’autofictif d’Eric Chevillard. Or quand ce dernier a publié une partie de son blog sur papier, il a retiré les billets du site. Il n’est de fait pas possible de laisser cette archive en libre accès. Toutefois, la BnF espère pouvoir prochainement donner un accès aux archives de l’internet à toutes les bibliothèques dépositaires du dépôt légal imprimeur (globalement les grandes bibliothèques dans les régions).
Carole Daffini, Enssib
Carole Daffini est actuellement à l’enssib et elle a présenté son mémoire de DCB qu’on trouve dans la bibliothèque numérique de l’établissement. Je me suis dispensée de notes parce que j’avais déjà parcouru le mémoire mais la présentation était très intéressante, je tiens à le dire :-)
André Gunthert, EHESS
La BnF a longtemps représenté la première source de travail du chercheur. Internet a transformé le travail des chercheurs : ils ont eu tout à coup à leur disposition le corpus et ont dû de fait apprendre à gérer leurs propres archives. Avant l’avènement de l’internet, quand on avait besoin de se servir du 4e fichier matière, on se faisait guider par un bibliothécaire. On avait besoin de lui. Ce n’est plus le cas aujourd’hui. André Gunthert considère qu’il y a eu une perte d’autorité de la BnF, notamment avec des positions tranchées comme celles qui ont pu être prises sur Google. En ce qui concerne le dépôt légal du web, la BnF a été réactive mais les chercheurs ont entre temps acquis une autonomie car ils ont quand même commencé à travailler sans elle au départ. Désormais, il n’est pas sûr que les chercheurs auront de nouveau envie de déléguer à un gestionnaire cette autorité de l’archive. De plus, pour l’instant, la BnF n’a pas encore fait la preuve de sa capacité à gérer un univers complexe.
Le blog (André Gunthert a créé la plateforme Culture visuelle sur lequel il a deux blogs, L’atelier des icônes et Totem) est l’outil qui fait exploser des catégories : lundi, on peut parler de recherche, mardi de son séminaire, mercredi de politique.
Autre problème que ne résout pas pour l’heure le mode de collecte du dépôt légal français, le fait que le chercheur ne se contentera pas de ce qui reste dans les frontières de l’Hexagone. De même, il perdure un problème de contenu : la BnF archive du texte, l’INA ce qui est visuel… Le blog représente un outil qui offre la possibilité d’associer les contenus. Est-ce que Culture visuelle sera archivé par l’INA ou la BnF ? On pourrait dire que le dépôt légal tel qu’il est pratiqué actuellement n’est plus de saison.
Une des réponses élaborées par défaut par son laboratoire est de se dire qu’on n’arrivera jamais à archiver tout l’internet (ou le seul qui en est capable n’est pas prêt à en donner les clés) mais que, face à une accélération de l’histoire, l’historien doit aussi accélérer son tempo : aujourd’hui nous produisons du passé à marche accélérée. C’est ce qui légitime le travail de l’historien : il est face à une nécessite de produire une organisation qui soit capable de décrire un paysage éphémère. Il est extrêmement important de produire des démarches qui témoigneront d’un passé dont il ne restera que ça.
Fanny Georges, Paris 1
Fanny Georges travaille sur l’identité numérique et les réseaux sociaux. Elle a évoqué la multiplicité des traces que l’on peut laisser sur Internet et les interactions qui se créent sur les réseaux. Elle a aussi traité des difficultés que peut rencontrer le chercheur face à ce matériau mouvant et parfois verrouillé que sont les réseaux sociaux.
Sociabilités
Clément Oury, BnF
Clément Oury a brossé un tableau des sociabilités que l’on peut retrouver aujourd’hui sur les archives du web. Les archives sont constituées de traces des usages sociaux récupérées par des collectes ciblées. Parfois, la BnF fait des collectes connexes : blogs et forums notamment. En effet, les réseaux sociaux sont constitués de telles manières que les robots ne peuvent pas toujours y pénétrer. Peut-être faudra-t-il inventer des robots qui aspirent les flux sans aller sur les sites (comme des sortes d’agrégateurs).
Louise Merzeau, Paris Ouest Nanterre La Défense
Les réseaux fonctionnent comme un milieu, comme un espace à habiter et ils constituent un milieu difficilement observable de l’extérieur. Il existe une dimension relationnelle du web social qui ne passe pas que dans l’expression mais se révèle aussi dans une dimension opératoire. Or dans l’archive, on n’a plus les boutons de lien, de recommandations, etc. Le paradoxe que comporte l’archive est d’avoir des traces sans feedback, sans la réactivité constitutive du web social.
Les réseaux ne sont pas seulement une question de représentation de soi mais ils sont utilisés plutôt comme des régies : sorte de tour de contrôle. Dans l’archive, on produit ou on renforce un cloisonnement (à l’échelle de l’individu) qui masque la portée réelle et sociale. Or des logiques d’agrégation, de percolation, de concaténation des contenus sont à l’œuvre en permanence. Les réseaux sociaux comportent une logique affinitaire : c’est le principe de « souscription » décrit par Olivier Ertzscheid qui consiste à se placer sous une autorité pour écrire.
Sur Twitter, les ramifications sont identifiables : chaque lien produit dans les tweets produit à son tour un cadre énonciatif. Il faudrait pouvoir archiver en plus du contenu le graphe des souscripteurs, un rendu du rythme, le nuage des tags associés et le faisceau des liens associés. Il va falloir développer des outils de cartographies.
Question de l’unité documentaire la plus pertinente : pour l’instant il s’agit de l’URL, mais le graphe pourrait s’avérer pertinent à l’avenir. De plus, la question doit se poser de la profondeur de l’archive : combien de clics et de pages distantes doit-on archiver ? Enfin, le degré d’implication de l’archive dans les réseaux eux-mêmes revêt une grande importance : l’archive doit elle-même s’immerger dans les réseaux, Heritrix doit devenir l’ami de certains ! [Et moi de me dire à cet instant, damned, et si Lapin de la BnF était un agent double d’Heritrix ?]
Désormais, on note une contamination de l’ensemble du web par les logiques sociales : une information ne vaut que si elle validée par un individu. Il y a de moins en moins de documents stables et objectifs : tout document emporte avec lui une trace de ses usages et de ses usagers. L’usager devient lui-même un document par les traces qu’il crée ou par celles qui sont laissées à sa place par les autres.
Paradigme de la personnalisation : l’information est aujourd’hui de plus en plus sur mesure et on peut dire en forçant le trait que toutes les données sont désormais personnelles car elles peuvent être rattachées à une personne.
Maintenant que la mémoire est publique, il faut se préoccuper de savoir qui va les utiliser. Il faut réfléchir à la patrimonialisation du web de façon à contrer un double risque, tout d’abord le risque d’une expropriation mémorielle et ensuite celui d’une repolarisation du réseau autour de rares puissances. L’expropriation mémorielle consiste dans les traces que nous laissons de nous et qui sont captées au risque d’une privatisation de notre mémoire. Cela l’archivage du web peut le contrer par la défense d’une mémoire publique contre une expropriation commerciale. La repolarisation du web est une tendance à remplacer le maillage réticulaire par une logique binaire (like/don’t like). Tous les parcours sont rapatriés vers un pôle (en l’occurrence facebook) et il existe un risque pour la structure même du web en soit affectée.
Il faut donc penser l’archive, certes comme artefact, mais comme quelque chose qui doit produire une intelligibilité et qui doit défendre la mémoire publique et la structure réticulaire du réseau.
Dominique Cardon, Orange Labs
Pour Dominique Cardon, on est désormais sorti du monde du document et on se trouve dans la conversation, dans l’oral. Quel type d’archive mettre alors en place pour cette conversation ?
Quand on a 500 amis sur facebook, on ne discute vraiment qu’avec 16 pour les femmes et 11 pour les hommes. Les conversations s’autorégulent et on n’intervient pas dans celles des « amis » un peu lointains selon leur teneur. Un statut personnel attirera des commentaires d’amis proches tandis qu’une citation ouvrira une discussion avec des contacts plus éloignés. Il existe continuellement un balancement entre une petite conversation et une plus grande. Ces conversations relèvent de l’ordre l’intime et du privé, mais également du grand public et d’une zone intermédiaire de « conversation privée en public ». Pour Dominique Cardon, ces publications publiques/privées devraient pouvoir s’évaporer, même si cela constitue un réel problème pour le chercheur. Le web n’étant plus documentaire, on est en train de vouloir aspirer la société, ce qui est démesuré.
Louise Merzeau
Les réseaux sociaux sont vivants, c’est effectivement de la conversation, mais ça n’empêche que la traçabilité traite ces éléments vivants comme des documents. C’est cette double dimension dont il faut prendre compte. L’archive publique pourra créer à la fois de l’oubli et un artefact. Seule l’archive publique peut permettre un débat sur le droit à l’oubli.
Dominique Cardon
Suite à une question d’Arnaud Laporte, il explique défendre le j’aime/j’aime pas de facebook qu’il voit comme une démocratisation du net vers des couches moins éduquées. Cela peut choquer ceux qui ont un « côté geek à l’ancienne » et qui sont attachés au lien. Il relativise aussi sur les discours très nombreux sur le profiling sur facebook : depuis deux ans qu’il est sur le réseau, il a encore comme publicité « jeunes u-m-pé » [l’orthographe bizarre est là pour éviter les moteurs…].