/*
 * https ; gemini ;
 * tout ; log ; twtxt ;
 * à propos (@) ; ;
 */

Archives des commentaires réduites

Jusqu'à présent, je publiais les archives des commentaires à propos des articles avec l'aide d'hypermail.

Non content de ne publier qu'en html, qui plus est avec de jolis bugs pour les lettres accentuées, j'ai retroussé mes manches et commencé à écrire un "mailtotxt". L'idée était d'extraire le contenu pertinent d'un message pour l'écrire dans un fichier text/plain.

Au départ, j'ai pensé utiliser scribo, tout à fait adapté pour ça. Cependant, j'ai systématiquement des erreurs de segmentation.

scribo

N'ayant pas le niveau pour corriger ce souci, j'ai donc avancé petit à petit et codé ce dont j'avais besoin.

J'en étais arrivé à récupérer les entêtes et le corps du message et lisais les rfc2045 pour décoder les "quoted-printable" et "base64". Bien que ce soit nouveau, ça prenait forme.

Toutefois, Solène m'a alerté : elle trouvait son nom indexé en ligne, et ça l'embêtait un peu.

Solène

Je la comprends, en publiant un message sur la mailing-list, elle n'imaginait sans doute pas voir des données personnelles exposées ainsi.

J'ai choisi une liste de diffusion pour les commentaires car 3 points me paraissaient intéressants :

Tous ces avantages ne devraient pas retenir quiconque de prendre la parole et de s'exprimer.

Safe & positive space

Cela a remis en question mon développement de "mailtotxt".

Je pourrais bien évidemment supprimer le nom de l'auteur pour ne conserver que l'adresse mail afin d'identifier l'auteur.

Sauf que...

Il est tout à fait possible que dans une réponse, quelqu'un cite le nom de la personne à laquelle il répond. Et ça, je ne peux pas le détecter.

J'aurais pu aussi ajouter des règles dans un fichier "robots.txt". Cependant, comment être certain que tous les crawlers le respecteront?

J'ai alors choisi de supprimer les archives mises en ligne.

Ces dernières restent accessibles à ceux qui sont inscrits à la liste en utilisant l'adresse mail "bla+get-N@bla.si3t.ch".

Pour restreindre cet accès aux inscrits avec mlmmj, il suffit d'ajouter un fichier "control/subonlyget".

Enfin, j'utilise toujours mlmmj pour supprimer les entêtes potentiellement compromettants en les listant dans un fichier "control/delheaders". Son contenu est actuellement:

Reply-To:
Received:
Message-ID:
User-Agent:
From:
Return-Path:
mlmmj TUNABLES

À ce propos, n'hésitez pas à me signaler des oublis que j'aurais pu faire.

Finalement, ces modifications seront peut-être un avantage.

Une réaction?

📧 Envoyez votre commentaire par mail.
Mode d'emploi de la liste de diffusion pour recevoir les réponses.