Signification du champ uid dans un Document

Le champ uid d’un Document est un identifiant unique. Mais il sert aussi à retrouver l’URL du document. Il faut d’abord le décomposer et reconstituer une URL selon cette méthode.

Par exemple: http://www.assemblee-nationale.fr/15/rap-info/i1241.asp a la structure http://www.assemblee-nationale.fr/$legislature/$directory/$prefix$bibard$suffix.asp

L’origine de l’algorithme est un fichier PHP utilisé en interne par le site https://www.assemblee-nationale.fr/ et fournit à RegardsCitoyens qui l’ont traduit en python.

L’information est cependant incomplète. Il y manque, par exemple la transformation de RINF incorrectement traduit en rapports pour ce document au lieu de rap-info

Le champ uid pourrait être considéré comme un identifiant opaque s’il est confirmé qu’il est trivial de construire une URL pour obtenir le document correspondant.

Les dépots ont été réorganisés il n’y a plus de hiérarchie, tout les documents sont dans le répertoire uid et déduire le nom de fichier à partir de l’uid est trivial.