Le champ uid d’un Document est un identifiant unique. Mais il sert aussi à retrouver l’URL du document. Il faut d’abord le décomposer et reconstituer une URL selon cette méthode.
Par exemple: http://www.assemblee-nationale.fr/15/rap-info/i1241.asp a la structure http://www.assemblee-nationale.fr/$legislature/$directory/$prefix$bibard$suffix.asp
L’origine de l’algorithme est un fichier PHP utilisé en interne par le site https://www.assemblee-nationale.fr/ et fournit à RegardsCitoyens qui l’ont traduit en python.
L’information est cependant incomplète. Il y manque, par exemple la transformation de RINF incorrectement traduit en rapports pour ce document au lieu de rap-info