Absence de documentation sur la construction des URLs des documents

Un dépôt est désormais alimenté avec les documents et un nommage trivial


Les documents associés aux dossiers législatifs sont des méta informations à propos du document lui même, publié sur le site de l’assemblée nationale. Pour faire le lien, on croyait qu’il suffisait d’interpréter le champ uid mais cela s’avère insufissant.

L’absence de documentation pose problème et des URLs que l’on croyait valides peuvent s’avérer fausses (cas 1, cas 2). Il se trouve aussi qu’il n’est pas suffisant d’interpréter l’uid, il semble aussi nécessaire de prendre en compte d’autres champs dans le document, probablement la classification qui, elle non plus, n’est pas documentée.

Tous les documents de l’Assemblée Nationale dont l’uid commence par AVIS ETDI LETT PION PNRE PRJL RAPP RINF sont accessible à une URL du genre http://www.assemblee-nationale.fr/dyn/docs/{uid}.raw et l’URL http://www.assemblee-nationale.fr/dyn/docs/{uid}.pdf redirige vers le PDF correspondant.

Cela ne fonctionne pas pour les documents dont l’uid débute par ACIN AVCE. Ils sont seulement disponible en pdf et la conversion dans urls.ts est correcte par exemple http://www.assemblee-nationale.fr/15/pdf/projets/pl2623-ace.pdf ou http://www.assemblee-nationale.fr/15/pdf/projets/pl2551-ai.pdf

Il y a cependant des exceptions:

La solution finalement trouvée consiste à alimenter un dépôt au quotidien.Le fichier contentant le texte correspondant au document correspond à son identifiant unique (uid). Voir la documentation pour plus d’information.