Le champ representations est documenté:
Les Amendements ont deux représentations :
- le pdf de référence, pure image de l’amendement
- un pointeur sur le HTML ancré
Cela donne lieux à deux noeuds “représentation” :
- L’une de type mime pdf et une url de la forme http://docparl.assemblee-nationale.fr/base/UID?format=pdf où UID est l’uid de l’amendement
- L’autre de type mime xhtml avec une url de la forme http://docparl.assemblee-nationale.fr/base/UID?format=xhtml où UID est l’uid du texte législatif et l’élément offset/adresse contient l’adresse de l’ancre dans le document xhtml (#dqdqsdsq)</xs:documentation>
Cependant toutes les representations sont de type mime applciation/PDF et la liste a un seul élément:
find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations | length' | sort | uniq -c 128124 1
Et le champ statutRepresentation est toujours égal à
"statutRepresentation": { "verbatim": true, "canonique": true, "officielle": true, "transcription": false, "enregistrement": false },
Pour véfifier:
find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations[0].statutRepresentation | select(.verbatim != true or .canonique != true or .officielle != true or .transcription != false or .enregistrement != false)'
Seul le champ .representations[0].contenu.documentURI varie et contient le path de l’URL de l’amendement sur http://www.assemblee-nationale.fr