Signification du champ .representations dans un Amendement

paulineleon · Décembre 24, 2019, 3:02

Le champ representations est documenté:

Les Amendements ont deux représentations :

le pdf de référence, pure image de l’amendement

un pointeur sur le HTML ancré

Cela donne lieux à deux noeuds “représentation” :

L’une de type mime pdf et une url de la forme http://docparl.assemblee-nationale.fr/base/UID?format=pdf où UID est l’uid de l’amendement

L’autre de type mime xhtml avec une url de la forme http://docparl.assemblee-nationale.fr/base/UID?format=xhtml où UID est l’uid du texte législatif et l’élément offset/adresse contient l’adresse de l’ancre dans le document xhtml (#dqdqsdsq)</xs:documentation>

Cependant toutes les representations sont de type mime applciation/PDF et la liste a un seul élément:

find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations | length' | sort | uniq -c
 128124 1

Et le champ statutRepresentation est toujours égal à

      "statutRepresentation": {
        "verbatim": true,
        "canonique": true,
        "officielle": true,
        "transcription": false,
        "enregistrement": false
      },

Pour véfifier:

find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations[0].statutRepresentation | select(.verbatim != true or .canonique != true or .officielle != true or .transcription != false or .enregistrement != false)'

Seul le champ .representations[0].contenu.documentURI varie et contient le path de l’URL de l’amendement sur http://www.assemblee-nationale.fr

paulineleon · Décembre 24, 2019, 3:05

@eraviart il serait possible de simplifier en gardant uniquement documentURI. Il y a fort a parier que la représentation ne va pas changer à l’avenir.