Signification du champ .representations dans un Amendement

Le champ representations est documenté:

Les Amendements ont deux représentations :

  • le pdf de référence, pure image de l’amendement
  • un pointeur sur le HTML ancré

Cela donne lieux à deux noeuds “représentation” :

Cependant toutes les representations sont de type mime applciation/PDF et la liste a un seul élément:

find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations | length' | sort | uniq -c
 128124 1

Et le champ statutRepresentation est toujours égal à

      "statutRepresentation": {
        "verbatim": true,
        "canonique": true,
        "officielle": true,
        "transcription": false,
        "enregistrement": false
      },

Pour véfifier:

find ../data/assemblee-nettoye/Amendements_XV_nettoye -name '*.json' | xargs jq '.representations[0].statutRepresentation | select(.verbatim != true or .canonique != true or .officielle != true or .transcription != false or .enregistrement != false)' 

Seul le champ .representations[0].contenu.documentURI varie et contient le path de l’URL de l’amendement sur http://www.assemblee-nationale.fr

@eraviart il serait possible de simplifier en gardant uniquement documentURI. Il y a fort a parier que la représentation ne va pas changer à l’avenir.