Le W3C: Data on the Web Best Practices donne une check list de ce que devrait fournir un service qui distribue des données. Certains éléments ont été ignorés parce qu’ils ne s’appliquent pas, comme par exemple Data should be designated if it is irreproducible qui concerne les jeux de données qui sont détruits en partie au fil du temps.
Légende: fait, à faire, ne sera pas fait
Requirements for Data Access
- Data should be available for bulk download data.tricoteuses.fr · GitLab via git
- The access level of the data should be provided along with conditions of access, for example, Open, restricted or closed la home page précise la licence.
- Data should be available in an up-to-date manner and the update cycle made explicit la home page précise le cycle de mise a jour et la procédure de transformation des données.
Requirements for Data Enrichment
- It should be possible to perform some data enrichment tasks in order to aggregate value to data, therefore providing more value for user applications and services lien vers data.tricoteuses.fr · GitLab qui permet de faire des suggestions via des issues. Faire quelque chose comme wikilex serait mieux mais l’effort est substantiel.
Requirements for Data Formats
- Information about locale parameters (date and number formats, language) should be made available les données et la documentation sont implicitement en Français et il ne serait pas utile de le préciser explicitement.
- Data should be available in a machine-readable format that is adequate for its intended or potential us tous les fichiers sont au format JSON data.tricoteuses.fr · GitLab
- Data should be available in multiple formats seulement JSON pour limiter le travail de maintenance
- Data should be available in an open format JSON
- Data should be available in a standardized format. Through standardization, interoperability is also expected JSON
Requirements for Data Identification
- Each data resource should be associated with a unique identifier le commit hash d’un fichier et l’intervalle de numéros de lignes, à défaut d’autre identifiant, permet de construire un permalink, par exemple pour ce texte de loi.
Requirements for Data Selection
- Preliminary steps in the data lifecycle should not infringe upon individual’s intellectual property rights on suppose que les organisations produisant les données ont pris les précautions nécessaires
- Data should be identified by a designated lifecycle stage
Requirements for Data Vocabularies
- Vocabularies should be clearly documented dans les JSON schemas, par exemple le champ uriHatvp d’un acteur. Elles sont complétés le cas échéant par des explications relatives au jeu de données, par exemple le code type d’organe.
- Vocabularies should be shared in an open way les schemas JSON sont publiés dans des dépots git (par exemple tricoteuses-assemblee) ainsi que les sources de la documentation.
- Existing reference vocabularies should be reused where possible les jeux de données publiés par l’assemblée nationale ne font pas usage d’ontologies existentes, même lorsque ce serait possible. Ils ne sont pas modifiés pour améliorer la réutilisation parce que ce serait un travail significatif.
- Vocabularies should include versioning information des tags de version sont placés sur chaque dépot contenant des schemas.
Requirements for Licenses
- Data should be associated with a license License Ouverte
- Liability terms associated with usage of Data on the Web should be clearly outlined aucun des jeu de données qui sera publié ne présente des risques qui méritent cette attention
Requirements for Metadata
- Production context information should be associated with data if relevant, e.g. service/process descriptions. DataProductijonContext is a type of metadata, so all metadata requirements also apply here lien vers l’assemblée nationale sur la home page: c’est le producteur des données.
- Metadata should be available JSON schemas, par exemple les acteurs
- Metadata vocabulary, or values if vocabulary is not standardized, should be well-documented voir JSON schema
- *Metadata should be machine-readable le format JSON schema est machine readable
- Metadata should be standardized. Through standardization, interoperability is also expected l’effort est trop important
Requirements for Preservation
- An identifier for a particular resource should be resolvable on the Web and associated for the foreseeable future with a single resource or with information about why the resource is no longer available les permalink des dépôts git, par exemple pour ce texte de loi.
Requirements for Provenance
- If different versions of data exist, data versioning should be provided des tags de version sont placés sur chaque dépot.
- Data provenance information should be available. Provenance data is a type of metadata, so all metadata requirements also apply here* lien vers l’assemblée nationale sur la home page qui est l’endroit dont proviennent les données.
Requirements for Data Quality
- Publishers should indicate if data is partially missing or if the dataset is incomplete la documentation contient un lien vers les bugs, par exemple l’absence des allocutions
- Data should be comparable with other datasets parce que les jeu de donnés ne sont pas normalisés, ils ne sont pas comparables. Les agendas de l’assemblée pourraient être publiés au format Icalendar.
- Data should be complete except for bugs, all data sets are expected to be complete
- Data should be associated with a set of documented, objective and, if available, standardized quality metrics. This set of quality metrics may include user-defined or domain-specific metrics
- Subjective quality opinions on the data should be supported les opinions sur la qualité des données peuvent être ajoutées dans la catégorie du forum
Requirements for Data Usage
- It should be possible to cite data on the Web les permalink des dépôts git, par exemple pour ce texte de loi.
- It should be possible to track the usage of data
- Data consumers should have a way of sharing feedback and rating data un lien vers la catégorie data.tricoteuses.fr se trouve sur la home page.