Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Anomalies dans les données Klekoon #32

Open
4 tasks
ColinMaudry opened this issue Feb 24, 2020 · 12 comments
Open
4 tasks

Anomalies dans les données Klekoon #32

ColinMaudry opened this issue Feb 24, 2020 · 12 comments
Assignees
Labels
anomalie Anomalie dans les données source

Comments

@ColinMaudry
Copy link

Après téléchargement, les anomalies suivantes ont été repérées dans les données. Elles seront cochées au fur et à mesure de leur résolution par Klekoon ou par un post-traitement :

  • SIRET de titulaires (.titulaires.id) incorrects (trop courts) : voir marchés 2019000018520100, 2020000018997300, mais je pense que tous les marchés sont impactés
  • beaucoup de marchés dont .acheteur.nom est "KLEKOON Compte entreprise". Le SIRET varie un peu, mais je ne trouve que 57 SIRET d'acheteur (.acheteur.id) différents dans l'ensemble des données.
  • certains marchés ont un format de date incorrect : marché 2019000018651000, "08/08/2019 12:07" au lieu de "2019-08-08" (aaaa-mm-jj)
  • valeurs normées incorrectement capitalisées : marché 2019000018651000, "ferme et actualisable" au lieu de "Ferme et actualisable", "marché" au lieu de "Marché", etc.

Toutes ces anomalies sont bloquantes pour l'intégration aux données consolidées.

cc @ungeric-klekoon

@ColinMaudry ColinMaudry added the anomalie Anomalie dans les données source label Feb 24, 2020
@ColinMaudry ColinMaudry self-assigned this Feb 24, 2020
@ColinMaudry
Copy link
Author

2 316 marchés ont été recensés, pour seulement 57 acheteurs (SIRET) uniques.

@ungeric-klekoon
Copy link

Merci pour le retour
On va s'occuper des anomalies

@ungeric-klekoon
Copy link

ungeric-klekoon commented Mar 2, 2020 via email

@ColinMaudry
Copy link
Author

Merci, je vais tester.

Pour les API liées à des dates, vous vous appuyez sur quelle valeur ? dateNotification ? datePublicationDonnees ?

@ColinMaudry
Copy link
Author

Lorsque vous retournez plusieurs objets marchés, vous devez utiliser le schéma "paquet" : schéma et exemple.

De façon à avoir un array en vrai JSON 🙂

@ColinMaudry
Copy link
Author

ColinMaudry commented Mar 2, 2020

En fait il suffit d'envelopper les données actuelles dans

{
  "marches": [
    ...
  ]
}

Et en séparant les objets marchés avec des virgules, évidemment.

@ungeric-klekoon
Copy link

ungeric-klekoon commented Mar 3, 2020 via email

@ungeric-klekoon
Copy link

Bonjour,
Nous avons effectuer les corrections (finger crossed).
[2020_03_04_114535.zip]
(https://github.com/etalab/decp-rama/files/4286871/2020_03_04_114535.zip)
N'hésitez pas.
Cordialement
Eric

@ColinMaudry
Copy link
Author

ColinMaudry commented Mar 5, 2020

Très bien ! Il ne reste plus qu'à retirer les champs uid, et c'est bon.

Ce sont des champs qui sont alimentés au moment de l'agrégation des différentes sources de données : https://github.com/etalab/decp-rama/blob/master/scripts/package.sh#L21

@ungeric-klekoon
Copy link

ungeric-klekoon commented Mar 5, 2020 via email

@ColinMaudry
Copy link
Author

ColinMaudry commented Apr 19, 2021

@ungeric-klekoon Y a t-il une documentation de l'API ? Je ne me souviens plus quelle était la meilleure manière de télécharger les données (http://data.klekoon.com/api/dcat/all/json ne retourne qu'un marché, pas l'ensemble des données). Merci !

@ungeric-klekoon
Copy link

Bonjour Mr Maudry,

Voici la documentation :

api/dcat/{format}/{id} ==> Récupère une DE (Données Essentielles) par son ID et un format (Json/XML)
api/dcat/all/{format}/{dateDebut}/{dateFin} ==> Récupère les DE sur un intervalle de temps par son format (Json/XML)
api/dcat/all/{format} ==> Récupère les 3 dernier jours de DE par son format (Json/XML)

N'hésitez pas à me solliciter

Très cordialement.
Eric

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
anomalie Anomalie dans les données source
Projects
None yet
Development

No branches or pull requests

2 participants