S3-3 : Les données ouvertes ; Formats et Traitement des données

Par VINCENT IMBERT, publié le mardi 18 juillet 2023 10:26 - Mis à jour le samedi 23 décembre 2023 14:34
Présentation

Pour être exploitables, les données sont stockées dans des fichiers de manière structurée. Plusieurs formats de fichiers peuvent être utilisés en fonction des besoins.

 

Problématique

 

Qu'est-ce que les données ouvertes ?

 

 

Travail à faire

 

Partie définition :

Partie data.gouv :

  • À partir du site data.education.gouv.fr, trouver les informations suivantes :
    • le nombre d’admis au BAC Général en 20..    à 16 ans ou moins .
    • en quelle année y en a-t-il eu le plus ?
  • À partir des onglets « informations » et « tableau », trouver les informations suivantes :
    • Quelle période couvre les données ?
    • Combien y a-t-il de descripteurs 
    • Combien de type de données différents ?

Partie export des données data.gouv :

  • Dans l’onglet « export », télécharger les 3 fichiers disponibles de type CSV, JSON et EXCEL.
    • Ouvrir les 3 fichiers avec le BlocNote puis avec LibreOffice Calc.
    • Qu’observez-vous ?
    • Quel est l’intérêt du format CSV ?
    • A partir du fichier CSV, filtrer uniquement les données de l’année « 20        », et trier les données par « Age ». Combien de personne de 30 ans ou plus ont obtenu le baccalauréat en 2020 ?

 

 
Ressources : Données ouverte
Partie définition : 

 

Partie data.gouv : 

 

Partie export des données data.gouv : 

 

 

 

 

 

 

 

ici

 

 

 

Point méthode

 

Donnée ouverte

Une donnée ouverte est une donnée à laquelle l’accès est totalement public et libre de droit, au même titre que l’exploitation et la réutilisation.

Descripteur

élément servant à dcrire une donnée. Lorsque les données sont structurées, les descripteurs sont généralement placés en tête de colonne.

Collection

Une collection de données regroupe des objets paratageant les mêmes descripteurs.

Objet

Un objet est donné par la liste des valeurs de tous ses descripteurs. Les données sont alors dites "structurée". Plus implement, si les données sont rangées sous la forme d'une table, alors les objets correspondent aux lignes de la table.

Donnée structurée

Ensemble de données stockées sous la forme d'une table regroupant de multiples objets selon un ou plusieurs descripteurs.

   

.csv : de l'Anglais Comma Separated Values

Les fichiers avec l’extension .csv représentent des fichiers en texte brut qui contiennent des enregistrements de données avec des valeurs séparées par des virgules

.json de l'Anglais JavaScript Object Notation

Il s'agit d'un format de fichier standard ouvert propre au langage JavaScript. Ce type de fichier utilise du texte lisible par l’homme pour stocker et transmettre des données.

.xlsx

Il s'agit d'un format de fichier bien connu pour  les documents Microsoft Excel qui a été introduit par Microsoft avec la sortie de Microsoft Office 2007.

 

 

Ce que je dois retenir

 

 

 

Pour aller plus loin

 

PodCast France Culture "Des données à raconter" 

 

 

 

 

     
Pièces jointes

À télécharger

 / 1