La donnée en biodiversité : de l’acquisition à l’ouverture
Cette formation de cinq jours a pour objectif de travailler autour des différentes étapes du cycle de la donnée, de l’acquisition à l’ouverture en passant par la gestion, le stockage et la rédaction de data papers.
Le Cesab – Centre de synthèse et d’analyse sur la biodiversité – de la FRB, le Pôle National des Données de Biodiversité (PNDB) et GBIF France proposent la première édition de la formation « La donnée en biodiversité : de l’acquisition à l’ouverture ». Cette formation de cinq jours a pour objectif de 1) contextualiser les enjeux autour de la compréhension, du partage et de la (ré)utilisation des données et métadonnées de biodiversité et 2) faire monter en compétences les communautés intervenant à une ou plusieurs étapes du cycle de la donnée.
Cette formation sera dispensée en français et se déroule à l’automne dans les locaux du Cesab à Montpellier. Son prix est de 250 € pour la semaine – repas du midi inclus. Les frais de transport, d’hébergement et les repas du soir sont à la charge des participant(e)s.
Retrouvez la formation sur GitHub
Une bonne maîtrise du logiciel R est requise.
- Nicolas CASAJUS (FRB-Cesab)
- Camille COUX (FRB-Cesab)
- Yvan LE BRAS (PNDB)
- Olivier NORVEZ (PNDB)
- Anne-Sophie ARCHAMBEAU (GBIF France)
- Sophie PAMERLON (GBIF France)
Ceci est un exemple de programme, le programme est susceptible de changer d’année en année.
Des cours magistraux suivis de travaux dirigés seront dispensés les quatre premiers jours. Des travaux pratiques en sous-groupes seront réalisés le dernier jour.
Introduction et tour d’horizon
- Qu’est-ce qu’une donnée/métadonnée ?
- Grands types de données de biodiversité
- L’écosystème de la donnée en France et en recherche
- Cycle de la donnée
- Atteindre un haut degré de “FAIRitude”
- Les défis actuels (en recherche et au-delà)
Acquisition des données
- Bonnes pratiques pour une collecte de données (terrain, laboratoire, etc.)
- Accès aux données existantes (API, web scraping, text mining, etc.)
- Données brutes vs. données dérivées
Gestion des données
- Structuration (SQL, fichiers CSV, etc.)
- Traitement, nettoyage et homogénéisation
Aspects juridiques
- Partage, licences, etc.
Ouverture des données
- Plan de gestion des données
- (Méta)données : les standards
- Stockage et archivage
- Diffusion et partage
- Valorisation : le Data paper