L'ORD, en théorie
Les données de recherche
Les données de recherche correspondent à tous les enregistrements qui vont permettre aux chercheurs de produire des connaissances. Quelques exemples :
- Base de données
- Entretiens audios, ou recodés par écrits
- Enregistrements visuels (photographies, films, documents numérisés)
- Carnets de note
- Fichiers issus de logiciels
- Et bien d'autres formats...
Ces données sont expliquées, décrites et contextualisées par des métadonnées (comprendre des données sur les données), qui peuvent prendre des formes différentes (documents de contextualisation, codebooks…).
Le cycle de vie des données
Plutôt qu’une durée de vie limitée, l’Open science propose d’offrir aux données un cycle de vie ininterrompu.
- Collecte : les données sont créées ou recueillies.
- Traitement : les données sont modifiées pour rendre leur interprétation possible.
- Analyse : les données sont analysées pour produire des connaissances.
- Archivage: les données ont rempli leur première vocation : elles sont maintenant archivées.
- Partage: c’est la nouvelle étape, qui permet de transformer une vie linéaire en un cycle. Les données sont documentées et mises au service de la communauté, pour être réutilisées.
- Utilisation secondaire : les données commencent un nouveau cycle de vie aux mains de nouvelles personnes ; les producteurs originaux des données sont cités.
Les critères FAIR
Pour que les données puissent être réutilisées, elles doivent respecter un ensemble de critères, résumés par l’acronyme FAIR.
- Findable : les données doivent être trouvables. Cela implique qu’elles soient hébergées sur une plateforme reconnue, suffisamment bien décrites pour être identifiables, et disposent d’un identifiant unique et pérenne (DOI).
- Accessible : les données doivent être accessibles à tous. Bien sûr, des exceptions existent (données sensibles, sous embargo…)
- Interoperable : les données doivent être encodées dans des formats utilisés par la communauté, et être décrites en suivant des vocabulaires contrôlés.
- Reusable : les données et le cadre de leur réutilisation doivent être décrits précisément.