Les principes FAIR

Une bonne gestion de ses données vise à les rendre Faciles à trouver, Accessibles, compréhensibles par les humains et les machines, c’est-à-dire Interopérables, et Réutilisables. C’est ce qu’on appelle les principes FAIR. Ces principes recouvrent les différentes manières dont les données de la recherche se construisent, se conservent, se présentent, se partagent et se réutilisent.

• Assignation d’un identifiant pérenne et unique pour les différents jeux de données ;

• Dépôt dans un entrepôt de données adapté aux besoins (cela est mieux s’il est certifié, dit « de confiance », avec une pérennité assurée, un identifiant pérenne fourni et une gestion des différentes versions assurée) ;   

• Création de métadonnées externes riches, liées aux jeux de données ;

• Nécessité d’un archivage pérenne évalué (avec toutes les démarches que cela implique).

• Les données doivent être accessibles à toutes les personnes autorisées, mais pas plus ;

• Utiliser des protocoles standards, sécurisés, libres et ouvert lors de la mise en place de bases de données ;   

• Toujours travailler, si possible, avec des formats de fichier indépendant de tout logiciel propriétaire ;  

• Les métadonnées sont rendues accessibles en toute circonstance, même lorsque les données sont protégées ou perdues.

• Les métadonnées utilisent un vocabulaire contrôlé et FAIR pour les descriptions des données (mieux si la documentation du vocabulaire FAIR utilisé est facilement trouvable et identifiable à l’aide d’un identifiant pérenne qui lui est propre) ;

• Pour une interopérabilité optimale, choisir un entrepôt lié au web de données et construit sur la technologie RDF ou équivalent, mais cela n’est pas encore le plus répandu.

• Il faut choisir une licence pour stipuler clairement les conditions de réutilisation des données ;

• La provenance des données doit être décrite avec précision ;

• Un fichier « readme » peut être ajouté si nécessaire pour assurer la bonne compréhension et la réutilisation des données dans le futur (le mieux étant qu’il contienne aussi l’ensemble des informations permettant une nouvelle récupération des données dans des conditions parfaitement similaires) ;   

• Le schéma de métadonnées choisi doit être adapté aux types de ressources, au domaine, à la communauté ou à l’entrepôt.