Réutiliser et trouver des données
Pourquoi réutiliser des données ?

Dans le cadre d'un projet de recherche, vous allez être confronté à l'interrogation du besoin de la production des nouvelles données. Dans certains cas, il est possible de réutiliser des données de recherche précédentes par exemple dans le cadre d'un méta-analyse, l'existence des prélévéments du terrain par des collègues de votre laboratoire, équipe de recherche ou encore communauté disciplinaire.
La réutilisation des données, quand cela est possible, répond à un besoin de sobrieté numérique. Dans un contexte de forte croissance du numérique et d'utilisation de ressources abiotiques et pollutions multiples, la réutilisation des données vous permettra de réduire votre empreinte environnementale.
Pour en savoir plus sur les bonnes pratiques de sobrieté numérique, consultez notre boîte à outils !
Où trouver des données ?
Les données sont hébergées dans des entrepôts de données. Vous pouvez identifier les entrepôts qui vous intéressent via des listes ou annuaires d’entrepôts de données. Une fois le ou les entrepôts identifiés, la plupart intègrent une fonction de recherche simple ou avancée.
Vous pouvez aussi chercher directement des jeux de données via des moteurs de recherche spécialisés, qui vont interroger plusieurs entrepôts. Il en existe plusieurs, avec un périmètre différent et plus ou moins précis.
-
Dataset Search (moteur de Google) : cherche des jeux de données dans un grand nombre de sources, y compris des données qui ne sont pas nativement des données de recherche. Mais il n’est pas toujours exhaustif.
-
Data Monitor (moteur de recherche d’Elsevier) : payant
-
DataCite Search : recherche parmi les données qui ont un DOI
-
OpenAire Explore : données issues de projets européens
Lorsque vous souhaitez réutiliser des données dans le cadre de votre projet de recherche, il est essentiel de vérifier les conditions de réutilisation. Ces conditions de réutilisation des données sont en général précisées par la licence associée au jeu de données.
Pour en savoir plus sur l'utilisation des licences, consultez la section questions juridiques !
Comment citer des données réutilisées ?
Si vous réutilisez des données existantes, en fonction des conditions de réutilisation, vous serez également amené à les citer. Comme pour les publications scientifiques, cette action permet de créditer les producteurs de données et valoriser leur travail.
La fiche pratique "Citation des données" vous donnera des clés sur le pourquoi et comment citer, ainsi que des exemples.
Les données que vous réutilisez seront également stockées ou traitées. Il est donc nécéssaire de prévoir leur organisation et nommage en suivant des bonnes pratiques de documentation.