💰💌 Si tu te procures un abonnement d'un an au forfait premium de Oui, mais je LLM d'ici le 30 novembre, je t'offre en prime mes quatre formations autodidactes, une valeur de 276 $ ! Clique ici !" 💰💌

Magic Scroll Icon Le grimoire du magicien Magic Scroll Icon

Les principes FAIR - Rendre tes données de recherche réutilisables

- 2 974 mots - Temps de lecture estimé: 17 minutes

🌘 Introduction

Cet article de blog s’inspire d’une présentation donnée à la journée thématique de gestion des données pour professionnels de recherche en 2023 à l’Université Laval. Il vise à démystifier les principes FAIR. Il souligne également leur importance dans le paysage actuel de la recherche.

L’objectif principal des principes FAIR est de rendre les données de recherche Facilement Accessibles, Interopérables et Réutilisables. Ceci s’applique aux individus et aux machines. Dans le paysage actuel de la recherche, nous sommes confrontés à plusieurs défis liés aux données.

Ces défis incluent leur volume massif, leur complexité croissante, et la difficulté à trouver ce qui existe déjà. Les enjeux liés à leur déplacement et leur stockage sont aussi importants. Les principes FAIR offrent un cadre pour relever ces défis. Ils maximisent la valeur des données scientifiques.

🌘 Que signifie FAIR ?

FAIR est un acronyme pour Findable (Découvrable), Accessible, Interoperable (Interopérable), Reusable (Réutilisable). Ces principes visent à améliorer la gestion et la réutilisation des données scientifiques. Ce ne sont pas des normes techniques strictes. Ils constituent plutôt un ensemble de lignes directrices pour la publication et la gestion des données.

Findable, Accessible, Interoperable, Reusable dans un diagramme de Venn. L'intersection est FAIR

Les principes FAIR ont été définis par Wilkinson, M. D. et al. (2016). Cet article est considéré comme fondateur. Ils s’inspirent de la Définition du Savoir Libre de l’Open Knowledge Foundation. Cette fondation promeut l’ouverture des connaissances sous toutes ses formes.

🌘 Les enjeux actuels avec les données

Avant de plonger dans les détails de chaque principe FAIR, il est essentiel de comprendre les défis. La communauté scientifique est confrontée à ces défis en matière de gestion des données. Ces enjeux soulignent la nécessité d’adopter des pratiques comme celles proposées par FAIR.

🌘 Données massives

Le concept des “données massives” (Big Data) est souvent résumé par les “5 V” :

Les 5 V des données massives

🌘 Complexité des données

Au-delà du volume, la complexité intrinsèque des données de recherche pose des défis significatifs :

🌘 Trouver ce qui existe déjà

La recherche d’informations scientifiques est un processus bien établi pour les articles. Des outils comme Sofia (bibliothèque de l’Université Laval), Google Scholar ou arXiv facilitent cette recherche. Cependant, trouver les données associées à ces articles est souvent un défi majeur. Les données sont rarement citées de manière standardisée.

Même lorsque les données sont trouvées, leur ouverture peut révéler des surprises. Ces surprises concernent le format, la documentation ou la qualité. Cela rend leur réutilisation difficile.

🌘 Déplacer et stocker les données

Le stockage et le déplacement des données ont évolué. Chaque solution présente ses propres défis :

🌘 Qu’est-ce qui est concerné par FAIR?

Les principes FAIR s’appliquent à tous les actifs numériques produits par des activités de recherche. Cela inclut les données brutes ou traitées. Cela comprend, sans s’y limiter :

En bref, tout ce qui contribue à la compréhension et à la reproductibilité d’une recherche devrait être rendu FAIR.

🌘 Findable (Découvrable)

Le premier principe, “Découvrable”, est fondamental. Si une donnée ne peut pas être trouvée, elle ne peut pas être réutilisée. Pour qu’une donnée soit découvrable, elle doit posséder :

🌘 Accessible

Une fois les données trouvées, elles doivent être accessibles. Cela ne signifie pas nécessairement qu’elles doivent être ouvertes à tous. Elles doivent être accessibles sous des conditions clairement définies.

L’accessibilité des données repose sur :

🌘 Interoperable (Interopérable)

L’interopérabilité est la capacité des données et des systèmes à échanger et à interpréter des informations. C’est un pilier essentiel pour la combinaison de jeux de données provenant de sources différentes.

L’interopérabilité repose sur :

Exemple de données non interopérables

Hiérarchie taxonomique
Illustration d’une hiérarchie taxonomique, un exemple de vocabulaire contrôlé.

🌘 Reusable (Réutilisable)

Le principe de réutilisabilité est l’aboutissement des trois premiers. Des données trouvables, accessibles et interopérables sont des données qui peuvent être réutilisées efficacement.

Pour que les données soient réutilisables, elles doivent avoir :

🌘 Pourquoi appliquer les principes FAIR ?

L’application des principes FAIR n’est pas une simple formalité. C’est une démarche qui offre de nombreux avantages pour la recherche et la société dans son ensemble.

Cycle de vie des données
Le cycle de vie des données. Il illustre les différentes étapes où les principes FAIR peuvent être appliqués.

Ils facilitent :
- La gestion de projet de recherche.
- La gestion des consentements et la gouvernance des données.
- L’élaboration de plans de gestion de données (PGD - Plan de Gestion de Données) robustes.
- La mise à jour automatisée des résultats. Cela est possible grâce à des données structurées et interopérables.

🌘 Références

Shooting Stars IconConsultation ExpressShooting Stars Icon

Bénéficie d'une heure de consultation dédiée avec François pour résoudre tes défis informatiques et stratégiques. Que ce soit pour la migration vers des technologies libres, la sécurisation de tes systèmes, la documentation de tes procédures, la conception de petits systèmes ou l'automatisation de tâches, cette session intensive t'offre des solutions concrètes et un plan d'action clair.

Tu seras libre ensuite de poursuivre avec un forfait de consultation sur mesure ou les programmes DéconstruIT ou Pleine Confiance

Découvre la Consultation Express.
Abonne-toi au fil RSS pour ne rien manquer.

Étiquettes