Mini-symposium sur les principes TRUST : l’avenir des dépôts de données numériques

blog arrowPosté le: Juil 29, 2020

par Robyn Nicholson, Données de recherche Canada

Table des matières

  1. Contexte
  2. Exposés
  3. Réflexion sur la discussion
  4. Et ensuite?

Contexte

Au terme d’une année de collaboration orchestrée par la Research Data Alliance (RDA), la collectivité dévoilait ses principes TRUST, un jeu de principes directeurs qui doit mettre en relief la fiabilité des dépôts de données numériques en misant sur la transparence, la responsabilisation, l’orientation vers l’utilisateur, la pérennité et la technologie (équivalent des termes anglais Transparency, Responsibility, User focus, Sustainability et Technology à l’origine de l’acronyme). Rendus publics le 14 mai 2020 dans Nature Research’s Scientific Data, ces principes forment un cadre ayant pour but d’alimenter le débat sur les pratiques exemplaires de préservation des données et leur adoption. Comme on peut le lire dans l’article précité, la fiabilité des dépôts de données sera jugée d’après le maintien des capacités essentielles sans lesquelles les communautés concernées ne pourraient accéder aux données ni les réutiliser au fil des ans. Les principes TRUST montrent clairement aux responsables comment doter leurs dépôts de telles qualités, comment maintenir ces dernières et comment en effectuer la démonstration.

Depuis leur publication, plus de 25 organisations, dont Données de recherche Canada, ont entériné les principes TRUST. Selon Mark Leggott, directeur exécutif de DRC, « dès le début de son mandat, DRC a collaboré avec la profession canadienne des gestionnaires de données pour mettre en place un écosystème de dépôts plus durable. La formulation des principes TRUST constitue une étape majeure dans cette direction. » C’est pourquoi DRC a été enchanté de travailler avec Ingrid Dillo et Dawei Lin, auteurs des principes, ainsi qu’avec Karen Payne, directrice associée de l’International Technology Office (ITO) de World Data System (WDS), à la planification d’une activité virtuelle qui permettra à un auditoire international de prendre connaissance des nouveaux principes.

L’activité a pris la forme d’un mini-symposium sur les principes TRUST, qui s’est déroulé le 7 juillet 2020, avec le concours de DRC, de la RDA, de WDS et des auteurs des principes. On en trouvera l’enregistrement vidéo et les diaporamas (1re partie | 2e partie) sur le site Web de DRC. L’activité a reçu un bon accueil, avec au-delà de 140 participants d’une vingtaine de pays. On trouvera ci-dessous un aperçu des présentations, une réflexion sur le débat qui a suivi les questions posées pendant le symposium (en lire la transcription intégrale ici) et un coup d’œil à ce qui attend les principes TRUST.

Exposés

Les principes TRUST, de quoi s’agit-il?

Dawei Lin, Division des allergies, de l’immunologie et des transplantations au NIAID des NIH

Les principes TRUST marquent l’aboutissement d’une collaboration qui a réuni 19 coauteurs de quatre continents et huit pays, divers intervenants, mais aussi maints champs de recherche et des centaines d’années d’expérience avec les dépôts de données numériques. En plus d’examiner les cinq principes à la base de l’acronyme TRUST, M. Lin a expliqué ce qui avait motivé la genèse des principes, de même que leur utilité et leurs conséquences actuelles et futures. Le diagramme ci-dessous illustre comment les dépôts de données numériques peuvent se servir de ces principes pour que les données adhèrent davantage aux principes FAIR. Grâce aux principes TRUST, on saisira plus facilement la mesure dans laquelle les données respectent ou pas les principes FAIR, au lieu de se borner à leur format binaire.

Fig. 1. Liens entre les principes TRUST et les principes FAIR (Dawei Lin, 2020)

Un mot de prudence : nécessité de pratiques exemplaires pour la préservation des données numériques

Karen Payne, World Data System

Grâce à des exemples frappants et actuels, Mme Payne a montré les dérives qui peuvent survenir quand la consultation de dépôts n’adhérant pas aux principes TRUST entraîne la mésinformation du public et la prise des mauvaises décisions. Selon Mme Payne, les gestionnaires de données ont pour responsabilité de veiller à ce que la population continue d’avoir confiance dans la science et les principes TRUST constituent un bon point de départ pour cela.

TRUST et FAIR, des principes complémentaires

Ingrid Dillo, DANS

Mme Dillo a fait le pont entre les principes TRUST et les principes directeurs FAIR en expliquant comment les deux cadres s’entrecoupent et se renforcent mutuellement de manière à favoriser la genèse de données FAIR et leur préservation dans les dépôts qui épousent les principes TRUST.

TRUST, FAIR, CARE, CoreTrustSeal

Wim Hugo, World Data System

Sur un plan plus pratique, M. Hugo a examiné les liens des principes TRUST avec les principes FAIR et CARE ainsi que dans le contexte de la certification CoreTrustSeal. Il a de surcroît exploré la nature de la confiance qu’on accorde au milieu de la recherche et sa nécessité, la façon dont se développe pareille confiance, sous divers angles, et la manière dont les principes comme les principes TRUST peuvent se transformer d’une simple aspiration à la réalité grâce au développement d’une architecture.

Fig. 2. Appel à l’action – Les principes TRUST : de l’aspiration à l’application (Wim Hugo, 2020)

Vers la mise en œuvre : croisement des principes TRUST avec les normes ISO 16363/ISO 16919

David Giaretta, Primary Trustworthy Digital Repository Authorisation Body (PTAB)

M. Giaretta s’est penché sur l’importance de la confiance et de la vérification dans le contexte du régime d’audits de l’Organisation internationale de normalisation (ISO). Outre une analyse approfondie des normes de l’ISO et du OAIS, et de ce qui les relie, M. Giaretta a décrit le processus de vérification, d’accréditation, de certification et de quantification de l’ISO, en expliquant comment les principes TRUST constituent un bon point de départ afin que les dépôts de données numériques instillent la confiance et qu’on puisse contrôler cette dernière.

La Protein Data Bank : illustration d’un dépôt collectif de données archivées

John Westbrook, Research Collaboratory for Structural Bioinformatics Protein Data Bank (RCSB PDB)

Cette présentation a offert un tour d’horizon complet de la PDB, archive communautaire de données illustrant le fonctionnement des principes TRUST. Créée en 1971, la PDB rassemble les données mondiales sur la structure théorique des protéines et de l’ADN/ARN. La banque de données a grossi pour inclure les collaborations mondiales qui s’articulent sur les principes FAIR. M. Westbrook a mis en relief différents aspects de la PDB en fonction des cinq principes pour conclure que si l’orientation vers l’utilisateur (User focus) reste un défi, ce principe ouvre aussi la porte à de futures possibilités.

Le financement de la GDR par CANARIE : cas d’un bailleur de fonds

Mark Leggott, Données de recherche Canada

Après le cas d’un dépôt présenté par M. Westbrook, M. Leggott a passé à celui d’un bailleur de fonds en exposant le programme de financement en gestion des données de recherche (GDR) de CANARIE. M. Leggott a expliqué le mécanisme de financement, qui s’appuie sur les principes FAIR, les normes et les pratiques exemplaires, avant de parler de quelques projets subventionnés dans le cadre du programme. Il a rappelé qu’on a la chance de poursuivre le travail avec les bailleurs de fonds pour faire en sorte que le soutien des principes TRUST et des dépôts de données nationaux s’intègrent aux efforts actuels. Enfin, il a souligné combien il importe que les bailleurs de fonds adaptent leurs programmes pour que les principaux dépôts de données et les infrastructures scientifiques qui s’y rattachent disposent de canaux de financement durables.

Tribune

L’activité s’est terminée par une tribune qu’animait Mustapha Mokrane, conseiller en politiques et gestionnaire de projet au DANS, et composée de membres représentant divers intervenants.

  • Robert Downs, archiviste principal en données numériques et chef intérimaire de la cyberinfrastructure ainsi que de la recherche-développement en informatique au Center for International Earth Science Information Network (CIESIN), a présenté le point de vue des auteurs des principes TRUST.
  • Mark Leggott, de DRC, a relayé celui des bailleurs de fonds.
  • Shelley Stall, directrice principale du leadership en données à l’American Geophysical Union (AGU), a offert le point de vue du milieu de la recherche.
  • John Westbrook, du RCSB PDB, a exposé celui des gestionnaires de dépôts.
  • Varsha Khodiyar, gestionnaire en conservation des données chez Springer Nature, a soumis celui des éditeurs.

Les membres de la tribune ont parlé des difficultés que soulève la mise en œuvre des principes TRUST dans leur milieu. Ils devaient aussi signaler les indicateurs de succès et l’impact des principes à court et à plus long terme avant d’explorer ce que l’on pourrait faire collectivement afin que les principes aboutissent. L’intéressante discussion qui a suivi s’est avérée fort instructive et s’est conclue lorsque de nombreux panélistes ont mentionné comment l’éducation, notamment des activités comme le mini-symposium, pourrait être la clé du succès dans l’application des principes TRUST.

Réflexion sur la discussion

Les participants ont été encouragés à poser leurs questions tout au long de l’activité, y compris durant la tribune qui a suivi les exposés. Les interactions entre présentateurs et panélistes ont fait ressortir quelques questions, difficultés et possibilités majeures associées à la future progression des principes TRUST. Voici un résumé des sujets qui sont revenus le plus souvent.

Les principes TRUST et FAIR

Dans la foulée de la présentation d’Ingrid Dillo, les participants ont discuté de la manière dont les principes TRUST et FAIR s’entrecoupent et se complètent. En voyant dans l’adhésion aux principes FAIR un continuum de variations, les dépôts se heurtent souvent au problème qui consiste à rehausser un respect durable des principes FAIR dans les données neuves. Les dépôts qui épousent les principes TRUST éprouvent plus de mal à garantir l’application des principes FAIR, et le prix à payer est plus lourd. On s’est également demandé si les principes FAIR et TRUST pourraient s’appliquer à la préservation et à l’intendance d’autres ressources que les données et les métadonnées, ce à quoi les présentateurs ont répondu qu’effectivement, les deux jeux de principes pourraient être envisagés comme des considérations générales et servir de guide à une multitude de ressources.

Une préoccupation similaire était que les institutions pourraient voir sous un autre œil l’adhésion aux principes TRUST et FAIR selon la région, le groupe, son importance et la discipline dans laquelle il se spécialise. Mustapha Mokrane a reconnu qu’on devra prendre en compte la variété et l’évolution des pratiques et des compétences quand on appliquera les principes TRUST (comme cela a été le cas pour la certification des dépôts de données de recherche avec CoreTrustSeal).

« Science douteuse »

Dans sa présentation, Karen Payne évoquait les dangers des dépôts « non fiables », c’est-à-dire qui ne souscrivent pas aux principes TRUST, ce qui a alimenté la discussion sur les conséquences et les implications de la « science douteuse » et des questions d’imputabilité et d’éthique qui en découlent. Bien que les principes TRUST portent surtout sur la gestion des dépôts de données, on estime que leur portée devrait s’élargie à la conformité à la déontologie qui régit les disciplines et les institutions. On croit aussi qu’il faudrait accentuer la responsabilisation, car souvent, certains ont-ils fait remarquer, la « science douteuse » finit par affecter chacun, sauf celui qui en est la source.

Les principes TRUST et l’ISO

En explorant en profondeur les méthodes d’audit de l’ISO en regard des principes TRUST, David Giaretta a mis en relief la nécessité d’approches complémentaires à la constitution d’un écosystème de dépôts de données fiables, que ce soit grâce à la certification par CoreTrustSeal, par l’ISO ou par d’autres moyens. Les organisations ne pourront pas toutes obtenir une attestation de l’ISO, aussi faut-il d’autres régimes d’encadrement tel CoreTrustSeal pour instaurer un autre degré d’accessibilité et de fiabilité qu’un plus grand nombre de dépôts pourront espérer atteindre. Les principes TRUST favoriseront cette diversité d’approches en proposant aux intervenants – bailleurs de fonds et décideurs compris – d’autres options pour appuyer l’évolution des dépôts de données qui suscitent la confiance.

Et ensuite?

Le débat qu’a lancé le mini-symposium sur les principes TRUST n’est qu’un début. Le défi qui nous attend consiste à faire en sorte que ces principes trouvent application dans de vraies pratiques, puis qu’on favorise l’adhésion aux principes TRUST à un niveau élevé, en les enrichissant des principes FAIR. Une autre étape majeure consistera à convaincre les bailleurs de fonds d’endosser ces principes et d’en appuyer la mise en œuvre ainsi que le maintien. L’établissement d’étalons de qualité et l’implantation d’une politique d’encadrement pour les attestations auront également leur utilité, à l’instar des investissements dans le personnel hautement qualifié (PHQ) représenté par des conservateurs bien au fait des dépôts fiables.

De concert avec le réseau Portage, DRC envisage la tenue d’une activité complémentaire sur l’usage des principes TRUST au Canada. Lors d’un atelier de 2,5 heures destiné au milieu canadien des dépôts de données, la présentation d’applications au Canada et à l’étranger permettra d’approfondir davantage les principes et leur impact. D’autres précisions suivront. Cependant, pour l’instant, on a retenu la date du 16 novembre 2020. Il nous ferait également plaisir de discuter avec nos collègues de l’étranger d’une approche à l’organisation d’une série de webinaires sur les principes TRUST sous différents angles, y compris celui des nations et des domaines. Si vous avez des questions, n’hésitez pas à prendre contact avec Mark Leggott (mark.leggott@rdc-drc.ca) ou Robyn Nicholson (robyn.nicholson@rdc-drc.ca), stagiaire à DRC.


abc