Commentaires sur l’ébauche de la politique des trois organismes subventionnaires concernant la gestion des données

blog arrowPosté le: Août 24, 2018

Présenté par le Comité des politiques de Données de recherche Canada
au nom de son Comité directeur et des membres de la profession

Données de recherche Canada (DRC) est heureux de relayer aux trois organismes subventionnaires les remarques formulées par ses intervenants au sujet de la future politique sur la gestion des données. Les commentaires ont été glanés lors des discussions tenues par le Comité des politiques de DRC et incorporent ceux recueillis à l’occasion de la rencontre des vice-présidents de la recherche des universités, le 13 avril, à Toronto (organisée à l’instigation de DRC), ainsi que des réunions du Comité des politiques et du Comité directeur de DRC, ou transmis directement par les membres de la profession.

Généralités

Tout au long des conversations sur le projet de politique, on s’est généralement entendu pour dire que l’orientation empruntée par la future politique était la bonne et que pareille politique concourrait de manière très positive à rendre la science plus ouverte et à faire en sorte que les données scientifiques respectent les principes FAIR (pour Findable, Accessible, Interoperable, Reusable, ou faciles à découvrir, accessibles, interopérables et réutilisables). Parallèlement, on a admis que l’adoption d’une politique de ce genre par les organismes subventionnaires est indispensable si l’on veut que les attitudes changent en recherche, ainsi que l’illustrent les politiques similaires introduites dans d’autres pays.

Le commentaire qui revenait le plus souvent est que le gouvernement fédéral, et plus particulièrement les trois organismes subventionnaires, doit être plus clair quant aux ressources financières ou autres dont on disposera pour répondre à la politique. Même si certains semblent penser que les institutions n’auront pas besoin de ressources additionnelles pour cela, les membres de DRC s’attendent à ce que la tâche s’avère très laborieuse pour bon nombre d’entre elles, surtout celles qui n’ont pas encore mis en place de programme pour gérer les données. Il vaudrait mieux admettre qu’un travail de ce genre coûtera du temps au chercheur et des ressources à l’institution (sous forme de personnel hautement qualifié et de systèmes) plutôt que de ne rien dire dans la politique, quand on la dévoilera. Par exemple, il serait bon de mettre en relief les lignes directrices existantes ou envisagées et les fonds qu’on mettra à la disposition des chercheurs en vue d’obtenir plus facilement leur participation. Idéalement, on détaillera les subventions disponibles pour diverses activités, comme la gestion des données ou la préparation de ces dernières en vue de leur dépôt. Les trois organismes subventionnaires doivent absolument comprendre qu’ils ne financent qu’une fraction des recherches poursuivies par les institutions scientifiques du Canada et que la plupart de ceux qui soutiennent financièrement l’écosystème canadien ont mis en place ou songent à introduire des politiques d’une nature analogue. Une réponse vraiment complète et utile des chercheurs et de leurs institutions exigera une réponse aussi complète et utile de la part des organismes de financement : la future politique donne aux trois organismes subventionnaires l’occasion rêvée de jouer un rôle directeur sur ce plan.

Un autre commentaire, revenant souvent, concernait l’usage d’une formulation qui incite à l’inaction, plutôt qu’à une réaction substantielle et concrète. On devrait, par exemple, employer des mots plus forts qu’« encourager », comme c’est le cas à divers endroits (la partie sur les plans de gestion des données notamment). L’usage du verbe « falloir » ou « devoir » serait préférable. Une autre solution consisterait à souligner que le but visé est d’harmoniser la politique de financement des trois organismes subventionnaires avec celle d’autres organismes de financement publics et privés, et que la version préliminaire de la politique ne cherche qu’à alimenter le dialogue et à faire avancer le dossier sans qu’on passe directement à un mandat explicite. L’utilisation du terme « essentielle » dans le préambule :

La capacité de stocker, de consulter, de réutiliser et de mettre à profit les données numériques de la recherche est devenue essentielle à l’avancement de la science et des travaux d’érudition ainsi qu’au développement de solutions novatrices pour relever des défis économiques et sociaux. Elle offre d’énormes possibilités d’améliorer la productivité, la compétitivité et la qualité de la vie au Canada.

ne cadre pas avec l’introduction d’une politique qui « encouragerait » le Canada à rejoindre des chefs de file internationaux en la matière.

Pour mieux le faire ressortir, DRC propose que le préambule (et la documentation connexe) expose plus directement les avantages que présente le partage des données en l’illustrant par des exemples précis, tirés du milieu des revues scientifiques et de la collectivité internationale. On fera aussi référence à l’ébauche de politique sur le gouvernement ouvert que le Canada a récemment rendue publique (principalement la partie traitant de la science ouverte) pour illustrer la réponse du Canada. DRC préconise que la version finale de la politique comprenne une liste d’exemples pour chacune de ses trois parties principales, de préférence avec la FÀQ qui accompagnera le document, et que cette liste soit reliée à la politique. Il conviendrait également que la politique et la documentation qui l’étaye mentionnent les principes FAIR. Les chercheurs seraient plus réceptifs à une argumentation solide et savante défendant la politique dans son préambule ou dans la documentation d’appoint.

Tout en sachant qu’on ne peut, pour l’instant, fixer de date précise pour la mise en œuvre, nous recommandons aux organismes subventionnaires d’envisager au moins un plan d’exécution explicite de plusieurs années pour chacun des trois volets de la politique quand ils en dévoileront la version définitive. De cette façon, les institutions établiront beaucoup plus facilement leur propre calendrier, surtout face aux efforts importants que suscitera l’harmonisation de la nouvelle politique avec leurs politiques internes de recherche. Au lancement officiel de la politique, on pourra éventuellement suggérer que les organismes subventionnaires coopéreront avec les intervenants afin de mettre en place un cadre qui facilitera la collecte de commentaires et l’évaluation des impacts.

Dire que la politique « ne s’applique pas aux boursiers ou aux titulaires de chaire » dans le préambule est incongru avec l’intention générale. Sans perdre de vue les difficultés que l’application de la politique à tous les chercheurs recevant des fonds publics peut soulever à l’interne, DRC recommande qu’on en modifie au moins l’énoncé afin qu’il puisse s’applique éventuellement à l’ensemble des chercheurs bénéficiant de l’aide des trois organismes subventionnaires, même si l’application s’effectue petit à petit, à mesure que les institutions et les départements élaborent leur réponse et la documentation à l’appui. On y parviendrait en insérant simplement « pour l’instant » avant « aux boursiers », ou en expliquant mieux le but à long terme poursuivi.

DRC suggère qu’on explique que l’expression « science ouverte » employée dans le préambule désigne généralement la recherche, toutes disciplines confondues, y compris celle en sciences sociales et en lettres.

Stratégie institutionnelle

Cette partie de la politique a été examinée sous un angle favorable en tant que préalable utile à la prestation des services qui soutiendront les deuxième et troisième piliers de la politique. Les membres de DRC estiment que la nature linéaire de la politique et ses trois piliers amèneront les institutions à se préparer et à acquérir les moyens pour réagir efficacement à la politique. Les remarques complémentaires concernant l’utilisation d’un calendrier d’exécution progressif plus explicite le soulignent bien.

Dans cette partie, on mentionne que « les données [sont] des résultats de recherche importants », ce sur quoi on revient à la section 3.3. Il vaudrait la peine de souligner que cette importance des données se concrétise dans un intrant, c’est-à-dire un produit provisoire du travail effectué, mais aussi un produit de l’entreprise qu’est la recherche, donc qu’il y a des avantages à gérer et à partager les données. On y parviendrait en parlant des données comme d’un actif dans la politique. Une bonne façon de formuler ce concept serait de dire qu’une saine intendance des données en assurera le maintien pour, pendant et après la recherche.

Étant donné l’utilité de tels produits pour le Canada dans son ensemble, nous recommandons que les trois organismes subventionnaires collaborent avec les intervenants pour instaurer un processus d’examen qui confèrera une cohérence nationale aux approches mentionnées dans les divers documents se rapportant à la stratégie institutionnelle.

Plan de gestion des données (PGD)

Un commentaire majeur des membres de DRC a trait au manque de conformité aux recommandations formulées dans cette partie. En voici des exemples :

  • Comment recueillera-t-on et suivra-t-on les PGD quand on en réclame un en vue de la prise d’une décision?
  • Qui conservera la copie du PGD après qu’il a été soumis?
  • Comment surveillera-t-on le PGD au long du processus de prise de décision?

Comme c’est le cas pour d’autres composantes importantes, on devrait étoffer cette partie ou, du moins, signaler que des précisions seront fournies avant l’officialisation de la politique. Les chercheurs réagiront mieux à la politique s’ils ont une idée du minimum qu’on attend d’eux (voir la remarque qui suit concernant l’énoncé sur la disponibilité des données). Cela illustrerait aussi comment on mettrait graduellement en œuvre les principaux éléments de la politique.

Cette partie est sans doute celle qui fera l’objet du plus grand nombre de commentaires de la part des chercheurs, qui considèrent le PGD comme une tâche complexe réclamant du temps. Le chercheur pourrait juger le PGD comme un travail inutile et laborieux, malgré l’avantage évident d’un tel plan pour n’importe quel programme de recherche. Une façon d’y remédier serait d’insister sur le fait que l’élaboration du PGD correspond à une sorte de dialogue, souple et dynamique, survenant habituellement au niveau de l’institution pour veiller à ce que les chercheurs disposent des ressources dont ils ont besoin. Les efforts récemment déployés pour élaborer un PGD dynamique qui reflètera l’approche du cycle de vie complet, soit de la collecte initiale des informations les plus cruciales au développement d’un plan plus détaillé, pourraient atténuer l’impression que dresser un PGD détaillé est un fardeau.

Le texte qui suit cette partie devrait être remanié pour indiquer que préparer un PGD à la demande d’un organisme fera partie du processus de prise de décision. Pour qu’il accepte d’investir les efforts requis dans l’élaboration d’un PGD, le chercheur doit savoir qu’un tel plan servira à évaluer sa demande. Parallèlement, on reconnaîtra les efforts déployés par l’institution pour aider le chercheur à rédiger son PDG lorsqu’il soumet une demande.

Pour certaines occasions de financement, les organismes subventionnaires peuvent demander que les plans de gestion des données soient soumis à l’organisme approprié au moment de la demande; dans ces cas, les plans de gestion des données peuvent être examinés dans le processus de prise de décision.

Cette partie fait écho au commentaire précédent, selon lequel l’usage abusif de termes comme « peuvent » s’avère rarement utile dans un document de cette nature.

DRC préconise qu’on modifie cette partie pour que, dans l’approche vers un PGD complet, les chercheurs soient au moins tenus de rédiger une déclaration sur la disponibilité des données. De cette façon, on reflèterait l’approche envisagée pour les données ouvertes et le dépôt des données dans la section correspondante de la politique. La déclaration sur la disponibilité des données est un élément crucial ou le précurseur du future PGD. Elle peut aussi conduire naturellement au pilier « Dépôt des données » et alimenter le dialogue sur le partage des données en laissant le chercheur prendre une décision éclairée sur le partage ou pas de ses résultats. La « déclaration sur la disponibilité des données » est une exigence à laquelle il est facile de répondre et de plus en plus d’éditeurs la réclame avant même d’examiner un manuscrit.

Dépôt des données

Un aspect très positif de cette partie est que l’on est

[tenu] de déposer, dans une dépôt numérique reconnu, les données de recherche numérique, les métadonnées et les codes qui appuient directement les conclusions de la recherche dans les publications de revues, des préimpressions et d’autres résultats de recherche qui découlent de la recherche appuyée par les organismes subventionnaires.

Il faudrait étoffer cette partie en précisant que les « données de recherche numérique, les métadonnées et les codes » déposés dans un dépôt numérique devraient refléter tout le matériel approprié qu’on a rassemblé (à savoir, les algorithmes, les spécifications, les guides méthodologiques, les dictionnaires de données, etc.), et pas seulement les tableaux ou les données résumées à partir des conclusions de la recherche. Il serait bon de définir clairement en quoi consistent les données, dans cette partie ou dans la documentation d’appoint. Le plus souvent, les chercheurs s’intéressent davantage aux jeux de données et au matériel plus détaillé.

Les dépôts de données forment un milieu dynamique en pleine évolution. Il vaudrait donc la peine de mieux préciser ce qu’on entend par un dépôt de données « reconnu » et qu’on en dise davantage sur la manière dont le chercheur devrait répondre à cette partie de la politique, le plus vraisemblablement avec la documentation d’appoint. Les ressources comme Recommended Data Repositories ou FAIRsharing.org illustrent bien ce que peut être un guide expliquant où déposer ses données.

Cette partie de la politique étant une exigence, on devrait aussi signaler qu’on veillera à ce qu’elle soit respectée d’une manière quelconque. La politique ne décrira pas nécessairement comment on procèdera, mais elle signalera qu’on mettra en place un mécanisme convenable, en consultation avec le milieu de la recherche.

Les commentaires antérieurs sur le coût d’une réponse à l’ébauche de la politique sont particulièrement pertinents ici. En effet, toute activité qui verra une dilapidation partielle des fonds destinés à la recherche sera perçue négativement. Préciser qu’une aide nouvelle sera dispensée concourra donc à promouvoir l’objectif du dépôt des données.

Par ailleurs, il conviendrait d’étoffer cette partie en mentionnant que les éditeurs et les groupes de praticiens favorisent (voire exigent dans certains cas) de plus en plus le dépôt des données avant publication, et que les comités de promotion et de conservation en font autant dans les institutions. Il serait particulièrement important de souligner que la politique se veut la réflexion d’une nouvelle pratique exemplaire dans la communication des textes scientifiques.

Remarques finales

Face à un éventuel encadrement des organismes et des services de soutien au Canada, on préconise vivement que les trois organismes subventionnaires trouvent un moyen pour mettre en relief les services qu’on recommandera aux institutions et aux chercheurs lors de la mise en œuvre de la politique. D’excellents documents sur la question ne manquent pas au sein de la collectivité mondiale, car celle-ci n’a cessé de répondre à d’autres politiques et mandats d’encadrement depuis près de dix ans. DRC lancera bientôt son répertoire des meilleures pratiques de RDC-DRC pour faire ressortir ces ressources dans un cadre polyvalent qui s’intégrera aisément aux efforts déployés ailleurs. DRC est conscient qu’il est difficile de présenter le paysage canadien sous sa forme actuelle à la collectivité, en raison du dynamisme avec lequel il évolue. Nous recommandons donc aux trois organismes subventionnaires de rester en contact étroit avec DRC, Portage de l’ABRC et d’autres organismes similaires, de manière à garder un guide des ressources disponibles que l’on relierait et intégrerait aux documents officiels de la politique.

En terminant, les membres de la communauté de DRC souhaitent féliciter les trois organismes subventionnaires pour avoir élaboré l’ébauche d’une politique qui ne peut que rehausser la recherche poursuivie dans l’écosystème canadien.