Vous trouverez dans ce guide des conseils pour gérer, décrire, stocker et partager vos données de recherche, mais également pour repérer et évaluer des données existantes pouvant servir à vos travaux.
Pour toute question :
Un plan de gestion des données (PGD ou DMP en anglais) ne devrait pas avoir simplement une finalité administrative. Il sert :
Certains organismes pourraient demander qu'un PGD soit joint aux demandes de subvention (ou déposé advenant le projet accepté).
Pour vous accompagner dans la rédaction de vos PGD, le réseau Portage propose l'application web « Assistant PGD ».
Nous vous recommandons d'utiliser le modèle générique « Portage » de cet outil, en choisissant les directives de l'UQTR, afin de ne rien oublier lors de la rédaction de vos documents.
« En général, les plans de gestion des données décrivent ce qui suit :
comment les données seront recueillies, documentées, formatées, protégées, et conservées;
Les plans de gestion des données indiquent aussi qui est chargé de gérer les données du projet, décrivent les plans de relève qui ont été mis en place dans l'éventualité où la personne quitte l'équipe de recherche et décrivent les rôles et les responsabilités liés aux données des autres membres de l'équipe, le cas échéant. Enfin, les plans de gestion des données décrivent les contraintes éthiques, juridiques et commerciales auxquelles les données sont assujetties, et quel dépôt reconnu a été sélectionné pour y verser les données. »
Tiré de Gouvernement du Canada. (2018). Ébauche - Politique des trois organismes sur la gestion des données de recherche. Repéré à http://www.science.gc.ca/eic/site/063.nsf/fra/h_97610.html
Vous trouverez ici des modèles de PGD rédigés en français.
Avertissement : Ces modèles, rédigés par l'équipe de Portage, peuvent paraître complexes: on y a répondu à toutes les questions de façon détaillée, ce que vous n'aurez probablement pas à faire. De plus, des commentaires sont intégrés au texte. N'hésitez pas à réutiliser/adapter les parties du texte qui sont pertinentes pour votre projet, les modèles ont été produits dans ce but.
Tout au long du projet, il est conseillé de suivre la règle du 3-2-1:
Il convient de définir une fréquence de sauvegarde pour chaque copie selon le rythme d’évolution du projet (ex. une sauvegarde à chaque modification sur le poste informatique, à chaque jour sur le serveur de l’UQTR, à chaque semaine sur un disque dur externe).
N’oubliez pas d’inclure dans chaque sauvegarde l’ensemble de la documentation pertinente, incluant les métadonnées.
Pensez à conserver les données originales brutes dans un fichier sécurisé en lecture seule. Vous aurez ainsi toujours la possibilité de revoir les données initiales du projet.
Privilégiez l’utilisation du serveur sécurisé de l’UQTR à votre disque dur personnel.
Il est également nécessaire de stocker les données sensibles sur des serveurs sécurisés, plutôt que sur des plateformes infonuagiques commerciales telles Dropbox et Google Drive. La localisation de leurs serveurs et leurs politiques d’utilisation changeantes constituent des freins à leur utilisation en contexte académique et pour des fins de préservation. Consultez le Service des technologies de l'information (STI) de l'UQTR pour toute demande relative à ce sujet.
La gestion des données confidentielles demande souvent leur cryptage. L’organisme UKDataService propose différents outils permettant d’effectuer cette procédure : https://www.ukdataservice.ac.uk/manage-data/store/encryption
L’utilisation de formats de fichier ouverts est recommandée pour faciliter l’accès aux données à long terme.
Les formats propriétaires, associés à un logiciel, peuvent rapidement devenir désuets ou causer des problèmes d’incompatibilité.
Les formats propriétaires largement utilisés dans certaines disciplines sont acceptables.
L’organisme UKDataService tient à jour une liste de formats recommandés ou acceptables selon le type de donnée : https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats
Quelques bonnes pratiques permettront de facilement identifier le contenu des dossiers et des fichiers.
Il existe plus d’une façon de nommer ses fichiers. L’important est de choisir des règles et de les appliquer uniformément.
Voici quelques exemples de titres respectant les bonnes pratiques :
100-questionnaires
prevalence-depression-questionnaire-20170418
consentement-formulaire-v02
focusgroupe1-reponses
bourse-crsng-soumission
DataONE. (s.d.). Backup your data. Repéré à https://dataoneorg.github.io/Education/bestpractices/backup-your-data
UKDataService. (2018). Data Security. Repéré à https://www.ukdataservice.ac.uk/manage-data/store/security
DataONE. (s.d.). Document and Store Data Using Stable File Formats. Repéré à https://dataoneorg.github.io/Education/bestpractices/document-and-store
UKDataService. (2018). Recommended Formats. Repéré à https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats
UO Libraries. (s.d). Data Management Best Practices. Repéré à https://library.uoregon.edu/research-data-management/best-practices#two
Service des bibliothèques de l’UQAM. (s.d.). Recommandations pour le nommage de vos fichiers électroniques. Repéré à http://guides.bibliotheques.uqam.ca/docs/gestion_donnees_recherche/recommandations_nommage_fichiers.pdf
UBC Library. (2018). Research Data Management : Organize. Repéré à https://researchdata.library.ubc.ca/plan/organize-your-data/
UKDataService. (2018). Format your Data. Repéré à https://www.ukdataservice.ac.uk/manage-data/format
Pour être repérés et utilisés dans vos travaux futurs, par vos collaborateurs ou par d’autres chercheurs, vos jeux de données doivent être décrits de façon appropriée.
La façon dont cette description sera faite devra être précisée dans votre plan de gestion des données.
« toutes les données de recherche devraient être accompagnées de métadonnées qui sont compatibles avec les pratiques exemplaires internationales et disciplinaires, afin de permettre leur accès, leur lisibilité et leur réutilisation par de futurs utilisateurs. » (Gouvernement du Canada, 2016)
Pour une présentation claire et rapide du fonctionnement et de l'importance des schémas des métadonnées,
consultez cette vidéo conçue par l'organisme DoRANum.
Les métadonnées sont les données sur vos données.
Elles consistent en l’ensemble des renseignements nécessaires pour comprendre le contexte de création des données.
De manière générale, elles répondent aux questions QQOQCCP (Qui ?, Quoi ?, Où ?, Quand ?, Comment ?, Combien ?, Pourquoi ?).
Ces renseignements sont moissonnés par les moteurs de recherche et facilitent donc le repérage et la réutilisation des jeux de données par d’autres utilisateurs.
Les informations minimales à consigner sont :
Les dépôts de données utilisent des schémas de métadonnées standardisés facilitant le repérage et la classification des données.
Il existe des normes générales (ex. Dublin Core), qui peuvent s’appliquer à la plupart des données, et des normes spécialisées (ex. DDI, LOM, VRA, TEI, Darwin Core), visant la description d’un type précis de données. Ce sera lors du dépôt de vos données que vous aurez à fournir ces informations via un formulaire.
Plus vous fournirez d’informations, plus vos données seront repérables et réutilisables par la communauté scientifique. Le Guide des pratiques exemplaires sur les métadonnées de Dataverse Nord V2.0 exlique les champs à remplir dans cette plateforme de dépôt.
Le format XML est à privilégier lors du partage des métadonnées. Il assure une interopérabilité avec les divers autres systèmes qui pourront en extraire le contenu. Pour générer un schéma de métadonnées général, utilisez l'outil DataCite Metadata Generator.
Le dictionnaire de données comprend les éléments essentiels à l’utilisation des données.
On y retrouve une description des variables, la signification des abréviations employées dans les fichiers de données, les unités de mesure utilisées, la valeur attribuée aux données manquantes, etc.
L’organisme DataONE décrit les bonnes pratiques associées à la création d’un tel dictionnaire à l’adresse suivante : https://www.dataone.org/best-practices/create-data-dictionary.
À mesure que des jeux de données sont produits, on conseille de créer un fichier indiquant les producteurs du fichier, la méthode ou le logiciel (et sa version) utilisé, le format de compression, l'encodage des caractères, les restrictions appliquées, etc. C’est la mémoire de votre projet.
L’université Cornell a produit un guide pour la rédaction d'un fichier « Lisez-moi » complet : https://data.research.cornell.edu/content/readme.
DataONE. (s.d.). Metadata. Repéré à https://www.dataone.org/best-practices/metadata
ICPSR. (2012). Guide to Social Science Data Preparation and Archiving - Phase 3: Data Collection and File Creation. Repéré à https://www.icpsr.umich.edu/web/pages/deposit/guide/index.html
Library of Congress (s.d.). Recommended Formats Statement - Datasets/Databases. Repéré à http://www.loc.gov/preservation/resources/rfs/data.html
UCI Libraries. (2018). Research Data Management: Describing Data. Repéré à https://guides.lib.uci.edu/datamanagement
UKDataService. (2018). Document your data. Repéré à https://www.ukdataservice.ac.uk/manage-data/document