Aller au contenu principal

Soutien aux chercheurs

Gestion des données de recherche

Utiliser des données

Le moteur de recherche DataCite permet de repérer la plupart des données, mais la qualité des résultats peut varier. Google offre également un moteur de recherche en version bêta permettant de repérer les données de plusieurs milliers de dépôts : Google Dataset Search.

Pour une recherche plus précise, deux autres sources peuvent être considérées : les répertoires de données et les data journals.

Les répertoires de données

Les répertoires de données consignent et conservent des milliers de données.

Certains, comme FigshareDryad ou l’ICPRS, sont multidisciplinaires.

D’autres sont ultraspécialisés. Par exemple, l’Environmental Information Data Centre vise à collecter des données sur les écosystèmes terrestres et d’eau douce.

Enfin, plusieurs chercheurs déposent simplement leurs données dans un portail national, comme Borealis, le dépôt Dataverse canadien ou le Dépôt fédéré de données de recherche (DFDR).

La plateforme re3data permet d’identifier ces répertoires selon leurs thématiques, leur couverture régionale ou le type de données recueillies.

Data journals

On compte aujourd’hui quelques dizaines de data journals, soit des revues savantes composées d’articles généralement évalués par les pairs présentant des jeux de données. Ce type d’articles est aussi de plus en plus courant dans des revues savantes traditionnelles. 

Le CIRAD présente sur son site web l'objectif et la structure d'un data paper et offre des conseils aux chercheurs souhaitant en publier. 

Parmi les Data Journals, notons :

Les jeux de données utilisés doivent être cités.

Si une licence Creative Commons a été attribuée au jeu de données, ajoutez la mention à la fin de la référence, par exemple: Sous licence CC-BY. 

Dans le logiciel EndNote, un bordereau de saisie pour les documents de type "dataset" est déjà prévu, et la mise en page de ces références est proposé dans plusieurs styles bibliographiques.

L’outil Crosscite permet de générer la référence à utiliser selon la langue et le style de référence souhaité.

Minimalement, les informations suivantes devraient se retrouver dans la citation :

  1. Auteur(s) des données
  2. Date de publication
  3. Titre du jeu de données
  4. Distributeur, soit la plateforme permettant d’accéder aux données
  5. Identifiant unique (ex. DOI)

Si aucune règle n’a été définie dans un style, référez-vous aux règles générales de citation du style en question.

S’il s’agit de données non publiées, indiquez au minimum l’auteur, le titre et la date dans le format préconisé par le style utilisé, et ajouter la mention « non publié ».

Modèles à suivre selon le style utilisé

APA 

Canadian Tourism Commission & Destination Canada. (2016). Global Tourism Watch 2008 [Jeu de données]. Scholars Portal Dataverse. https://doi.org/10.5683/sp/s0mqvp

Chicago

Czaczkes, Tomer J., Jürgen Heinze, et Joachim Ruther. 2015. Data from: Nest Etiquette - Where Ants Go When Nature Calls. Dryad Digital Repository. doi:10.5061/dryad.9fs7n.

IEEE

2016. L. Derting, H. A. Passmore, T. P. Henkel, B. Arnold, J. Middlemis Maher, et D. Ebert-May, « Data from: Assessing faculty professional development in STEM higher education: sustainability of outcomes » [En ligne]. Dryad Digital Repository, 2016. Consulté le 29 mai 2018. doi : 10.5061/dryad.186m0

MLA

Percha, Bethany, et Russ B. Altman. « A Global Network of Biomedical Relationships Derived From Text ». Zenodo, 2018, doi:10.5281/zenodo.1243969.

Vancouver

Moccia S, Momi ED, Mattos LS. Laryngeal Dataset [En ligne]. Zenodo; 2017. Disponible: https://zenodo.org/record/1003200