From 49d538f398144c29ffc974ff5f9bc72feccc04f4 Mon Sep 17 00:00:00 2001 From: LottiePrv Date: Sun, 5 Nov 2023 12:40:46 +0100 Subject: [PATCH] content IT --- ...1cran 2023-11-01 \303\240 12.09.51.png.md" | 0 allegati/Ricerca Lifecycle.drawio.png.md | 0 .../Learning Unit 1/LU1-Open Science-plan.md | 5 +- .../LU1-OpenScience-content.md | 7 +- .../LU1-OpenScience-teacher-IT.md | 206 ++++++++ .../activity_details_research_data.md | 81 +++ .../Activities/activity_details_template.md | 44 -- .../LU2-ResearchData-content-IT.md | 443 +++++++++++++++++ .../LU2-ResearchData-content-teaching-IT.md | 468 ++++++++++++++++++ .../LU2-ResearchData-content.md | 1 + resources/index.md | 2 +- 11 files changed, 1207 insertions(+), 50 deletions(-) create mode 100644 "allegati/Capture d\342\200\231\303\251cran 2023-11-01 \303\240 12.09.51.png.md" create mode 100644 allegati/Ricerca Lifecycle.drawio.png.md create mode 100644 resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-teacher-IT.md create mode 100644 resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_research_data.md delete mode 100644 resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_template.md create mode 100644 resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-IT.md create mode 100644 resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-teaching-IT.md diff --git "a/allegati/Capture d\342\200\231\303\251cran 2023-11-01 \303\240 12.09.51.png.md" "b/allegati/Capture d\342\200\231\303\251cran 2023-11-01 \303\240 12.09.51.png.md" new file mode 100644 index 00000000..e69de29b diff --git a/allegati/Ricerca Lifecycle.drawio.png.md b/allegati/Ricerca Lifecycle.drawio.png.md new file mode 100644 index 00000000..e69de29b diff --git a/resources/Research Data and Open Science course/Learning Unit 1/LU1-Open Science-plan.md b/resources/Research Data and Open Science course/Learning Unit 1/LU1-Open Science-plan.md index 19f396a6..bef38991 100644 --- a/resources/Research Data and Open Science course/Learning Unit 1/LU1-Open Science-plan.md +++ b/resources/Research Data and Open Science course/Learning Unit 1/LU1-Open Science-plan.md @@ -33,8 +33,9 @@ This unit will provide answers to the following questions: - What is open science? (main concepts, principles, key actors) - What are the key benefits and challenges of open science? - What are the implications of reforming the way research is evaluated/assessed? -- learning objectives should be devised using the verbs from the Bloom's Taxonomy -- learning objectives should be SMART +1. Riuscire a spiegare gli aspetti fondamentali dei principi accademici, economici e sociali nonché dei concetti che supportano la Scienza Aperta nonché il perché questo sia rilevante per ogni singolo individuo a livello di impatto generale +2. Sviluppare una comprensione delle numerose sfaccettature della Scienza Aperta e alcuni degli strumenti e delle pratiche interessate. +3. Conoscere lo stato dell’arte della Scienza Aperta e le diverse prospettive che la compongono. | Duration | Topic | Key points/Teaching Method/Questions | Activities | Resources | |:------------|:-------------------------|:-------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------| diff --git a/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-content.md b/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-content.md index b914da54..e22635c1 100644 --- a/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-content.md +++ b/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-content.md @@ -1,5 +1,5 @@ --- -title: What is Open Science? +title: Che cos'è la scienza aperta? author: - Lottie Provost tags: @@ -13,8 +13,9 @@ tags: TO DO: Abstract of LU 1 and list planned activities ### Learning objectives -This lesson will answer the following questions/ After this lesson you will -- List Learning Objectives +1. Riuscire a spiegare gli aspetti fondamentali dei principi accademici, economici e sociali nonché dei concetti che supportano la Scienza Aperta nonché il perché questo sia rilevante per ogni singolo individuo a livello di impatto generale +2. Sviluppare una comprensione delle numerose sfaccettature della Scienza Aperta e alcuni degli strumenti e delle pratiche interessate. +3. Conoscere lo stato dell’arte della Scienza Aperta e le diverse prospettive che la compongono. ###### Target Group - Early career researchers - SSH researchers diff --git a/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-teacher-IT.md b/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-teacher-IT.md new file mode 100644 index 00000000..8837d682 --- /dev/null +++ b/resources/Research Data and Open Science course/Learning Unit 1/LU1-OpenScience-teacher-IT.md @@ -0,0 +1,206 @@ +--- +title: LU1-OpenScience-teacher-IT +author: + - Lottie Provost +tags: + - RDM + - Open + - Science + - Lesson +--- + + TO DO: Abstract of LU 1 and list planned activities + +| 1 | Definizioni | +|:----|:------------| +| 1.1 | | +| 1.2 | | +| 2 | Contesto | +| 2.1 | | +| 3 | Problemi | +| 3.1 | | +| 3.2 | | + + +###### Learning objectives/ Conoscenze e competenze: from https://open-science-training-handbook.github.io/Open-Science-Training-Handbook_IT/02OpenScienceBasics/01OpenConceptsAndPrinciples.html +- La Scienza Aperta è il movimento che mira a rendere più accessibili i risultati della ricerca accademica, compresi il codice, i dati grezzi e gli articoli scientifici +- Comprende molti aspetti diversi, ma spesso correlati tra loro, che incidono sull'intero ciclo della ricerca, tra questi la pubblicazione aperta, i dati grezzi della ricerca aperti, il software libero, appunti di lavoro aperti, la revisione aperta tra pari, la disseminazione aperta e materiali aperti (si consulti il glossario per le definizioni). +- La storia della Scienza Aperta e le motivazioni alla base del movimento. +- Le origini dell'editoria accademica risalgono al 17 ° secolo con le prime riviste accademiche. +- Una motivazione sempre più diffusa verso la condivisione delle risorse tra le discipline di ricerca, nonché per una maggiore trasparenza, efficienza, rigore, responsabilità, sostenibilità per le generazioni future e la riproducibilità della ricerca. +- Casi etici dove una maggiore trasparenza può ridurre le frodi, la manipolazione dei dati e la segnalazione selettiva dei risultati. +- Lo stato attuale è il risultato di pressioni da parte delle comunità di ricerca accademiche e dei governi affinchè la ricerca finanziata con fondi pubblici sia condivisa in maniera più aperta, spesso allo scopo di accelerare la crescita o l'innovazione sociale o economica. +- I risultati della ricerca finanziati con fondi pubblici dovrebbero essere resi disponibili pubblicamente. +- L’urgenza di promuovere il cambiamento culturale della ricerca e tra i ricercatori. +- Adottare strumenti e tecnologie basati sul web per facilitare la collaborazione scientifica. +- In genere viene riconosciuto alla Scienza Aperta di aumentare l'impatto della ricerca, associato a una più ampia condivisione e riutilizzo (vale a dire il cosiddetto ["vantaggio citazionale derivante dall’Accesso Aperto](https://sparceurope.org/what-we-do/open-access/sparc-europe-open-access-resources/open-access-citation-advantage-service-oaca/oaca-list/)"). +- La Scienza Aperta potrebbe incrementare la fiducia nella scienza e l'affidabilità nei risultati scientifici. +- Scienza aperta e rapporti con le licenze, questioni legate al diritto d’autore. +- Generalmente i risultati della ricerca aperti sono concessi con licenze aperte per massimizzare il loro riutilizzo consentendo tuttavia all’autore di detenere la proprietà e l’accreditamento del proprio lavoro. + +###### Target Group +- Early career researchers +- SSH researchers +###### Duration +1 hour +###### Prerequisites +None +###### Learning tools +- access to training platform +- access to word processor + + +# Che cos'è la scienza aperta ? + +L’obiettivo di questo modulo è di fornire un quadro contestuale nonchè una panoramica sugli aspetti di maggior rilievo che riguardano la Scienza Aperta. + +## 1. One term, many definitions + +Ci sono molte definizioni dell'Open Science (OS) a giro. + +### 1.1 UNESCO + +

La definizione contenuta nella Raccomandazione dell’UNESCO (2021) è una della più complete in quanto copre tutti gli aspetti che riguardano la scienza aperta.  + + "Open  science  is  defined  as  an inclusive construct that combines various movements and practices aiming to  make  multilingual  scientific  knowledge  openly  available,  accessible  and reusable  for  everyone,  to increase  scientific collaborations  and  sharing  of information for the benefits of science and society, and to open the processes of scientific knowledge creation, evaluation and communication to societal actors beyond the traditional scientific community. It comprises all scientific disciplines  and  aspects  of  scholarly  practices,  including  basic  and applied sciences, natural and social sciences and the humanities, and it builds on the following key pillars: open scientific knowledge, open science infrastructures, science  communication,  open engagement  of  societal  actors  and  open dialogue with other knowledge systems.”

+ +

[UNESCO Recommendation on Open Science](https://unesdoc.unesco.org/ark:/48223/pf0000379949.locale=en)

+ +![UNESCO [Open Science Brochure](https://en.unesco.org/sites/default/files/open_science_brochure_en.pdf)](https://lh7-us.googleusercontent.com/L4B8PXrl5PmvToi6938ftHutJHOfS1n6Frxr_9h7sngZXz5vNWbWyzitGnFa_APCC6lgjT6MVtVjn3p-bILf9BAzhLD9403temCZJyXns0ekMOkLUZd9ADiWbLCOsME-HXFHMsTdxwf_YnM49Dbdg6TpQA=s2048) + +**[UNESCO Open Science Brochure](https://en.unesco.org/sites/default/files/open_science_brochure_en.pdf)** + +Secondo la definizione dell'UNESCO, la scienza aperta si basa su quattro pilastri: +- Conoscenza scientifica aperta +- Infrastrutture +- Comunicazione scientifica e coinvolgimento degli attori sociali +- Dialogo aperto con altri sistemi della scienza + +### 1.2 Schools of thought +

Gli obiettivi e le ipotesi alla base delle motivazioni che spingono a mettere in pratica queste diverse pratiche sono stati oggetto di analisi da parte di Fecher & Friesike ([2013](https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2272036)), i quali, attraverso lo studio della letteratura, hanno individuato cinque ampie problematiche o "scuole di pensiero"

+![Open Science: One Term, Five Schools of Thought](attachments/Capture%20d’écran%202023-11-02%20à%2020.52.34.png) + +- **Scuola democratica:** partendo dal presupposto che l'accesso alla conoscenza non sia equamente distribuito, quest'area si occupa di rendere il sapere accademico (incluse pubblicazioni e dati) liberamente disponibile a tutti. + +- **Scuola pragmatica:** in base al principio secondo il quale la creazione della conoscenza è resa più efficiente attraverso la collaborazione e rafforzata attraverso la critica, quest'area cerca di sfruttare l’efficacia dei sistemi di rete che collegano tra loro gli studiosi e rendono i metodi accademici più trasparenti. + +- **Scuola delle infrastrutture:** questa visione si basa sul presupposto che una ricerca efficiente richiede piattaforme, strumenti e servizi prontamente disponibili per la diffusione e la collaborazione. + +- **Scuola della platea pubblica:** avendo riconosciuto che per esercitare un impatto reale sulla società questa deve essere coinvolta nelle attività di ricerca attraverso la comunicazione dei risultati della ricerca scientifica di facile comprensione, quest'area cerca di portare il pubblico a collaborare con la ricerca attraverso la “cittadinanza partecipativa” e a facilitare la comprensione della conoscenza per mezzo di brevi testi riassuntivi, blog e altri strumenti di comunicazione meno formali. + +- **Scuola della valutazione:** traendo la propria motivazione dal fatto che le metriche tradizionali per misurare l'impatto scientifico sono risultate discutibili (per esempio, troppo incentrate sulle pubblicazioni, e spesso solo a livello di rivista), questo filone cerca delle "metriche alternative" che possano trarre vantaggio dalle nuove funzionalità che gli strumenti digitali in rete mettono a disposizione per tracciare e misurare l'impatto della ricerca attraverso attività che prima erano invisibili. +### 1.3 Tassonomia +Questa rappresentazione, pubblicata nel progetto europeao [FOSTER](https://www.fosteropenscience.eu/) , offre una visione più sistematica del concetto di Open Science. Nella tassonomia, l'Open Science viene suddivisa in componenti : + +1. **Open Access**: Questo pilastro riguarda l'accesso aperto alle pubblicazioni della ricerca, il che significa rendere facilmente accessibili e consultabili i risultati della ricerca. + +2. **Open Data e FAIR Data**: Questa categoria riguarda la condivisione di dati aperti e la conformità a principi FAIR (Findable, Accessible, Interoperable, Reusable) + +4. **Strumenti**: Includono le risorse e le tecnologie utilizzate per supportare i ricercatori nella pratica dell'Open Science. + +5. **Politiche**: Le politiche istituzionali e nazionali che promuovono e regolamentano la pratica della Scienza Aperta. + +6. **Infrastrutture**: Questo pilastro riguarda l'ambiente tecnico e organizzativo che facilita la condivisione e la collaborazione nella ricerca aperta. + +7. **Valutazione**: Come misurare e valutare l'adesione ai principi della Scienza Aperta. + + +![](https://lh7-us.googleusercontent.com/0fWuwtFTvvoaEZUfTYdGrW7VV8_ylIRMgmPmhiVTo3tkkzAoWf3Zv-p_0iaEXW7N4dHzNxvB7MfNivd8tuZ66xqIAH9Yd-F6O-Wqix_n82-m52IrKW1g0J08AISVnoTsQ5Wr85B11edbItVQqrYrywh6Fg=s2048) +

Taxonomy from FOSTER project, **[DOI](https://doi.org/10.6084/m9.figshare.1508606.v3)**

+ +### 1.4 Philosophical + +Sabina Leonelli? + + +**IDEE**: PLAN A CHANGER ET ABORDER UN PETIT PEU TOUS LES ASPECTS (DE LA TAXONOMIE FOSTER) + +>

L'Open Science non si limita alle pubblicazioni o alla condivisione dei dati. Deve essere compresa come un sistema di cambiamento che introduce un nuovo modello di comunicazione scientifica, basato sulla collaborazione e sull'apertura nella produzione e condivisione di conoscenza, dati e risultati. Pertanto, quando si fa riferimento alla Scienza Aperta, si sottolinea l'importanza del rigore, della responsabilità e della riproducibilità nella pratica scientifica.

+La scienza aperta, secondo la definizione di cui sopra, include un numero enorme di potenziali cambiamenti strutturali nella pratica accademica, un ambiente spesso gerarchico e conservatore. Laddove, inoltre, anche i ricercatori siano in sintonia con gli obiettivi della Scienza Aperta, potrebbero non percepirne del tutto i vantaggi nel farli propri dato che i meccanismi di incentivazione esistenti non rispecchiano la nuova cultura di apertura e collaborazione. Di conseguenza, convincere i ricercatori della necessità di cambiare le proprie pratiche richiede una buona comprensione non solo dei benefici etici, sociali ed accademici ma anche di come l'adozione delle pratiche di Scienza Aperta può essere di loro aiuto concretamente per avere successo nel loro lavoro. Questa sezione descrive alcuni concetti, principi, attori e pratiche fondamentali nella Scienza Aperta e come questi interagiscano tra loro nel più ampio ecosistema della ricerca. + + +## 2. Is Open Science new? + +

L'Open Science è soggetto di discussione da molti anni, l'Open Access già nel 2001-2022 quando è stata lanciata l'iniziativa di Budapest sull'Accesso Aperto, seguita nel 2003 dalla Dichiarazione di Berlino sull'Accesso Aperto.

+### Negli ultimi 20 anni + +2001. [Budapest Open Access Initiative](https://www.budapestopenaccessinitiative.org/)  +2003. [Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities](https://openaccess.mpg.de/Berlin-Declaration)  +2007. [OECD Principles and Guidelines on Access to Research Data from Public Funding](https://www.oecd.org/science/inno/38500813.pdf) +2014. [The FAIR data principles](https://force11.org/info/the-fair-data-principles/) +2015. OECD “[Making Open Science a Reality](https://www.oecd-ilibrary.org/science-and-technology/making-open-science-a-reality_5jrs2f963zs1-en)”  +2016. European Commission, Directorate-General for Research and Innovation, [Open innovation, open science, open to the world : a vision for Europe](https://op.europa.eu/en/publication-detail/-/publication/3213b335-1cbc-11e6-ba9a-01aa75ed71a1)  +2017. [G7 Science Ministers Communiqué](http://www.g7.utoronto.ca/science/2017-G7-Science-Communique.pdf) + +Nel corso della pandemia, organizzazioni internazionali, tra cui l'Organizzazione Mondiale della Sanità, si sono esposte a favore dell'apertura dei dati. In questo contesto, l'importanza di disporre di dati condivisibili si è rivelata fondamentale. + +## 3. What's the problem, doctor? + +Sono emersi una serie di problemi, fra cui: +- Il costo eccessivo degli abbonamenti alle riviste scientifiche in tutto il mondo +- Uno studio della Commissione Europea ha rivelato che in Europa si perdono ogni anno circa 26 miliardi di euro a causa della gestione inadeguata dei dati di ricerca, con la ripetizione di esperimenti e la mancanza di politiche di condivisione e riutilizzo dei dati. +- I grandi editori commerciali traggono enormi profitti. + +

Questi problemi fanno emergere un sistema che presenta evidenti criticità e inefficienze. +Non è a caso che il sistema è stato definito come un sistema "publish or perish", in cui i ricercatori sono spinti a pubblicare il maggior numero possibile di lavori, mettendo in secondo piano la qualità. L'obiettivo principale diventa ottenere un elevato numero di citazioni o pubblicare su riviste considerate "prestigiose". + +Sul sito Retraction Watch, si può vedere come la corsa alla pubblicazione spinga molti autori a rilasciare lavori che poi vengono ritrattati. Le riviste scientifiche più prestigiose, contribuiscono in parte a questa mancanza di affidabilità: valorizzando risultati sorprendenti, troppo belli per essere veri, trascurano a volte i controlli di qualità adeguati.

+ +### Come siamo arrivati qui? + +#### La comunicazione scientifica + +**In [Scholarly Communication and Scholarly Publishing](https://oaspa.org/guest-post-by-jean-claude-guedon-scholarly-communication-and-scholarly-publishing/)** (2021), Jean Claude Guédon spiega che si è verificato un momento in cui la comunicazione della scienza e la pubblicazione dei risultati, anziché procedere allineati, hanno iniziato a divergere. + +Con comunicazione scientifica si intende una serie di pratiche della ricerca, codificate nel tempo, che rispondo a diverse funzioni. +
Scholarly communication is *"the system through which research and other scholarly writings are created, evaluated for quality, disseminated to the scholarly community, and preserved for future use."* ACRL, [Principles and Strategies for the Reform of Scholarly Communication](https://www.ala.org/acrl/publications/whitepapers/principlesstrategies), 2006.
+#### La valutazione della ricerca + +Per cambiare il sistema, bisogna cambiare il sistema di valutazione della ricerca, che si basa principalmente sulle pubblicazioni. +Alcuni problemi: +- uso eccessivo dell'Impact Factor per misurare la qualità +- dipendenza eccessiva dalle grande case editrice commerciali +- l'articolo, da un "knowledge unit" a un “accounting unit” che viene usato nella valutazione dei ricercatori e delle organizzazioni di ricerca +- quando una misura diventa un obiettivo, cessa di essere una buona misura (legge di Goodhart) + +### Politiche europee e internazionali + +2012. [San Francisco Declaration on Research Assessment ](https://sfdora.org/read/) +2021. [European Research Area Policy Agenda (2022 – 2024)](https://research-and-innovation.ec.europa.eu/document/download/0c2f5f95-3274-4ab8-9acb-d6673dc238b8_en?filename=ec_rtd_era-policy-agenda-2021.pdf) +2022. [Strategic Research and Innovation Agenda of the European Open Science Cloud (EOSC)](https://eosc.eu/wp-content/uploads/2023/08/SRIA-1.1-final.pdf) +2022. [Agreement on Reforming Research Assessment](https://coara.eu/agreement/the-agreement-full-text/) + +## Conclusions: Cosa è la Open Science + +Fare Open Science significa rendere **aperto ogni passo della ricerca**. + +I principi della Open Science sono trasparenza, riproducibilità, collaborazione, inclusività, accessibilità, rigore, riuso. + +La scienza aperta si basa anche sull’idea che la ricerca finanziata con fondi pubblici debba essere pubblicamente disponibile. + +**Perché serve la Open Science?** +- Il sistema della comunicazione scientifica oggi è regolato da interessi di mercato di grandi editori commerciali e criteri di valutazione della ricerca obsoleti: le ricerche risultano chiuse dietro abbonamenti da migliaia di dollari che nessuno può permettersi +- ogni istituzione paga la ricerca 4 volte (con fondi pubblici): stipendio, fondi di ricerca, abbonamenti alle riviste per “ricomprare” le ricerche, diritti di riuso; +- senza dimenticare che né gli autori né i revisori vengono remunerati. + +**I vantaggi** + +- Per la scienza: più trasparente, verificabile e riproducibile oltre che più rapida ed efficiente; +- per le imprese: accedendo ai risultati della ricerca possono offrire prodotti più innovativi; +- per la società: cittadini e amministratori possono prendere decisioni più obiettive sulla base dei dati, insegnanti e professionisti possono tenersi aggiornati, operatori sanitari e medici possono curarci meglio. + +## Assessment + + + +_________________________________ +**Resources** +- European Commission's Directorate-General for Research & Innovation (RTD) (2016). Open innovation, Open Science, open to the world - a vision for Europe. [ec.europa.eu/digital-single-market/en/news/open-innovation-open-science-open-world-vision-europe](https://ec.europa.eu/digital-single-market/en/news/open-innovation-open-science-open-world-vision-europe) + +- Fecher and Friesike (2014). Open Science: One Term, Five Schools of Thought. [doi.org/10.1007/978-3-319-00026-8_2](https://doi.org/10.1007/978-3-319-00026-8_2) + +- High Level Group (2017). Europe's future. Open innovation, Open Science, open to the world: reflections of the Research, Innovation and Science Policy Experts (RISE). [doi.org/10.2777/79895](https://doi.org/10.2777/79895) + +- Masuzzo and Martens (2017). Do you speak Open Science? Resources and tips to learn the language. [doi.org/10.7287/peerj.preprints.2689v1](https://doi.org/10.7287/peerj.preprints.2689v1) + +- Watson (2015). When will ‘Open Science’ become simply ‘science’?. [doi.org/10.1186/s13059-015-0669-2](https://doi.org/10.1186/s13059-015-0669-2) \ No newline at end of file diff --git a/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_research_data.md b/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_research_data.md new file mode 100644 index 00000000..37f59539 --- /dev/null +++ b/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_research_data.md @@ -0,0 +1,81 @@ +--- +title: Activity-details-research_data +author: + - Lottie Provost +tags: + - Learning + - Materials + - FAIR + - Training + - Activity +--- + +# Sto preparando le mie valigie and what is research data +This document serves as a guide on how to deliver the specific training activity. + +Summary description of the activity. + +## Activity duration + - Esercitazione di gruppo, 5–10 minuti (a seconda del numero di partecipanti) + +## Number of people that it can be performed with + +## Goal of activity +recall what you learnt in the LU2 on Open Research Data +Memorizzare le fasi necessarie alla pubblicazione di dati +## Materials +- list of materials needed to perform the activity +- reference digital +- list physical equipment + +## Instructions + +##### **Esempio 6: Che cosa sono i dati della ricerca secondo me?** + +- Formato, durata + + - da soli/in coppia, 15 minuti +- Argomento + + - [Dati e materiali della ricerca aperti](https://open-science-training-handbook.github.io/Open-Science-Training-Handbook_IT/02OpenScienceBasics/02OpenResearchDataAndMaterials.html) +- Finalità didattiche + + - Conoscere i propri dati di ricerca e i dati dei propri ambiti di ricerca +- Descrizione dell'esercitazione + + - Chiedete ai partecipanti di riflettere sugli ultimi articoli che hanno scritto/letto. Erano corredati da materiale integrativo (ad esempio tabelle, immagini)? Chiedete loro di scrivere alcuni esempi e alcuni tipi di dati di ricerca del loro ambito di lavoro. Che tipo di informazione o di dati avrebbero bisogno per ri-analizzare lo studio? Di che cosa avrebbero bisogno per fare in modo che la loro dissertazione/articolo possa essere compresa nel modo giusto? Chiedetegli di presentare le loro riflessioni conclusive in coppia/in gruppo o poi nella sessione plenaria. +- Materiali e strumenti richiesti + + - Un foglio di carta e una penna +- Conoscenze propedeutiche necessarie + + - Non sono richieste conoscenze propedeutiche +- Nota bene + + - Concedete ai partecipanti il tempo necessario per fare brainstorming +- Adattamenti per finalità diverse + +##### **Esempio 11: Che cosa serve per pubblicare i dati della ricerca?** +Descrizione dell'esercitazione: +**- Questo esercizio dovrebbe essere programmato a conclusione della formazione. Chiedete ai partecipanti di giocare a "Sto preparando le mie valigie" durante il quale viene chiesto loro di elencare gli elementi necessari per una pubblicazione di dati (ad esempio dati di ricerca (files), metadati, parole chiave, documentazione, licenza, ORCID, archivio, un buon titolo, riferimenti bibliografici/fonti, citazione di dati, tempo e coraggio!)** +- +- Conoscenze propedeutiche necessarie + - Ai partecipanti è richiesto avere una conoscenza di base su come si pubblicano i dati + +- Nota bene + - Se i partecipanti si dimenticano di qualche elemento, fornitegli un aiuto o indicazioni utili + - Proponete solo all'ultimo l'elemento "coraggio" + +- Adattamenti per finalità diverse + - Può essere adattato anche per il processo di pubblicazione ad accesso aperto + +## Tips and Tricks +- if the activity can be done both physically and online, provide info on the differences and specifics for each + +## Related sources +- list any additional sources that may be useful for the activity + +## Comments +- how did it go +- supporting the co-creation process +- \ No newline at end of file diff --git a/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_template.md b/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_template.md deleted file mode 100644 index 5de0fc03..00000000 --- a/resources/Research Data and Open Science course/Learning Unit 2/Activities/activity_details_template.md +++ /dev/null @@ -1,44 +0,0 @@ ---- -title: "Training Activity Setup" -author: "Skills4EOSC T2.3" -tags: - - FAIR-by-Design Learning Materials - - FAIR Learning Objects - - Training Activity Template ---- - -# Activity name -This document serves as a guide on how to deliver the specific training activity. - -Summary description of the activity. - -## Activity duration - -## Number of people that it can be performed with - -## Goal of activity - -## Materials -- list of materials needed to perform the activity -- reference digital -- list physical equipment - -## Instructions - -Describe how to run the activity. If the activity has several stages break them down into subheadings and provide duration for each. - -List any questions the trainer should ask during the activity. - -List or link to examples of completing the activity. - - -## Tips and Tricks -- if the activity can be done both physically and online, provide info on the differences and specifics for each - -## Related sources -- list any additional sources that may be useful for the activity - -## Comments -- how did it go -- supporting the co-creation process -- \ No newline at end of file diff --git a/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-IT.md b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-IT.md new file mode 100644 index 00000000..1b6c1660 --- /dev/null +++ b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-IT.md @@ -0,0 +1,443 @@ +--- +title: LU2-ResearchData-content-IT +author: + - Lottie Provost +tags: + - Data + - Repository + - FAIR + - RDM +--- +# Perché ? +## 1. Dati della ricerca + +### 1.1 Valori alla base della gestione dei dati + +Il punto qui è che per essere credibile la ricerca deve essere di alta qualità. Ma chi garantisce questa qualità ? Daremo un'occhiata ai valori alla base della ricerca di alta qualità e ai difetti dell'attuale panorama accademico/scientifico (crisi di riproducibilità/crisi editoriale/) + +sono filosofici ma includono aspetti pratici/tecnici che imparerai a includere nelle tue pratiche di ricerca.  + + + +#### Integrità della ricerca  + +*integrare quiz su sei un ricercatore trasparente?* + + + +"Se la ricerca scientifica e accademica deve svolgere correttamente questo ruolo, l'integrità della ricerca è essenziale. I ricercatori che non sono guidati dai principi di onestà, scrupolosità, trasparenza, indipendenza e responsabilità rischiano di danneggiare sia la qualità che l'affidabilità della ricerca" | [VSNU, 2018](https://www.vsnu.nl/files/documents/Netherlands % 20Code %20of%20Conduct%20for%20Research%20Integrity%202018.pdf) + +L'integrità scientifica è essenziale per il corretto funzionamento della scienza. L'integrità scientifica è un termine generico per le norme comportamentali a cui uno scienziato dovrebbe aderire per garantire che la ricerca sia affidabile e di buona qualità. + +Gli standard di condotta per l'integrità scientifica sono stabiliti in codici di condotta come The European Code of Conduct for Research Integrity ([allea, 2017]). + +Nel Codice di condotta olandese per l'integrità scientifica ([VSNU, 2018](https://www.vsnu.nl/files/documents/Netherlands%20Code%20of%20Conduct%20for%20Research%20Integrity%202018.pdf)), cinque principi costituiscono la base della ricerca etica: +- Onestà +- Scrupolosità +- Trasparenza +- indipendenza , +- Responsabilità + + +Al fine di impedire che i dati della ricerca vengano inventati, fabbricati o falsificati (intenzionalmente manipolati o male interpretati) e per stimolare la riproducibilità, un ricercatore trasparente chiarisce su quali dati basa le conclusioni e come questi dati sono stati raccolti. Se i dati della ricerca non possono essere resi apertamente accessibili, il ricercatore deve indicare i motivi per cui ciò non è possibile.  + + + +**Riproducibilità** + +"Reproducibility means that research data and code are made available so that others are able to reach the same results as are claimed in scientific outputs" | [The Open Science Training Book, 2018](https://book.fosteropenscience.eu/en/02OpenScienceBasics/04ReproducibleResearchAndDataAnalysis.html) + +Sebbene esistano diverse definizioni di riproducibilità nella letteratura scientifica, qui chiameremo la ricerca riproducibile quando i ricercatori forniscono tutti i dati, i metadati, i software e gli script informatici necessari che consentono di ricondurre la ricerca o di rendere possibile la rianalisi dei dati della ricerca. + +L'impostazione di una ricerca riproducibile richiede una preparazione approfondita in fase di pianificazione. Nel Capitolo II discuteremo una serie di suggerimenti e strumenti che mirano ad aumentare la riproducibilità della ricerca scientifica. + +### 1.2 Vocabolario/Gergo dei dati + +#### Dati della ricerca + +**Definizioni**  + +- 4 Definizioni per dimostrare che ciò che la comprensione dei "dati della ricerca"  varia da ricercatore a ricercatore, e questo dipende principalmente dal significato di questi dati nel processo di ricerca.  + +- Principali differenze tra le discipline scientifiche.  + +- Molti formati per i dati di ricerca, che possono essere letti con molti tipi di software.  + +- Controllare di seguito le 4 definizioni di dati di ricerca. + +- "I dati di ricerca costituiscono dati di ricerca primari (le misurazioni o osservazioni grezze e approssimative) e dati di ricerca secondari (i risultati dopo che i dati sono stati elaborati da un ricercatore (ricodificati, combinati, categorizzati, visualizzati, ecc.)". [Università di Utrecht, 2016](https://www.uu.nl/sites/default/files/university_policy_framework_for_research_data_utrecht_university_-_january_2016.pdf) + +- "I dati della ricerca possono essere fatti, osservazioni, interviste, registrazioni, misurazioni, esperimenti, simulazioni e software; numerici, descrittivi e visivi; grezzi, ripuliti ed elaborati; possono supportare o meno una pubblicazione effettiva o prevista; e possono essere archiviati e scambiati in vari formati su vari supporti di memorizzazione." [Van Berchum & Grootveld, 2017](http://hdl.handle.net/20.500.11755/a9539a60-ecef-4e62-a998-0fda190b303b) + +- "Dati di ricerca" indica dati sotto forma di fatti, osservazioni, immagini, risultati di programmi per computer, registrazioni, misurazioni o esperienze su cui si basa un argomento, una teoria, un test o un'ipotesi o un altro risultato di ricerca. I dati possono essere numerici, descrittivi, visivi o tattili. Può essere grezzo, pulito o lavorato e può essere conservato in qualsiasi formato o supporto." [Queensland University of Technology, 2013](http://www.mopp.qut.edu.au/D/D_02_08.jsp) + +- "sono le registrazioni fattuali (punteggi numerici, registrazioni testuali, immagini e suoni) utilizzate come fonti primarie per la ricerca scientifica e che sono comunemente accettate nella comunità scientifica come necessarie per convalidare i risultati della ricerca. Un set di dati di ricerca costituisce una rappresentazione sistematica e parziale del soggetto indagato ". [OCSE, 2007](http://www.oecd.org/sti/inno/38500813.pdf)" + + +##### Modi di guardare i dati  + +- **Come vengono raccolti o ottenuti i dati?**  + +Esistono vari modi: attraverso esperimenti, simulazioni, osservazioni, dati derivati o ricerca di fonti. + +- **Quali sono le forme che assumono i dati?**  + +Guarda la forma in cui vengono registrati quei dati, questo è spesso ciò che viene utilizzato per definire i dati. Può essere un documento di testo, fogli di calcolo, riviste elettroniche di laboratorio, quaderni e diari di campo, questionari, trascrizioni e libri di codice, nastri audio e video, fotografie e filmati, artefatti, diapositive, schemi di database, modelli, algoritmi e script, flussi di lavoro, protocolli, metadati e altri file di dati come rapporti di ricerche bibliografiche e archivi di e-mail. + +- **In quali formati vengono memorizzati i dati?** + +Guarda il formato dei dati in cui sono memorizzati i diversi tipi di dati (testuali, numerici, multimediali, strutturati, codice software, ecc.). I dati statistici possono essere memorizzati, ad esempio, come formati di file SPSS (* .sav) o STATA, filmati come * .mpg o * .avi, dati strutturati come * .xml o in un database MySQL relazionale e file di testo come * .docx, * .pdf o * .rtf. + +- **Qual è la dimensione dei file di dati?** + +La dimensione dei file di dati è importante, così come la loro complessità. La gestione di un set di dati relativamente piccolo e semplice pone sfide diverse rispetto alla gestione di database grandi e complessi. + +- **A quale fase corrispondono nel ciclo di vita della ricerca?** + +Le diverse fasi della vita dei dati di ricerca hanno ciascuna le proprie sfide per la gestione dei dati di ricerca (di supporto). + + +#### Ciclo di vita della ricerca + +I dati della ricerca hanno una durata più lunga rispetto al momento in cui vengono generati. Un modo di guardare a questo è con un cosiddetto ciclo di vita della ricerca. In questa sezione, spiegheremo il concetto in modo più dettagliato. +##### Ci sono diversi cicli di vita + +Un modello del ciclo di vita fornisce informazioni su come le varie fasi della vita della ricerca e dei dati della ricerca si incastrano e su come le scelte che fai in una fase influenzano la qualità dei dati nell'altra. In questo modo è possibile spostare la prospettiva dal breve al lungo termine: cosa vogliamo da questi dati di ricerca?  + +Ci sono molti cicli di vita in circolazione, focalizzati su un certo uso o su un certo gruppo di utenti. Ne guardiamo alcuni qui. + + + +Ciclo di vita della ricerca incentrato sugli strumenti di ricerca che possono essere utilizzati nelle diverse fasi del flusso di lavoro. Bosman & Kramer, 2015.  + + + +![bianca e kramer ](allegati/Capture%20d’écran%202023-11-01%20à%2012.09.51.png) + + + +![Ciclo di vita della ricerca [librerie UCF (2017)](https://library.ucf.edu/about/departments/scholarly-communication/overview-research-lifecycle/)](allegati/UCF-lifecycle.png) + + + +Un altro tipo di visualizzazione: l'immagine seguente è stata adattata dal servizio dati del Regno Unito:  + + + +![Adattato da ](allegati/Ricerca%20Lifecycle.drawio.png) + + + + + + + + + +(1) Pianificazione della ricerca:  + +Design Research + +- gestione dei dati del piano + +- pianificare il consenso per la condivisione  + +- pianificare la raccolta dei dati, i protocolli di elaborazione e i modelli + +- esplorare le fonti di dati esistenti + + + +(2) Raccolta dei dati + +Raccogli dati  + +acquisire dati con metadati  + +acquisire dati esistenti di terze parti + + + +(3) Elaborazione e analisi dei dati + +- inserire, digitalizzare, trascrivere e tradurre i dati + +- controllare, convalidare, pulire, anonimizzare + +- derivare dati + +- descrivere e documentare i dati + +- gestire e archiviare i dati  + +- analizzare e interpretare i dati + +- produrre risultati della ricerca  + +- citare fonti di dati + + + +(4) Pubblicazione e condivisione dei dati  + +- stabilire il diritto d'autore + +- creare documentazione utente + +- creare metadati di discovery + +- selezionare l'accesso appropriato ai dati  + +Pubblica/Condividi  + +- promuovere i dati  + + + +(5) Conservazione dei dati  + +- migrare i dati nel formato / supporto migliore + +- archiviare ed eseguire il backup dei dati  + +- creare documentazione di conservazione  + +- conservare e curare i dati  + + + +(6) Riutilizzo dei dati  + +- condurre analisi secondarie + +- intraprendere ricerche di follow-up  + +- condurre revisioni della ricerca + +- esaminare i risultati + +- utilizzare i dati per l'insegnamento e l'apprendimento  + + + +#### RdM, aperto e CORRETTO + + + +RdM Aperto ed EQUO: GIUSTO e aperto entrambi si concentrano sulla condivisione dei dati, garantendo che i contenuti siano resi disponibili in modo da promuovere l'accesso e il riutilizzo. La gestione dei dati, al contrario, riguarda la gestione dei dati dal momento del concepimento in poi. Non fa ipotesi sull'accesso, ma è essenziale se i dati devono essere significativi per gli altri. | [Higman, 2019](http://doi.org/10.1629/uksg.468) + + + +**RdM**: la gestione dei dati di ricerca (RdM) si riferisce al modo in cui gestisci, organizzi e strutturi i tuoi dati di ricerca durante tutto il processo di ricerca. Gestione dei dati + + + +- Inizia con le tue considerazioni iniziali su ciò che sarà necessario per utilizzare o raccogliere il tuo particolare tipo di dati; + +- Include misure per mantenere l'integrità dei dati, assicurandosi che non vengano persi a causa di incidenti tecnici e che le persone giuste possano accedere ai dati al momento opportuno;  + +- Attende con impazienza il futuro, chiarendo che dovresti fornire una documentazione dettagliata e strutturata per poter condividere i tuoi dati con altri colleghi e prepararli alla disponibilità a lungo termine. |  [CESSDA, 2018](https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/1.-Piano/Vantaggi della gestione dei dati) + + + +**Gestione dei dati:** per gli istituti di ricerca, comprese le università, i centri medici universitari, le università di scienze applicate e altri organismi di ricerca, sta diventando sempre più chiaro che la professionalizzazione della gestione dei dati, o gestione dei dati di ricerca come è anche noto, è importante; che i data steward sono indispensabili e che i vari ruoli di data stewardship devono essere collocati in un quadro organizzativo. | [Verheul, e.a., 2019](http://doi.org/10.5281/zenodo.2642066) + + + +**Open Data**: un dato o contenuto è aperto se chiunque è libero di utilizzarlo, riutilizzarlo e ridistribuirlo - soggetto solo, al massimo, all'obbligo di attribuirlo e/o condividerlo. | [Open Knowledge Foundation (n.d.)](http://opendefinition.org/) + + + +** Dati FAIR:** se la gestione dei dati viene eseguita secondo i principi FAIR ([Wilkinson, 2016](https://www.nature.com/articles/sdata201618)) i dati della ricerca saranno: reperibili, accessibili, interoperabili, riutilizzabili.  + + + +**Open Science:** Open Science consiste nell'estendere i principi di apertura all'intero ciclo di ricerca, promuovendo la condivisione e la collaborazione il prima possibile, comportando così un cambiamento sistemico nel modo in cui la scienza e la ricerca vengono svolte. | [Promuovere la scienza aperta, s.d.  + +](https://www.fosteropenscience.eu/content/what-open-science-introduction) La scienza aperta riguarda l'aumento del riutilizzo della ricerca. La chiave per raggiungere questo obiettivo è aderire a principi EQUI: garantire che i risultati e i dati alla base dei risultati della ricerca siano reperibili, accessibili, interoperabili e riutilizzabili. | [Bruce & Cordewener, 2018](https://blogs.lse.ac.uk/impactofsocialsciences/2018/07/26/open-science-is-all-very-well-but-how-do-you-make-it-fair-in-practice/)** + + + +**Cosa significa FAIR:** Al fine di sfruttare appieno il potenziale dei dati della ricerca, è necessario includerli nell'ecosistema di ricerca come trovabili, accessibili, interoperabili e riutilizzabili il più possibile (Force 11, 2014; Wilkinson et al., 2016; GoFAIR, n.d.). I principi della FIERA sono costituiti da 15 sfaccettature ([GoFAIR, n.d.](https://www.go-fair.org/fair-principles/)). La cosa principale è che i dati della ricerca non dovrebbero essere EQUI solo per le persone, ma anche per i computer/macchine. I principi FAIR sono ormai parte integrante del panorama della gestione dei dati e costituiscono la base del piano di costruzione dell '[European Open Science Cloud](https://datasupport.falco213.lcube-server.de/start-de-cursus/iv-oogstfase/european-open-science-cloud). + + + +** FIERA=Aperta?"No. In un [articolo di Mons et al.](https://content.iospress.com/articles/information-services-and-use/isu824) (2017) puoi leggere la seguente spiegazione:   + +La "A" in FIERA sta per "Accessibile", accessibile in circostanze ben definite. Potrebbero esserci motivi legittimi per non rendere disponibili i dati della ricerca in accesso aperto, come la protezione della privacy dei partecipanti alla ricerca. FAIR consiste nel rendere i dati della ricerca reperibili dall'uomo e dalla macchina: + +- arricchire i dati in modo tale che il valore dei dati per il riutilizzo sia chiaro; + +- esplicitamente - con una licenza chiara, preferibilmente leggibile da dispositivo automatico - indicando le condizioni alle quali i dati possono essere riutilizzati;  + +- dare chiare indicazioni su come preventivare in caso di riutilizzo. + +Nessuno di questi principi richiede che i dati della ricerca siano "aperti" o "liberi". FAIR riguarda la chiarezza e la trasparenza delle condizioni di accesso e riutilizzo. I dati possono quindi essere EQUI e non aperti. Al contrario, i dati possono anche essere aperti ma non EQUI. + + + +**Cos' è la gestione EQUA dei dati:** la gestione EQUA dei dati è l'insieme delle decisioni e delle misure adottate durante il ciclo di vita dei dati della ricerca per fornire i dati della ricerca nel modo più EQUO possibile. Ciò che è importante qui è la scelta di una licenza dati, il formato dei dati, la registrazione dei metadati e la documentazione dei dati, le convenzioni di denominazione, ecc. Questi aspetti sono tutti discussi nei seguenti capitoli di Essentials 4 Data Support. + + + +FAIR è un acronimo brillante e questo è uno dei motivi per cui FAIR è parte integrante del panorama della gestione dei dati. A proposito, non sono gli unici principi dei dati in circolazione. Oltre all'acronimo FAIR, esiste anche l'acronimo FACT - Fair, Accurate, Confidential, Transparent - come descritto sul [sito della Digital Society](https://www.thedigitalsociety.info/about/data-principles/) (s.d.). + + + +**Qual è il ruolo degli archivi di dati nel rendere i dati EQUI**? Il ruolo degli archivi di dati nel rendere i dati EQUI è molto ampio. In questo corso ci concentriamo sui ricercatori e su cosa possono fare per preparare i dati per il FAIRness. Ma senza un'infrastruttura di dati costruita su principi EQUI, i ricercatori non possono fare molto. Le raccomandazioni per la creazione di dati EQUI spesso si concentrano su entrambi i gruppi target: ricercatori e archivi di dati. Questo può essere fonte di confusione.  + + + +Le Linee guida Parthenos per FAIRificare la gestione dei dati e rendere i dati riutilizzabili ([Parthenos, 2018](http://10.0.20.161/zenodo.2668478)) fanno una distinzione tra le misure per gruppo target. In modo che anche chi indossa la scarpa possa indossarla. - vedi versione italiana: https://zenodo.org/records/3363243  + + + +Una delle [raccomandazioni della Commissione europea](https://research-and-innovation.ec.europa.eu/strategy/strategy-2020-2024/our-digital-future/open-science/european-open-science-cloud-eosc_en) (2017) per rendere i dati EQUI è pubblicarli in un archivio di dati affidabile che aderisca ai principi FAIR. Come un tale archivio di dati gestisca esattamente questo non è qualcosa che un ricercatore deve sapere esattamente.  + + + +### 1.3 Sostenitori dei dati + + + +"Il presupposto di base è che il ricercatore [stesso sia] il principale responsabile di tutti i dati. Tuttavia, il ricercatore ha bisogno di un supporto professionale per raggiungere questo obiettivo. A tal fine, negli ultimi anni si sono evoluti diversi ruoli e funzioni di gestione dei dati di supporto " |  [Verheul, et al., 2019](http://doi.org/10.5281/zenodo.2642066) + + + +I sostenitori dei dati o i data steward affrontano la sfida di tradurre l'infrastruttura, gli strumenti e la politica dei dati disponibili in consigli significativi, su misura e specifici per disciplina per l'archiviazione, la gestione, l'archiviazione e la condivisione dei dati di ricerca. I gusti del supporto dati all'interno di un'organizzazione variano notevolmente. Uno studio di [Verheul, et al.](http://doi.org/10.5281/zenodo.2642066) (2019) sui compiti e i ruoli degli amministratori di dati negli istituti di ricerca olandesi mostra che la variazione mostra principalmente in: + +- **Qualifica * *: i sostenitori dei dati sono chiamati data steward, esperti di dati, data scientist, consulenti di dati, bibliotecari di dati, gestori di dati, specialisti di gestione dei dati, coordinatori della gestione dei dati, ecc. Oltre ai loro compiti di ricerca, i ricercatori possono anche assumere compiti di amministratore dei dati senza che ciò sia espresso nel loro titolo di lavoro da solo.  + +- **Posizione all'interno dell'organizzazione:** Un amministratore di dati può occupare un posto centrale (ad esempio in una biblioteca o in un dipartimento IT) o può essere schierato a livello di facoltà. + +- **Ruoli e compiti:** Ci sono amministratori di dati generali, amministratori di dati assegnati a un determinato progetto (un amministratore di dati incorporato) e/o che svolgono un ruolo specifico della disciplina. I data steward generali hanno spesso un ruolo consultivo, mentre i data steward integrati o specifici della disciplina stanno anche lavorando sul campo per supportare il flusso di lavoro del ricercatore. Una terza categoria di data steward ha un ruolo più strategico o di coordinamento. Tutti i ruoli sono necessari e i confini tra i ruoli non sono così rigidi come suggerisce l'illustrazione seguente - basata su [la classificazione di Verheul, et al.](http://doi.org/10.5281/zenodo.2642066) (2019) -. + + + + + +____________________ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +___________________________________ + + + +Adattato da [OpenSciency OpenData] (https://github.com/opensciency/OpenData/blob/main/lessons/lesson5.md) + + + +Ciclo di vita dei dati + +* **Plan**: descrizione dei dati che saranno compilati, come i dati saranno gestiti e resi accessibili per tutta la loro vita. + +* **Collect**: corrisponde alla fase di raccolta dati (illustrata in Figura 5.1). Può includere sia dati primari (grezzi) che elaborati. + +* **Assure**: la qualità dei dati è assicurata attraverso controlli e ispezioni. + +* **Descrivere * *: i dati sono descritti in modo accurato e approfondito attraverso la documentazione (ad es. metadati). + +* **Preservare**: questi sono i passaggi necessari per assicurarsi che i dati siano accessibili in futuro, in particolare garantendo che i dati siano archiviati in modo tale che altri possano utilizzarli (in particolare memorizzandoli in un repository di dati). Idealmente questo dovrebbe essere fatto in un modo che corrisponda ai principi di CURA e CORRETTEZZA (lezione 4). Ciò può includere anche la fase di rimozione dei dati che potrebbero non essere utili ai futuri ricercatori. Ad esempio, le immagini ad alta risoluzione potrebbero non essere più utili se nella fase di analisi si sono estratte da esse le caratteristiche di interesse. Non memorizzare l'immagine ad alta risoluzione e semplicemente memorizzare i dati delle caratteristiche fornirebbe un notevole risparmio di spazio di archiviazione. + +* **Scopri**: qui altri ricercatori possono estrarre la totalità o un sottoinsieme dei dati per i propri scopi. + +* **Integrazione**: i dati provenienti da fonti disparate vengono combinati per formare un insieme omogeneo di dati che possono essere facilmente analizzati (questo potrebbe includere questo insieme di dati in fase di analisi). + +* **Analyze**: corrisponde alla fase di analisi dei dati come illustrato in Figura 5.1. + + + +Ci sono una varietà di diverse interpretazioni del ciclo di vita dei dati (vedi la lista di lettura per questa lezione) con vari gradi di complessità. È anche importante notare che questa è un'idealizzazione di ciò che accade in generale. Tuttavia, è importante pensare a tutti questi passaggi come a un processo continuo e interattivo che richiede una pianificazione approfondita e una considerazione continua e riconoscere che non sono banali da fare. + + + +**Informazioni sui DMP (livello introduttivo)** + +Dato che i passaggi precedenti non sono banali prima di iniziare a raccogliere, fascicolare o generare un set di dati, è utile pianificare cosa fare con i dati. Questo è indicato come un piano di gestione dei dati o DMP in breve. + + + +Un DMP significa che puoi pensare in anticipo a eventuali problemi particolari che potrebbero emergere in termini di gestione dei dati, come il costo potenziale di archiviazione, se i dati devono essere resi anonimi e così via. Una descrizione dettagliata di ciò che si dovrebbe inserire in una DMP è descritta [qui](https://the-turing-way.netlify.app/reproducible-research/rdm/rdm-dmp.html) [3]. Come delineato in questo [documento dell'UKRI](https://www.ukri.org/councils/stfc/guidance-for-applicants/what-to-include-in-your-proposal/data-management-plan/) [4], il finanziatore centrale per il Regno Unito, questi possono includere risposte a domande come + +* Che tipo di dati verranno generati o conservati? Ciò potrebbe includere formati di dati, stime approssimative della quantità di dati da archiviare durante un progetto di ricerca e allo stesso modo cosa verrà conservato oltre la durata del progetto? + +* Che tipo di metadati verranno utilizzati e conservati. Vale la pena notare che uno degli aspetti più dettagliati dei principi FAIR è quello di mantenere disponibili i metadati del set di dati anche se il set di dati originale non esiste più. + +* Dove devono essere conservati i dati? cioè quale repository verrà utilizzato (i repository sono discussi nella lezione successiva). Quanto lunga dovrebbe essere? Cinque anni? dieci anni?) Più concretamente, le normative sui dati possono richiedere che determinati dati siano conservati in determinati modi per almeno un certo periodo di tempo. Ciò varierà a seconda del tipo di dati (ad es. cartelle cliniche, statistiche sulla popolazione). Si consiglia di esaminare queste date di scadenza in letteratura e/o nelle linee guida della politica.  + +* Come verranno archiviati i dati privati in modo che siano conservati in modo sicuro? + + + +I DMP non sono pensati per essere documenti esaustivi! Il punto importante è che delineano ciò che un ricercatore o un team di ricerca prevede di fare con i loro dati ben prima che vengano raccolti e possono identificare eventuali passi da compiere piuttosto che affrontare una sfida importante ora. + + + +Le DMP sono [sempre più utilizzate dai finanziatori](https://dmptool.org/public_templates) e dalle loro istituzioni come mezzo per far sì che i ricercatori definiscano cosa faranno con i loro dati in una proposta di ricerca. Le proposte di ricerca spesso richiedono DMP, e quindi le DMP sono spesso la "punta di diamante" per i ricercatori rispetto alla scienza aperta [5]. Un buon DMP è un criterio per la valutazione nelle domande di sovvenzione e quindi fare un buon DMP aiuterà a finanziare la tua sovvenzione. + + + +------- + +Gli archivi di dati saranno discussi nella prossima lezione. I repository specifici del dominio spesso forniscono requisiti più precisi sui metadati (un altro motivo per utilizzarli). + + + +Se non ci sono linee guida, un semplice file README allegato ai dati è un inizio (per un esempio vedi [qui](https://cornell.app.box.com/v/ReadmeTemplate)), anche se è importante notare che idealmente si dovrebbe utilizzare uno schema di metadati che è descritto in modo molto più dettagliato [qui](https://www.dcc.ac.uk/guidance/standards) poiché i dati CORRETTI dovrebbero essere azionabili dalla macchina [7] [8]. + + + + + + + +CONCLUSIONE + +Rendere i dati aperti non è un'attività banale. Non si tratta semplicemente di collocare un set di dati su un cloud drive. Tuttavia, se viene fatto correttamente, i dati aperti sono disponibili per il riutilizzo. Il riutilizzo può coinvolgere completamente un team di ricerca diverso o potrebbe riguardare lo stesso team di ricerca che deve continuare il lavoro dopo che un membro del team responsabile dei dati si è spostato. Ciò significa che devi considerare i dati come parte del ciclo di vita ed è importante pianificare (un Piano di Gestione dei Dati) prima di creare i dati per assicurarsi che siano conservati in modo appropriato. Parte dell'operazione di rendere i tuoi dati FAIR consiste nel fornire metadati che descrivono i dati che stai depositando. Infine, non sentirti obbligato a fare tutto da zero,  ci sono vari luoghi dove puoi trovare supporto per rendere i tuoi dati aperti e FAIR. + + + +Valutazione + +Metti in pratica ciò che hai appena imparato + + + +Esempio + +* Riesci a identificare quali sono stati i passaggi di cui sopra con quei dati? + + + +Pensa ora a un set di dati nella tua disciplina. + + + +* Quali sarebbero i passaggi che dovresti intraprendere con quei dati per abbinarli al ciclo di vita dei dati? diff --git a/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-teaching-IT.md b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-teaching-IT.md new file mode 100644 index 00000000..eccca2e1 --- /dev/null +++ b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content-teaching-IT.md @@ -0,0 +1,468 @@ +--- +title: LU2-ResearchData-content-teaching-IT +author: + - Lottie Provost +tags: + - Data + - Repository + - FAIR + - RDM +--- +# Perché dobbiamo prendersi cura dei dati della ricerca? + +Scaletta: + +| LU 2 | Perché dobbiamo prendersi cura dei dati della ricerca? | | +|:-----------|:--------------------------------------------------------------|:----------------------------------------------------| +| 1 | Cosa sono i dati della ricerca? | | +| activity | video on RDM  | | +| 1.1 | Why should we care | | +| | | Integrità e Riproducibilità della ricerca | +| 1.2 | Data jargon | | +| | | Dati della ricerca, Research (data) lifecycle, FAIR | +| 1.3 | Data stewards | | +| 2 | Open Access e Open Data | | +| | | | +| 3 | Open requirements : Example in Horizon Europe | | + +Activities: +Menti: see lesson 4 macerata + +### Teaching objectives: +1. Essere in grado di convertire un insieme di dati "chiuso" in un insieme di dati "aperto", mettendo in atto le misure necessarie in un piano di gestione dei dati, con una gestione responsabile dei dati e dei metadati. + +2. Essere in grado di utilizzare il piano di gestione dei dati di ricerca e di rendere i risultati della ricerca reperibili ed accessibili, anche se contengono dati sensibili. + +3. Comprendere i pro e i contro della condivisione aperta delle diverse tipologie di dati (ad esempio, riservatezza, dati sensibili, anonimizzazione, accesso mediato). + +4. Comprendere l'importanza di servirsi di metadati appropriati per un'archiviazione sostenibile dei dati della ricerca. + +5. Comprendere i processi di lavoro di base nonchè gli strumenti per la condivisione dei dati della ricerca. + +## 1. Cosa sono i dati della ricerca? + +Video: Ghent University Data Stewards (2020). [Knowledge clip: What is Research Data Management (RDM)?](https://www.youtube.com/watch?v=bbsLmy3Njv4) + +Video transcript: +What is research data management? Research data management or RDM is a broad term encompassing all practices and actions to ensure that research data are secure, sustainable, easy to find, understand and reuse. But what does that actually mean? Let's dissect research data management. It consists of two concepts: research data and management. + +*So what are research data?* +It is hard to come up with one definition for research data, because it is highly domain and context specific. Therefore we refer to research data as any information collected or generated for the purpose of analysis, in order to generate or validate scientific claims. There is a huge variety of data types. Research data can be classified in different ways, for example based on their content, numerical, textual, multimedia etc. Based on their format, spreadsheets, databases, images, maps, audio files, or based on the collection mode such as experimental data, observational simulation, or derived, or compiled from other sources. Or for example its digital or non digital nature, or its primary or secondary character. Has the data been generated by the researchers for a specific purpose, or was it originally created by someone else for other purpose? Finally, is the data raw or processed? Keep in mind that besides the research data itself, RDM also extends to managing documentation needed to make those data understandable. + +*Now what is the management of research data?*** Management refers to activities or actions, such as planning, collecting and organizing data, documenting and describing, storing and backing up and preserving, sharing, and controlling access to research data. These actions take place at different phases of what we call the research data lifecycle. So our DM is about taking proper care of data not only during but also after research, so that data is preserved and can be used in the longer term. Research data are not just a byproduct of scientific research, nor a simple means to article publication. On the contrary, research data should be cared for as first-class research objects and RDM is about exactly that. Two concepts related to research data management are FAIR and Open. [FAIR](https://fair-office.at/?page_id=5870&lang=en) stands for Findable, Accessible, Interoperable, and Reusable. With good RDM practices, we aim to make data FAIR and as open as possible, but as closed as necessary. Implementing good RDM practices can initially take some effort in time, but it also yields significant benefits for yourself, the research community, and society at large. No wonder RDM is increasingly being considered an essential part of good research practice. Good reasons for properly managing and sharing research data range from more selfish, pragmatic reasons, to more altruistic reasons. Think for instance of minimizing the risk of losing valuable data, or increasing your research efficiency and the impact and visibility of your research, but also accelerating scientific discovery and living up to the principle, that publicly funded research is a public good. Do you want to know more? Why not have a look at our webpages? + +### 1.1 Alla base della gestione dei dati +#### L'Integrità della ricerca  + +*integrare quiz su sei un ricercatore trasparente?* + +"If scientific and scholarly research is to perform this role properly, research integrity is essential. Researchers who are not guided by the principles of honesty, scrupulousness, transparency, independence and responsibility risk harming both the quality and the trustworthiness of research" | [VSNU, 2018](https://www.vsnu.nl/files/documents/Netherlands%20Code%20of%20Conduct%20for%20Research%20Integrity%202018.pdf) + +*"Se la ricerca scientifica e accademica deve svolgere correttamente questo ruolo, l'integrità della ricerca è essenziale. I ricercatori che non sono guidati dai principi di onestà, scrupolosità, trasparenza, indipendenza e responsabilità rischiano di danneggiare sia la qualità che l'affidabilità della ricerca" | [VSNU, 2018](https://www.vsnu.nl/files/documents/Netherlands % 20Code %20of%20Conduct%20for%20Research%20Integrity%202018.pdf)* + +L'integrità scientifica è essenziale per il corretto funzionamento della scienza. L'integrità scientifica è un termine generico per le norme comportamentali a cui uno scienziato dovrebbe aderire per garantire che la ricerca sia affidabile e di buona qualità. + +Gli standard di condotta per l'integrità scientifica sono stabiliti in codici di condotta come The European Code of Conduct for Research Integrity ([allea, 2017]). + +Nel Codice di condotta olandese per l'integrità scientifica ([VSNU, 2018](https://www.vsnu.nl/files/documents/Netherlands%20Code%20of%20Conduct%20for%20Research%20Integrity%202018.pdf)), cinque principi costituiscono la base della ricerca etica: +- Onestà +- Scrupolosità +- Trasparenza +- indipendenza , +- Responsabilità + +Al fine di impedire che i dati della ricerca vengano inventati, fabbricati o falsificati (intenzionalmente manipolati o male interpretati) e per stimolare la riproducibilità, un ricercatore trasparente chiarisce su quali dati basa le conclusioni e come questi dati sono stati raccolti. Se i dati della ricerca non possono essere resi apertamente accessibili, il ricercatore deve indicare i motivi per cui ciò non è possibile.  + +#### **La Riproducibilità** +"Reproducibility means that research data and code are made available so that others are able to reach the same results as are claimed in scientific outputs" | [The Open Science Training Book, 2018](https://book.fosteropenscience.eu/en/02OpenScienceBasics/04ReproducibleResearchAndDataAnalysis.html) + +Sebbene esistano diverse definizioni di riproducibilità nella letteratura scientifica, qui chiameremo la ricerca riproducibile quando i ricercatori forniscono tutti i dati, i metadati, i software e gli script informatici necessari che consentono di ricondurre la ricerca o di rendere possibile la rianalisi dei dati della ricerca. + +L'impostazione di una ricerca riproducibile richiede una preparazione approfondita in fase di pianificazione di cui si parlerà piu tardi. + +B2: “Reproducibility” refers to independent researchers arriving at the same results using their own data and methods, while “replicability” refers to a different team arriving at the same results using the original author's artifacts. - from Understanding Reproducibility and Replicability, National institutes of health USA, 7 mai 2019. + +### 1.2 Un po' di vocabolario / Gergo dei dati + +In questa sezione troverete un elenco di termini spesso utilizzati nell'ambito della gestione dei dati della ricerca. + +#### Dati della ricerca + +**Cosa sono i dati della ricerca? (Research Data)**  + +4 Definizioni per dimostrare che ciò che la comprensione dei "dati della ricerca"  varia da ricercatore a ricercatore, e questo dipende principalmente dal significato di questi dati nel processo di ricerca. I dati della ricerca esistono in molti formati, che possono essere letti con altrettanti tipi di software. Qui sotto potete vedere una serie di definizioni di dati di ricerca. + +- "*Research data constitute primary research data (the raw, rough measurements or observation) and secondary research data (the results after the data have been processed by a researcher (recoded, combined, categorised, visualised, etc.))."*[Università di Utrecht, 2016](https://www.uu.nl/sites/default/files/university_policy_framework_for_research_data_utrecht_university_-_january_2016.pdf) +=> I dati della ricerca sono costituiti da dati primari (le misurazioni o le osservazioni grezze e approssimative) e dati secondari (i risultati dopo che i dati sono stati elaborati da un ricercatore (ricodificati, combinati, categorizzati, visualizzati, ecc.). + +- "Research data may be facts, observations, interviews, recordings, measurements, experiments, simulations and software; numerical, descriptive and visual; raw, cleaned up and processed; they may or may not support an actual or intended publication; and may be stored and exchanged in various formats on various storage media". [Van Berchum & Grootveld, 2017](http://hdl.handle.net/20.500.11755/a9539a60-ecef-4e62-a998-0fda190b303b) +=> "I dati della ricerca possono essere fatti, osservazioni, interviste, registrazioni, misurazioni, esperimenti, simulazioni e software; numerici, descrittivi e visivi; grezzi, ripuliti ed elaborati; possono supportare o meno una pubblicazione effettiva o prevista; e possono essere archiviati e scambiati in vari formati su vari supporti di memorizzazione." + +- "Research data are the factual records (numerical scores, textual records, images and sounds) used as primary sources for scientific research, and that are commonly accepted in the scientific community as necessary to validate research findings. A research data set constitutes a systematic, partial representation of the subject being investigated." [OCSE, 2007](http://www.oecd.org/sti/inno/38500813.pdf)" +=> "sono le registrazioni fattuali (punteggi numerici, registrazioni testuali, immagini e suoni) utilizzate come fonti primarie per la ricerca scientifica e che sono comunemente accettate nella comunità scientifica come necessarie per convalidare i risultati della ricerca. Un set di dati di ricerca costituisce una rappresentazione sistematica e parziale del soggetto indagato ". + + **5 modi di guardare i dati della ricerca** + +- **Come vengono raccolti o ottenuti i dati?**  +Esistono vari modi: attraverso esperimenti, simulazioni, osservazioni, dati derivati o ricerca di fonti. + +- **Quali sono le forme che assumono i dati?**  +I dati della ricerca sono spesso definiti dalla forma in cui vengono registrati. Possono essere ad esempio i documenti di testo, i fogli di calcolo, i questionari, le trascrizioni e i libri di codice, le cassette audio e video, le fotografie e i filmati, i manufatti, le diapositive, gli schemi di database, i protocolli, i metadati e altri file di dati come i rapporti della ricerca bibliografica e gli archivi di posta elettronica. + +- **In quali formati vengono memorizzati i dati?** +Guarda il formato dei dati in cui sono memorizzati i diversi tipi di dati (testuali, numerici, multimediali, strutturati, codice software, ecc.). I dati filmati come * .mpg o * .avi, e i file di testo come * .docx, * .pdf o * .rtf.. + +- **Qual è la dimensione dei file di dati?** +La dimensione dei file di dati è importante, così come la loro complessità. La gestione di un set di dati relativamente piccolo e semplice pone sfide diverse rispetto alla gestione di database grandi e complessi. + +- **A quale fase corrispondono nel ciclo di vita della ricerca?** +Le diverse fasi della vita dei dati di ricerca hanno ciascuna le proprie sfide per la gestione dei dati di ricerca. + + +#### Research lifecycle +Un modello di ciclo di vita consente di capire come si conciliano le varie fasi della vita della ricerca e dei dati di ricerca e come le scelte fatte in una fase influenzano la qualità dei dati nell'altra. In questo modo è possibile spostare la prospettiva dal breve al lungo termine: cosa vogliamo da questi dati di ricerca? + +I dati della ricerca hanno una durata più lunga rispetto al momento in cui vengono generati. Un modo di guardare a questo è con un cosiddetto ciclo di vita della ricerca. In questa sezione, spiegheremo il concetto in modo più dettagliato. +##### Vari rappresentazioni +Un modello del ciclo di vita fornisce informazioni su come le varie fasi della vita della ricerca e dei dati della ricerca si incastrano e su come le scelte che fai in una fase influenzano la qualità dei dati nell'altra. In questo modo è possibile spostare la prospettiva dal breve al lungo termine: cosa vogliamo da questi dati di ricerca?  + +Ci sono molti cicli di vita in circolazione, focalizzati su un certo uso o su un certo gruppo di utenti. + +Guardiamo un modello semplice fatto dai colleghi dell'Università di Bologna: Bianca Gualandi image. incentrato sul data management, con una sezione su data handling, cioè la manipolazione dei dati. + +- **Plan**: descrizione dei dati che saranno compilati, come i dati saranno gestiti e resi accessibili per tutta la loro vita. +* **Re-use** and **Collect**: corrisponde alla fase di raccolta dati (illustrata in Figura 5.1). Può includere sia dati primari (grezzi) che elaborati. +* **Store** data (and share) - archiviare, i dati vengono descritti in modo adeguato (seguendo standard quando ci sono) +* **Analyse** data +* **Deposit** data - assicurarsi che i dati siano accessibili in futuro, in particolare garantendo che i dati siano archiviati in modo tale che altri possano utilizzarli (in particolare memorizzandoli in un repository di dati). seguendo i principi FAIR. + +Un altro modello frequentemente usato è quello, in 6 tappe: + +(1) Pianificazione della ricerca + +(2) Raccolta dei dati + +(3) Elaborazione e analisi dei dati + +(4) Pubblicazione e condivisione dei dati  + +(5) Conservazione dei dati  + +(6) Riuso dei dati  + + +Potete Vedere anche il Ciclo di vita della ricerca incentrato sugli strumenti di ricerca che possono essere utilizzati nelle diverse fasi del flusso di lavoro. **Bosman & Kramer**, 2015. ADD IMAGE  + +#### FAIR +Nella pratica della scienza aperta spesso si sente nominare l'acronimo FAIR in riferimento ai dati. Si tratta di una serie di principi per la gestione dei dati della ricerca. + +**Dati FAIR:** se la gestione dei dati viene eseguita secondo i principi FAIR ([Wilkinson, 2016](https://www.nature.com/articles/sdata201618)) i dati della ricerca saranno: reperibili, accessibili, interoperabili, riusabili. + +Riguardano tutti gli aspetti da curare per usare al meglio uno degli strumenti principali della scienza aperta. Documentazione, formati, identificatori persistenti, licenze, metadati.  + +Definiti da un gruppo di esperti tra il 2014 e il 2016, i cosiddetti principi guida per rendere i dati FAIR sono 15 principi di natura tecnica, da cui derivano una serie di buone pratiche interconnesse tra loro che entrano in gioco in tutto il ciclo di vita dei dati della ricerca: dalla pianificazione alla raccolta, dall’analisi alla condivisione, dalla conservazione al riuso. + +L’acronimo FAIR in inglese è composto dalle parole Findable, Accessible, Interoperable e Reusable - in italiano trovabili, accessibili, interoperabili, riutilizzabili: sono i requisiti che i dati e i risultati della ricerca dovrebbero avere per aderire al modello della scienza aperta, in modo che questi dati siano rintracciabili all’interno della produzione scientifica e possano agevolare il riuso, quando possibile, nella produzione di nuova conoscenza. + +I principi FAIR sono ormai parte integrante del panorama della gestione dei dati e costituiscono la base del piano di costruzione dell '[European Open Science Cloud](https://datasupport.falco213.lcube-server.de/start-de-cursus/iv-oogstfase/european-open-science-cloud). + +Brevemente, senza entrare nel dettaglio: +F: Assicurarsi che i dati possano essere trovati in modo persistente/a lungo termine +A: Assicurarsi che uomo e macchina possano accedere ai dati. +I: Assicurarsi che i computer possano riconoscere e combinare formati di dati e metadati. +R: Assicurarsi che i dati possano essere utilizzati e interpretati. + +Lo vedremo dopo ma una delle [raccomandazioni della Commissione europea](https://research-and-innovation.ec.europa.eu/strategy/strategy-2020-2024/our-digital-future/open-science/european-open-science-cloud-eosc_en) (2017) per rendere i dati FAIR è pubblicarli in un archivio di dati affidabile che aderisca ai principi FAIR. Come un tale archivio di dati gestisca esattamente questo non è qualcosa che un ricercatore deve sapere esattamente.  + +#### **Recap** + +**Open is NOT FAIR** : ricordatevi: +rendere i dati FAIR non comporta in automatico la loro completa apertura. Anche se nell'Open Science si tende idealmente alla maggiore circolazione possibile dei contenuti scientifici, non sempre è possibile rilasciare con una licenza open i dati o altri tipi di prodotti della ricerca.  + +Ci sono casi in cui per esempio i dati vanno protetti per esigenze legali o etiche. Per dati con questo tipo di limitazioni il principio di accessibilità va inteso come descrizione accurata attraverso metadati appropriati, che contengano informazioni chiare sulla possibilità e la modalità di accedere ai dati. + +Questo implica che si dovrebbero fornire le condizioni esatte in cui i dati sono accessibili: ad esempio specificare se è richiesta l’autenticazione dell’utente che intende scaricare il set di dati o l’invio di una richiesta di autorizzazione all’accesso (autorizzazione che può anche essere negata).  +Anche i dati fortemente protetti, per qualsiasi tipo di esigenza legale o etica, possono essere resi FAIR! + +Quello che conta è piuttosto che la comunità scientifica sappia dell’esistenza di determinati prodotti della ricerca, in modo da non disperdere conoscenza e sforzi già fatti da altri ricercatori. Questo aspetto è molto importante e risponde al duplice scopo di migliorare l’impatto della ricerca (più visibilità ai risultati) e la sua efficienza (evitare di duplicare gli sforzi - per esempio raccogliere due volte gli stessi dati - e incentivare il riuso di risultati già prodotti). + +Dopo vedremo che FAIR non è solo per i dati , ma anche per i risultati della ricerca! Vedramo come FAIR si puo applicare al training con un esempio. + +**Open Data**: un dato o contenuto è aperto se chiunque è libero di utilizzarlo, riutilizzarlo e ridistribuirlo - soggetto solo, al massimo, all'obbligo di attribuirlo e/o condividerlo. | [Open Knowledge Foundation (n.d.)](http://opendefinition.org/) + +**RDM**: la gestione dei dati della ricerca si riferisce al modo in cui gestisci, organizzi e strutturi i tuoi dati di ricerca durante tutto il processo di ricerca. La gestione dei dati +- Inizia con le tue considerazioni iniziali su ciò che sarà necessario per utilizzare o raccogliere il tuo particolare tipo di dati; +- Include misure per mantenere l'integrità dei dati, assicurandosi che non vengano persi a causa di incidenti tecnici e che le persone giuste possano accedere ai dati al momento opportuno;  +- Guarda verso il futuro, chiarendo che dovresti fornire una documentazione dettagliata e strutturata per poter condividere i tuoi dati con altri colleghi e prepararli alla disponibilità a lungo termine. |  [CESSDA, 2018](https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/1.-Piano/Vantaggi della gestione dei dati) + + Abbiamo capito cosa succede quando i dati non sono gestiti: +- documentazione manca +- perdita di dati +- obsolescenza dei formati e strumenti software + + + +### 1.3 Data stewards + +Per gli istituti di ricerca, comprese le università, i centri medici universitari, le università di scienze applicate e altri organismi di ricerca, sta diventando sempre più chiaro che la professionalizzazione della gestione dei dati è importante; che i data steward sono indispensabili e che i vari ruoli di data stewardship devono essere collocati in un quadro organizzativo + +#### Vari profili/ruoli +In generale le competenze dei data steward riguardano: +- come i dati vengono raccolti e gestiti in un dominio di ricerca specifico +- aspetti legali ed etici della gestione dei dati +- esperienza nell'ambito della ricerca, programmazione, gestione di database e infrastruttura di ricerca +- capacità comunicative, didattiche e organizzative +- parlano la stessa lingua dei ricercatori +- percorso di cariera misto - ne puramente scientifico, né tecnico + +Questa rappresentazione identifica i ruoli dei Data Steward in Danemarca e in Olanda. +Vede queste 3 categorie di ruoli: Research, Infra, Policy +- Research data stewards (analisti): competenze in pratiche di data management specifiche per le discipline, lavorano a stretto contatto con i ricercatori +- Infrastructure data stewards (sviluppatori): ruolo di facilitatore, supervisiona la realizazzione dell'infrastruttura tecnica per i FAIR data. Alinea i bisogni dei ricercatori con l'infrastruttura necessaria per i dati. +- Policy data stewards (amministratori e agenti di cambiamento) : sviluppano i regolamenti e le linee guida istituzionali. I loro soggetti di riferimento sono i politici, gli enti finanziatori e il management/admin di ricerca e universitario. + +[QUI FAIRE UN QUIZZ] + +## 2. Open Access and Open Data + +### 2.1 Di cosa si tratta? + +MIX LESSON 5 MACERATA AND MAYBE 6 + +**Open Science and Open Access European Policy** + +Lo sapete, l’Open Science ed è anche una priorità politica per la Commissione europea, sia nel processo verso la costituzione dello European Open Science Cloud (EOSC) il cui obiettivo è “rendere l’Open Science il nuovo standard di ricerca” (cfr 10.1), sia nel programma Horizon Europe in cui le pratiche Open sono riconosciute come standard per la ricerca e innovazione (cfr. 7.2) e sono state inserite fra i criteri di valutazione delle proposte di progetto (cfr. 7.3).  + +Vedete qui che i benefici della condivisione del sapere e dei dati sono sottolineati (see corresponding slide) + +**EOSC** +EOSC è fondamentale per la scienza aperta e la trasformazione digitale della scienza (oggi ricerca basata sui dati, systems of systems thinking)  + +Lo EOSC Offre la possibilità di accedere e riutilizzare tutti i dati di ricerca finanziati con fondi pubblici in Europa, in tutte le discipline scientifiche in tutti paesi.  + +La Commissione intende sbloccare il potenziale di riutilizzo di diversi tipi di dati e facilitarne la libera circolazione transfrontaliera al fine di realizzare un mercato unico digitale europeo, a beneficio dell'economia e della società. + +Sostenendo la politica dell'UE in materia di scienza aperta, il cloud [europeo per la scienza aperta (European Open Science Cloud](https://ec.europa.eu/info/research-and-innovation/strategy/strategy-2020-2024/our-digital-future/open-science/european-open-science-cloud-eosc_en)[EN•••](https://digital-strategy.ec.europa.eu/it/policies/open-science-cloud#modal) — EOSC) mira a conferire all'UE un ruolo guida a livello mondiale nella gestione dei dati e a garantire che gli scienziati europei possano approfittare pienamente dei benefici della scienza basata sui dati. + +Il [portale EOSC](https://eosc-portal.eu/) fornisce un gateway per informazioni e risorse in EOSC + +Nella sezione  (CHECK IF STILL TRUE) +- About: informazioni sullo EOSC, costruzione, glossario +- Get inspired: use cases (mirano a fare vedere come servizi dello EOSC possono aiutare a risolvere problemi di ricerca) e storie sullo EOSC in pratica +- Policy: politiche per l’OS in nei paesi membri dell’UE  +e poi il marketplace che funziona come una piattaforma di discovery che contiene vari tipi di risorse (pubblicazioni, dati, software, servizi, formazione etc) + +** +L’Open Access si riferisce quindi solo a uno specifico componente dell’Open Science, ovvero la condivisione della conoscenza scientifica attraverso l’accesso ai risultati della ricerca (tramite articoli, atti di convegno, monografie, capitoli di libri, ecc.) rendendone i contenuti liberamente e apertamente disponibili, con una licenza aperta che ne consenta il riutilizzo. + +Open Access significa che un qualsiasi prodotto della ricerca è disponibile per chiunque, senza restrizioni di alcun tipo. Si può realizzare in due modi principali: Green e Gold. + + + +** + +###### **Open Data** +I dati della ricerca aperti sono dati accessibili, ri-utilizzabili, modificabili e ri-distribuibili liberamente per finalità accademiche, didattiche e non solo. Idealmente, i dati aperti possono essere ri-utilizzati o ri-distribuiti senza restrizioni, qualora la licenza lo permetta. In casi eccezionali, ad esempio per proteggere l’identità delle persone fisiche, sono stabilite delle restrizioni speciali o limitazioni all’accesso ai dati. La condivisione aperta dei dati ne aumenta l’esposizione contribuendo in questo modo a creare i presupposti per la verifica e la riproducibilità della ricerca nonché all’avvio di nuovi percorsi per una più ampia collaborazione. Al massimo, i dati aperti possono essere soggetti all'obbligo di attribuzione e condivisione + +###### La pubblicazione dei dati +La maggior parte dei ricercatori ha, chi più chi meno, esperienza con la pubblicazione degli articoli di ricerca e delle monografie ad accesso aperto. In tempi più recenti, e per le ragioni di cui abbiamo scritto sopra, la pubblicazione dei dati della ricerca ha assunto via via sempre più importanza ed interesse. Sono sempre di più i finanziatori che richiedono che i dati prodotti dai progetti di ricerca che hanno finanziato siano reperibili, accessibili e il più possibile aperti. + +Esistono diversi modi per rendere i dati della ricerca accessibili, tra questi, ad esempio ([Wikipedia](https://en.wikipedia.org/wiki/Data_publishing)): + +- Pubblicando i dati della ricerca come materiale supplementare in allegato ad un [articolo di ricerca](https://en.wikipedia.org/wiki/Research_article), tipicamente con dei file di dati pubblicati dall'editore dell'articolo. + +- Postando i dati della ricerca su un sito web accessibile al pubblico, con dei file che possono essere scaricati. + +- Depositando i dati in un archivio progettato per supportare la pubblicazione dei dati della ricerca, ad esempio, [Dataverse](https://en.wikipedia.org/wiki/Dataverse), [Dryad](https://en.wikipedia.org/wiki/Dryad_(repository)), [figshare](https://en.wikipedia.org/wiki/Figshare), [Zenodo](https://en.wikipedia.org/wiki/Zenodo) + +- Attraverso un considerevole numero di archivi generalisti e disciplinari oppure di archivi di dati specifici di una determinata disciplina che possono fornire un sostegno supplementare ai ricercatori nel momento in cui vogliono depositare i loro dati. + +- Pubblicando un documento dati sul set di dati, che può essere pubblicato come pre-print su una rivista o su una rivista di dati ad hoc per i documenti di supporto dati. I dati possono essere pubblicati su una rivista oppure separatamente in un archivio di dati. Tra le riviste di dati segnaliamo la [Scientific Data](https://www.nature.com/sdata/) (by SpringerNature) e la [Data Science Journal](http://www.codata.org/publications/data-science-journal) (by CODATA). L’elenco completo delle riviste di dati è disponibile in [Candela et al](https://doi.org/10.1002%2Fasi.23358). + + +La guida CESSDA ERIC [Expert tour guide on Data Management](https://www.cessda.eu/Research-Infrastructure/Training/Expert-tour-guide-on-Data-Management/6.-Archive-Publish/Data-publishing-routes) su una gestione esperta dei dati della ricerca fornisce una panoramica dei pro e contro delle diverse opzioni disponibili per la pubblicazione dei dati. A volte, l’ente finanziatore o un altro soggetto esterno richiede l'utilizzo di uno specifico archivio. Qualora non si fosse vincolati, viceversa, ad un’opzione specifica, è possibile vagliare -in ordine di preferenza- le seguenti [raccomandazioni di OpenAIRE](https://www.openaire.eu/opendatapilot-repository-guide): + +1. Utilizzare un archivio per dati della ricerca esterno o un archivio dati già reso disponibile per la propria disciplina/ambito di ricerca in modo da conservare i dati secondo gli standard riconosciuti da quella disciplina/ambito di ricerca specifico. + +2. Laddove sia disponibile, utilizzare un archivio dati istituzionale o i servizi per la gestione dei dati della ricerca secondo le disposizioni concordate dal proprio gruppo di ricerca. + +3. Utilizzare un archivio dati gratuito come [Dataverse](https://dataverse.org/), [Dryad](https://datadryad.org/pages/faq#depositing-cost), [figshare](https://figshare.com/) o [Zenodo](https://zenodo.org/). + +4. Cercare altri archivi di dati in [re3data](https://www.re3data.org/). Non esiste un'unica opzione di filtro in re3data che copra i principi FAIR, ma considerando le seguenti opzioni di filtro sarà utile per trovare degli archivi FAIR-compatibili: categorie di accesso, licenze di utilizzo dei dati, archivi dati affidabili (certificati o aderenti esplicitamente agli standard di archiviazione) e se un archivio fornisce ai dati un identificativo persistente (PID). Un altro aspetto da tenere in considerazione è se l’archivio supporti o meno l’archiviazione di diverse versioni. + +E’ auspicabile che si valuti dove depositare e pubblicare i dati della ricerca già con la predisposizione di un piano di gestione dei dati di ricerca. CESSDA evidenzia alcuni aspetti pratici, che si dovrebbe prendere in considerazione. Ad esempio: quali dati e relativi metadati associati, documentazione e codici verranno depositati? Per quanto tempo è necessario conservare i dati? Per quanto tempo i dati devono poter essere riutilizzabili? Come verranno resi disponibili i dati? Per quale tipologia di accessibilità si opterà? Ulteriori domande si possono trovare in [Adatta il tuo Piano di gestione dei dati: parte 6](https://www.cessda.eu/Research-Infrastructure/Training/Expert-Tour-Guide-on-Data-Management/6.-Archive-Publish/Adapt-your-DMP-part-6). D'altra parte non si dimentichi di controllare se l’archivio prescelto soddisfa i requisiti posti dalla ricerca e dall’ente finanziatore. Alcuni depositi sono già stati certificati. Ad esempio, CoreTrustSeal che certifica l’affidabilità e il soddisfacimento dei requisiti dei Core Trustworthy Data Repositories Requirements. Vale la pena menzionare che alcuni archivi disciplinari/settoriali specifici accettano solo dati qualitativamente alti vale a dire solo quei dati che dimostrano di avere un alto potenziale di riutilizzo e che possono essere condivisi pubblicamente. + +Dal momento che ci sono diversi modi per pubblicare i dati della ricerca, è bene evidenziare il fatto che un set di dati per poter "contare" come una pubblicazione, dovrebbe essere sottoposto ad un processo di pubblicazione simile a quello di un articolo ([Brase et al., 2009](https://doi.org/10.3233/ISU-2009-0595))e dovrebbe essere: + +- Adeguatamente corredato di metadati; + +- Essere stato sottoposto ad una verifica qualitativa, ad esempio, sul contenuto dello studio, della metodologia, della pertinenza, della coerenza giuridica e della documentazione dei materiali; + +- Facilmente reperibile e rintracciabile in cataloghi (o banche dati); + +- Citabile in articoli. + + + ###### Citazione dati +I servizi per la citazione dati aiutano le comunità di ricercatori a scoprire, identificare e citare i dati della ricerca (e spesso altri oggetti di ricerca) in maniera affidabile. Ciò comporta tipicamente la creazione e l'assegnazione di un identificatore digitale di un oggetto (DOI) e metadati di accompagnamento attraverso servizi come [DataCite](https://www.datacite.org/), e può essere integrato nei flussi di lavoro e gli standard di ricerca. Si tratta di un ambito in via di sviluppo e comprende molti aspetti come il fatto di far capire agli editori l'importanza di un'adeguata citazione di dati negli articoli, nonché la possibilità di collegare gli articoli di ricerca a qualsiasi dato correlato. In questo modo, i dati citabili diventano contributi legittimi al processo di comunicazione scientifica e possono contribuire a spianare la strada a nuove metriche e modelli di pubblicazione che accreditano e premiano la condivisione dei dati. + +Come prima mossa iniziale verso l’adozione di buone pratiche per la citazione dati, il Gruppo di Sintesi delle Citazioni Dati di FORCE11 ha presentato una [Dichiarazione congiunta sui principi per la citazione dati](https://doi.org/10.25490/a97f-egyk), destinata sia ai ricercatori sia ai fornitori di servizi dati. Conformemente a questi principi, gli archivi dati, di solito, forniscono ai ricercatori una citazione di riferimento che possono utilizzare quando si riferiscono a un determinato set di dati. + + ###### **Accesso aperto ai risultati della ricerca pubblicati** (Open Access) + Open Access significa accesso libero e senza barriere al sapere scientifico, come viene enunciato nella Dichiarazione di Berlino. + +> _"La nostra missione di disseminazione della conoscenza è incompleta se l’informazione non è resa largamente e prontamente disponibile alla società. Occorre sostenere nuove possibilità di disseminazione della conoscenza, non sol paradigma dell’accesso aperto via Internet._      +> _Definiamo l’accesso aperto come una fonte estesa del sapere umano e del patrimonio culturale che siano stati validati dalla comunità scientifica.”_ +> +> + Per accesso aperto alle pubblicazioni della ricerca, vale a dire articoli e libri -inter alia-, si intende il fatto che questi prodotti sono resi accessibili online, a titolo gratuito, a disposizione di qualsiasi lettore e senza alcuna restrizione di tipo tecnico (ad esempio, iscrizione obbligatoria o registrazione ad una specifica piattaforma). La forma più restrittiva di accesso aperto consente che queste pubblicazioni possano essere lette online, scaricate e stampate. Idealmente, dovrebbero poter essere concessi dei diritti aggiuntivi come -ad esempio- il diritto di riprodurre, condividere, cercare, linkare, scansionare ed estrarre (dati). L’accesso aperto può essere realizzato attraverso due vie principali e non esclusive: + +- La via verde (auto-archiviazione)\: l'opera pubblicata o il manoscritto finale referato e accettato per la pubblicazione viene reso liberamente e pubblicamente accessibile dall'autore o dai gestori di un archivio online. Alcuni editori chiedono che l'accesso aperto sia concesso solo dopo che è trascorso un periodo di embargo. Il periodo di embargo varia e può durare diversi mesi o diversi anni. Di solito, delle pubblicazioni depositate in un archivio ma sotto embargo, sono accessibili in maniera aperta almeno i metadati. + +- CAMBIARE TESTO QUI : Parlare Gold OA e Diamond OA. https://www.scienceeurope.org/media/uwwbcxff/202302-diamond-oa-piano-di-azione.pdf La via aurea (la pubblicazione in accesso aperto)\: il lavoro pubblicato è reso disponibile in accesso aperto dall’editore subito dopo la pubblicazione. Il modello economico più frequente prevede il pagamento di un una tantum da parte degli autori (costi di pubblicazione solitamente definiti APC (acronimo inglese per article processing charges) oppure BPC (book processing charges). Si parla invece di accesso aperto ibrido quando il contenuto in accesso aperto su riviste scientifiche, atti di convegno e curatele in particolar modo, si combina con contenuti che prevedono la sottoscrizione di un abbonamento o l’acquisto.* + +## Horizon Europe: OS and RDM / Managing data in EU-funded project + +**metodologia OS** +Nella metodologia del progetto è fondamentale specificare (in una pagina) come si intende integrare le pratiche Open Science obbligatorie e raccomandate, adattandole alla specifica natura del progetto. (show how your understanding and knowledge and expertise in terms of OS practices will help reach project objectives ) + +Quindi avrete a disposizione una pagina nella metodologia per descrivere come le pratiche dell'open science vengono integrate nella metodologia che proponete per il vostro progetto.   poi avete a disposizione un'altra mezza pagina per descrivere la strategia di gestione dei dati .  + +Ricordano nel template che l’OS è un approccio basato sulla condivisione sistematica della conoscenza e dei strumenti e prodotti della ricerca il prima possibile, il piu ampiamente possibile.  + +E poi ci danno una lista non esaustiva di qualche OS practices + +**pratiche OS** +Fra le pratiche obbligatorie, bisogna specificare come si realizzerà l’Open Access alle pubblicazioni e ai dati e quale repository si userà per il deposito di letteratura, dati e altri output, quale licenza si intende usare per questi prodotti, e come si assicurerà l’accesso a strumenti e dati utili per validare e riusare i risultati. +Per l’Open Access alle pubblicazioni sono disponibili 3 opzioni: +- pubblicazione su Open Research Europe +- pubblicazione in una rivista Open Access +- pubblicazione in una rivista ad abbonamento ma mantenendo sufficienti diritti per poter depositare una versione posteriore alla peer review e dare accesso immediato: attenzione dunque a mantenere i diritti per poterlo fare, aggiungendo ai contratti editoriali una clausola specifica per Horizon Europe, come quella presente nella Guida di Programma e riportata di seguito: + +This work was funded by the Εuropean Union under the Horizon Europe grant [grant number]. As set out in the Grant Agreement, beneficiaries must ensure that at the latest at the time of publication, open access is provided via a trusted repository to the published version or the final peer-reviewed manuscript accepted for publication under the latest available version of the Creative Commons Attribution International Public Licence (CC BY) or a licence with equivalent rights. CC BY-NC, CC BY-ND, CC BY-NC-ND or equivalent licenses could be applied to long-text formats. Horizon Europe programme Guide, 22 november 2021, p. 49. + +Fra le pratiche raccomandate, sono da specificare qui eventuali elementi di collaborazione, pratiche di riproducibilità, l’uso di licenze aperte, partecipazione a processi di open peer review, aspetti di citizen science o legami con infrastrutture di ricerca.  + +Se nessuna delle pratiche Open Science risulta adatta alla proposta di progetto, occorre fornire solide giustificazioni e motivazioni in questa sezione. + +**metodologia RDM** +Qui viene richesta informazioni sulla Gestione dei dati e di altri prodotti della ricerca secondo i principi FAIR (e sarà il modulo 2 di oggi).  + +In questa sezione va sinteticamente spiegato (in una pagina) come verranno gestiti responsabilmente i dati e gli altri elementi della ricerca, in accordo con i [principi  FAIR](https://open-science.it/article?rpk=160581&prs_sel=p_researcher&tpc_sel=t_gestione_dei_dati_della_ricerca). In sostanza si fornisce uno schema di quello che poi sarà il [DMP (Data Management Plan)](https://open-science.it/article?rpk=101032&prs_sel=p_researcher&tpc_sel=t_gestione_dei_dati_della_ricerca), che in seguito se il progetto viene approvato deve essere presentato al mese 6 e aggiornato durante il progetto.  + +Tra gli aspetti da includere nello schema ci sono: +- informazioni sui dati: che tipo di dati si intende usare (sperimentali, osservazioni, da produrre o già esistenti e così via), il loro volume, i formati eccetera. +- l’uso di identificativi univoci e metadati (dunque gli elementi essenziali per rendere i prodotti digitali rintracciabili o ‘findable’). +- condizioni di accesso: se i dati saranno chiusi, ristretti o aperti; e dove saranno depositati. +- condizioni di riuso, cioè con quali licenze verranno rilasciati; se possibile specificare se ci sarà una documentazione di supporto al riuso. +- eventuali standard e ontologie, la cui descrizione può facilitare l’interoperabilità. +- costi per la gestione dei dati e per il personale che se ne occupa + +**pratiche RDM** +Non mi soffermo perché la RDM e FAIR sarà il tema del modulo successivo oggi ma l’avete capito :  + +Il Research data management è un richiesto e deve aderire ai principi per le politiche della commissione europea che mirano sostanzialmente a diffondere le pratiche della corretta gestione dei dati. E quindi c'è sempre il data management plan che viene previsto come deliverable obbligatorio, deve essere aderente ai principi FAIR ma soprattutto, lo ripeto non ci sarà più possibilità di opt out.  + +Per l'intero progetto i dati devono essere gestiti secondo FAIR e poi aperti il più possibile, chiusi solo quando necessario.  + + serie di motivazioni che voi potete inserire nel data management plan per dimostrare e motivare il fatto che quel dataset specifico non viene aperto, ma l'accesso a quel data set in qualche modo ristretto. Sono sempre le stesse ragioni che avevamo in horizon 2020, quindi c'è uno sfruttamento commerciale industriale, motivi di sicurezza, protezione dei dati personali, raggiungimento degli obiettivi del progetto oppure perché il vostro progetto non produce nessun dato. Chiaramente potrebbero esserci altre ragioni e se ci sono e sono legittime le potete portare all'attenzione del project officer attraverso il data management plan.  + +Attenzione perché anche qui ancora una volta non basta scrivere non apro i miei dati perché - ma questa motivazione deve essere accettata dal progetto officer. Quindi è importante anche essere consapevoli dei motivi , di conoscere appieno i motivi per cui questi dati non possono essere aperti. + +**RECAP** Elena Giglia image Come applicare l'OS alla proposta H Europe? +I vari passi sono rappresentati qui.  +questa guida utile che ha scritto elena giglia, sulla base di una guida che e stata proposta mi sembra dal DANS/TU DELFT?.  + +Questa guida vi sarà molto utile perché in modo molto schematico vi aiuta a districarvi fra le i vari obblighi e questo cambiamento radicale di impostazione + + + +___________________________________ + +### Conclusions + +Rendere i dati aperti non è un'attività banale. Non si tratta semplicemente di collocare un set di dati su un cloud drive. Tuttavia, se viene fatto correttamente, i dati aperti sono disponibili per il riutilizzo. Il riutilizzo può coinvolgere completamente un team di ricerca diverso o potrebbe riguardare lo stesso team di ricerca che deve continuare il lavoro dopo che un membro del team responsabile dei dati si è spostato. Ciò significa che devi considerare i dati come parte del ciclo di vita ed è importante pianificare (un Piano di Gestione dei Dati) prima di creare i dati per assicurarsi che siano conservati in modo appropriato. Parte dell'operazione di rendere i tuoi dati FAIR consiste nel fornire metadati che descrivono i dati che stai depositando. Infine, non sentirti obbligato a fare tutto da zero,  ci sono vari luoghi dove puoi trovare supporto per rendere i tuoi dati aperti e FAIR. + +______________ + +**Adapted fro Open Sci Git HUb** + +**Informazioni sui DMP (livello introduttivo)** + +Dato che i passaggi precedenti non sono banali prima di iniziare a raccogliere, fascicolare o generare un set di dati, è utile pianificare cosa fare con i dati. Questo è indicato come un piano di gestione dei dati o DMP in breve. + + + +Un DMP significa che puoi pensare in anticipo a eventuali problemi particolari che potrebbero emergere in termini di gestione dei dati, come il costo potenziale di archiviazione, se i dati devono essere resi anonimi e così via. Una descrizione dettagliata di ciò che si dovrebbe inserire in una DMP è descritta [qui](https://the-turing-way.netlify.app/reproducible-research/rdm/rdm-dmp.html) [3]. Come delineato in questo [documento dell'UKRI](https://www.ukri.org/councils/stfc/guidance-for-applicants/what-to-include-in-your-proposal/data-management-plan/) [4], il finanziatore centrale per il Regno Unito, questi possono includere risposte a domande come + +* Che tipo di dati verranno generati o conservati? Ciò potrebbe includere formati di dati, stime approssimative della quantità di dati da archiviare durante un progetto di ricerca e allo stesso modo cosa verrà conservato oltre la durata del progetto? + +* Che tipo di metadati verranno utilizzati e conservati. Vale la pena notare che uno degli aspetti più dettagliati dei principi FAIR è quello di mantenere disponibili i metadati del set di dati anche se il set di dati originale non esiste più. + +* Dove devono essere conservati i dati? cioè quale repository verrà utilizzato (i repository sono discussi nella lezione successiva). Quanto lunga dovrebbe essere? Cinque anni? dieci anni?) Più concretamente, le normative sui dati possono richiedere che determinati dati siano conservati in determinati modi per almeno un certo periodo di tempo. Ciò varierà a seconda del tipo di dati (ad es. cartelle cliniche, statistiche sulla popolazione). Si consiglia di esaminare queste date di scadenza in letteratura e/o nelle linee guida della politica.  + +* Come verranno archiviati i dati privati in modo che siano conservati in modo sicuro? + +I DMP non sono pensati per essere documenti esaustivi! Il punto importante è che delineano ciò che un ricercatore o un team di ricerca prevede di fare con i loro dati ben prima che vengano raccolti e possono identificare eventuali passi da compiere piuttosto che affrontare una sfida importante ora. + + + +Le DMP sono [sempre più utilizzate dai finanziatori](https://dmptool.org/public_templates) e dalle loro istituzioni come mezzo per far sì che i ricercatori definiscano cosa faranno con i loro dati in una proposta di ricerca. Le proposte di ricerca spesso richiedono DMP, e quindi le DMP sono spesso la "punta di diamante" per i ricercatori rispetto alla scienza aperta [5]. Un buon DMP è un criterio per la valutazione nelle domande di sovvenzione e quindi fare un buon DMP aiuterà a finanziare la tua sovvenzione. + + + +------- + +Gli archivi di dati saranno discussi nella prossima lezione. I repository specifici del dominio spesso forniscono requisiti più precisi sui metadati (un altro motivo per utilizzarli). + + +Se non ci sono linee guida, un semplice file README allegato ai dati è un inizio (per un esempio vedi [qui](https://cornell.app.box.com/v/ReadmeTemplate)), anche se è importante notare che idealmente si dovrebbe utilizzare uno schema di metadati che è descritto in modo molto più dettagliato [qui](https://www.dcc.ac.uk/guidance/standards) poiché i dati CORRETTI dovrebbero essere azionabili dalla macchina [7] [8]. + +------- + + + + + + + +____________________________________________ +### Resources +- Averkamp et al. (2018). Data packaging guide. [github.com/saverkamp/beyond-open-data/blob/master/DataGuide.md](https://github.com/saverkamp/beyond-open-data/blob/master/DataGuide.md). + +- Barend et al. (2017). Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud. [doi.org/10.3233/ISU-170824](https://doi.org/10.3233/ISU-170824) + +- Brase et al. (2009). Approach for a joint global registration agency for research data. [doi.org/10.3233/ISU-2009-0595](https://doi.org/10.3233/ISU-2009-0595) + +- Candela et al. (2015). Data journals: A survey. [doi.org/10.1002/asi.23358](https://doi.org/10.1002/asi.23358) + +- CESSDA Training Working Group (2017-2018a). CESSDA Data Management Expert Guide. Bergen, Norway: CESSDA ERIC. [cessda.eu/DMGuide](https://www.cessda.eu/Research-Infrastructure/Training/Expert-tour-guide-on-Data-Management) + +- CESSDA Training Working Group (2017-2018b). CESSDA Data Management Expert Guide: Citing your data. Bergen, Norway: CESSDA ERIC.[cessda.eu/DMGuide/citingdata](https://www.cessda.eu/Research-Infrastructure/Training/Expert-tour-guide-on-Data-Management/6.-Archive-Publish/Publishing-with-CESSDA-archives/Citing-your-data) + +- FAIRsharing.org (2016). FAIR. The FAIR Principles. [doi.org/10.25504/FAIRsharing.WWI10U](https://doi.org/10.25504/FAIRsharing.WWI10U) + +- Force 11 (n.y.). Guiding principles for Findable, Accessible, Interoperable, and Re-usable data publishing Version B1.0. [force11.org/fairprinciples](https://www.force11.org/fairprinciples) + +- Gorgolewski et al. (2013). Making data sharing count: a publication-based solution. [doi.org/10.3389/fnins.2013.00009](https://doi.org/10.3389/fnins.2013.00009) + +- Kratz and Strasser (2015). Making Data Count. [doi.org/10.1038/sdata.2015.39](https://www.nature.com/articles/sdata201539) + +- Piwowar and Vision (2013). Data reuse and the open data citation advantage. [doi.org/10.7717/peerj.175](https://doi.org/10.7717/peerj.175) + +- Wilkinson et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. [doi.org/10.1038/sdata.2016.18](https://doi.org/10.1038/sdata.2016.18) + +- Wilkinson et al. (2918). A design framework and exemplar metrics for FAIRness. [doi.org/10.1038/sdata.2018.118](https://doi.org/10.1038/sdata.2018.118) + + +#### Iniziative e progetti + +- DANS GDPR DataTags. [zingtree.com](https://zingtree.com/host.php?style=buttons&tree_id=442670046&persist_names=Restart&persist_node_ids=58#58) + +- FAIR Metrics. [fairmetrics.org](http://fairmetrics.org/) + +- GO FAIR Initiative. [go-fair.org](https://www.go-fair.org/) + +- The FAIR Data Principles explained. [go-fair.org](https://www.go-fair.org/fair-principles/) + +- 5★ OPEN DATA. [5stardata.info](http://5stardata.info/en/) \ No newline at end of file diff --git a/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content.md b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content.md index 276cb6ea..4b0efadc 100644 --- a/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content.md +++ b/resources/Research Data and Open Science course/Learning Unit 2/LU2-ResearchData-content.md @@ -15,6 +15,7 @@ tags: - are you a transparent researcher? - what is research data according to you? - do you care about your data ?] +- README ? the content in this LU is from Essentials 4 Data support https://datasupport.researchdata.nl/en/start-the-course/i-a-birds-eye-view/data-jargon/rdm-open-and-fair diff --git a/resources/index.md b/resources/index.md index 0b7992d6..85ae9e60 100644 --- a/resources/index.md +++ b/resources/index.md @@ -1,4 +1,4 @@ -IN CONSTRUCTION +THIS SITE IS IN CONSTRUCTION Here you will find materials on the course Research Data and Open Science. Resources for now are in Italian, except for a few titles.