Skip to content
This repository has been archived by the owner on May 17, 2024. It is now read-only.

BioDataScience-Course/sdd1_metagenomics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Analyse métagénomique de type shotgun sur 4 communautés microbiennes

Guyliann Engels, Raphael Conotte & Philippe Grosjean

Résumé

Ces données proviennent directement des recherches menées par le chercheur David Gillan de l’université de Mons et ses collaborateurs:

Paleomicrobiology to investigate copper resistance in bacteria : isolation and description of Cupriavidus necator B9 in the soil of a medieval foundry

Le document mis à votre disposition est un fichier Excel qui comprend deux feuilles :

  • raw
  • phylum_raw

Tâches

  • Organisez votre projet en un ensemble de sous-dossiers : analysis, R, images,…

  • Créez un rapport d’analyse organisé en section : introduction, Matériels et méthodes,…

  • Importez les données du fichier shot_gun_dcg.xlsx présent dans le dossier data.

  • De quel type de tableau de données s’agit-il ?

meta <- read("data/shot_gun_dcg.xlsx")
#> New names:
#> * `` -> ...1
  • Reproduisez ce graphique dans votre rapport

Compositon des communautés dans 4 types de sols ( règnes).

La fonction read() importe la première feuille si vous ne spécifiez pas la feuille que vous souhaitez. Cette fonction utilise en interne la fonction read_excel() pour importer les données au format xlsx.

  • Importez également la seconde feuille du fichier shot_gun_dcg.xlsx qui se nomme phylum_raw. Pour cela, utilisez l’aide de la fonction read_excel() pour voir comment faire.
?readxl::read_excel

La fonction ci-dessous permet de prendre connaissance des formats supportés par la fonction read()

data_types()
  • Produisez un graphique en barres afin de représenter les données de cette seconde feuille

  • Les données brutes de cette étude se trouvent dans le dossier raw (dans le dossier data), que-pensez vous de ce type d’encodage de données ? Détaillez votre réflexion

Challenges

  • Tentez de reproduire dans votre rapport, la figure 2 de l’article. (Fig. 2. Composition of the bacterial communities of 4 soil samples (Bacterial Phyla) as revealed by shotgun metagenomics and MG- RAST (% of sequences normalized by the number of sequences identified as Bacteria).)