Skip to content

Kravspec

Isak Sylvin edited this page Oct 28, 2024 · 1 revision

Framtagen: April 2024 Funktionalitet:

  1. Kunna köra mjukvaran som lokal mjukvara kopplad till Nanopore instrument
  2. Kunna köra på central server (Clin Genomics)
  3. Kunna köra på nationell server (NGP[WFM1] )[WFM2]    Skallkrav:
  • Ta emot fastq-filer från Nanopore namngivna med prov-ID. via drag n drop/uppladdning via utforskaren.[WFM3] 
  • Adaptortrimming
  • Kvalitet och längd-filtrering
  • Skapa filer för resultat[WFM4] .   Börkrav: 
  • Kunna ta emot shortread (Illumina) samt PacBio data[WFM5] .
  • Hantera metadata kopplat till providentitet[WFM6] 
  • Sammanfoga uppdelade fastq-filer till en stor per prov.
  • Exportera krona-visualisering till bildformat[WFM7] .     Användargränssnitt: Krav för drift: ·       Art-ID[WFM8]  ·       Genu-s och speciesnivå valbart. Varje enskild träff skall gå att bedöma utifrån likhet med databasen (procent identity[WFM9] ) ·       Möjlighet till semikvantifiering via krona, se nedan (skall visa både antal reads samt relative abundance-kvot[WFM10] ) ·       Visualisering via krona-diagram med taxonomisk grad från mitten och utåt innehållande familj, genus och species (gärna interaktivt genom att kunna expandera taxonomiska träffar) ·       Sammanslagen rapport (per batch) innehållande QC parametrar som: Längd, antal reads, mm[WFM11]  ·           Önskemål, ej skallkrav: ·       Koppla antal 16S kopior (artspecifikt) till semikvantifieringen. ·       Möjlighet att exkludera ospecifika fynd eller kontaminanter. (”bakgrund”) ·       Identifiera fynd som finns med i alla eller en majoritet av provern /körning. (Möjlig ”kontaminationsflagga”) ·       Bortfiltreringsmöjlighet av eventuella humana reads.

 [WFM1]Pipelinen är byggd med nextflow och singularity och borde funka på NGPn.  [WFM2]Pipelinen har testats på linux-server i örebro och mac-dator med docker (rekommenderas ej eftersom det går väldigt långsamt då).
Tror att den kommer vara för långsam för t.ex. gridion också men det har inte testats. Många cpu är bra att ha.  [WFM3]Då behövs ett grafisk interface. Nu finns pipelinen bara på command line. nf-core launch  [WFM4] [WFM4]qc och tabeller + krona skapas nu.    [WFM5]saknas idag  [WFM6]Vilken typ av metadata?
Idag kan man ange en samplesheet med barcode-mapp och vilket provid den har och så namnges resultaten efter prov-idt.  [WFM7]Idag får man en interaktiv krona-plot.  [WFM8]Emus databas använder sig av NCBIs tax-id. Man hittar id i resultatfilen tillsammans med alla taxonomiska nivåer.  [WFM9]Saknas idag. Likelihood file finns dock  [WFM10]Finns  [WFM11]Man får nu en slutgiltig multiqc-rapport (interaktiv sida man öppnar i webbläsaren). Den visar för hela batchen fastqc + lite info om pipelinen. 

Sedan får man nanoplot-rapporten vilken är ganska trevlig att kolla på också och kanske mer lämplig om man vill kolla qc på nanopore-data.

Clone this wiki locally