1
0
Fork 0
mirror of https://github.com/tldr-pages/tldr.git synced 2025-04-29 23:24:55 +02:00
tldr/pages.it/common/bedtools.md

30 lines
1.8 KiB
Markdown
Raw Normal View History

2019-01-24 22:39:11 +01:00
# bedtools
> Un coltellino svizzero di strumenti per una vasta gamma di operazioni di analisi genomica.
2019-01-24 22:39:11 +01:00
> Usato per intersecare, raggruppare, convertire e contare dati in formato BAM, BED, GFF/GTF, VCF.
> Maggiori informazioni: <https://bedtools.readthedocs.io>.
2019-01-24 22:39:11 +01:00
- Interseca il file [a] ed il/i file [b] in base alla sequenza del filamento [s] e salva il risultato in un file specifico:
2019-01-24 22:39:11 +01:00
`bedtools intersect -a {{percorso/del/file_A}} -b {{percorso/del/file_B1 percorso/del/file_B2 ...}} -s > {{percorso/del/file_output}}`
2019-01-24 22:39:11 +01:00
- Interseca 2 file in base a una [l]eft [o]uter [j]oin ovvero una unione d'insieme di dati ordinati in colonne che restituisce i dati della tabella di sinistra. Es: riporta ogni proprietà presente nel `file1` e NULL dove non c'è sovrapposizione con `file2`:
2019-01-24 22:39:11 +01:00
`bedtools intersect -a {{percorso/del/file1}} -b {{percorso/del/file2}} -loj > {{percorso/del/file_output}}`
2019-01-24 22:39:11 +01:00
- Usa un algoritmo più efficiente per intersecare due file precedentemente ordinati:
`bedtools intersect -a {{percorso/del/file1}} -b {{percorso/del/file2}} -sorted > {{percorso/del/file_output}}`
2019-01-24 22:39:11 +01:00
- Seleziona in un file le prime tre colonne e la quinta [c]olonna utilizzando la sesta colonna per ra[g]gruppare i dati al fine di poter calcolare tramite un'[o]perazione di addizione la somma delle colonne 1,2,3 e 5 per ciascun gruppo:
2019-01-24 22:39:11 +01:00
`bedtools groupby -i {{percorso/del/file}} -c 1-3,5 -g 6 -o sum`
2019-01-24 22:39:11 +01:00
- Converti un file in [i]nput formattato bam in un file formattato bed:
2019-01-24 22:39:11 +01:00
`bedtools bamtobed -i {{percorso/del/file.bam}} > {{percorso/del/file.bed}}`
2019-01-24 22:39:11 +01:00
- Trova per tutte le proprietà presenti nel `file1.bed` la più vicina nel `file2.bed` e aggiunge la loro [d]istanza in una ulteriore colonna al risultato finale (i file in input devono essere ordinati):
2019-01-24 22:39:11 +01:00
`bedtools closest -a {{percorso/del/file1.bed}} -b {{percorso/del/file2.bed}} -d`