EUKulele je python paket koji omogućuje brzu taksonomsku oznaku metagenomskih i metatranskriptomskih podataka korištenjem pristupa posljednjeg zajedničkog pretka (Last Common Ancestor -LCA) za usklađivanje uzoraka s referentnom bazom podataka.
Dostupne verzije i pripadajući moduli:
Verzija | Modul |
---|---|
2.0.6 | bioinfo/EUkulele/2.0.6 |
Korištenje
Sa skriptom:
Primjer je skinut sa https://eukulele.readthedocs.io/en/latest/tutorial.html
Bez skripte:
#!/bin/sh #$ -N EUkulele_run #$ -pe *mpisingle 10 #$ -cwd #$ -R y module load bioinfo/EUkulele/2.0.6 EUKulele --config curr_config
Konfiguracijska skripta:
curr_config.yaml
alignment_choice: diamond subroutine: all database: mmetsp mets_or_mags: mags nucleotide_extension: .fna original_tax_table: taxonomy-table.txt original_taxonomy: taxonomy-table.txt output: out protein_extension: .faa protein_map: prot-map.json ref_fasta: reference.pep.fa reference: ref_dir samples: sample_MAGs CPUs: 2 no_busco: 1
Korištenje EUKulele iskljičivo sa skriptom, komanda linija ne prenosi argumente za CPU pravilno.
Busco verzija je nekompatibilna sa radom 2.0.6 EUKulele stoga se koristi no_busco: 1 argument.
Odabrana baza će se automatski skinuti ako ne postoji u lokalno direktorij, stoga nakon korištenja se treba obrisati zbog veće količine podataka.