EUKulele je python paket koji omogućuje brzu taksonomsku oznaku metagenomskih i metatranskriptomskih podataka korištenjem pristupa posljednjeg zajedničkog pretka (Last Common Ancestor -LCA) za usklađivanje uzoraka s referentnom bazom podataka.
Dostupne verzije i pripadajući moduli:
Verzija | Modul |
---|---|
2.0.6 | bioinfo/EUkulele/2.0.6 |
Korištenje
EUKulele po defaultu koristi sve dostupne dretve. S toga je potrebno ga staviti na cijeli čvor. Nije još razrješeno u izvornom kodu da koristi određen broj dretvi. Kad mu se zada, on svejedno zauzme sve.
Postoji 2 načina pokretanja, pomoću skripte i izravnih naredbi.
Ovisno o opciji baze podataka za korištenje, EUKulele će pokušati skinuti bazu lokalno. Zbog velike količine podataka skinuli smo ih sve i putanja je spremljena u $REF_DAT. Molimo da koristite pravilno tu putanju.
Potrebno je odrediti argumenate kako bi EUKulele uspješno očitao referentne podatke:
Npr.
--database mmetsp
--tax_table taxonomy-table.txt
--protein_extension .faa
--protein_map prot-map.json
--ref_fasta reference.pep.fa
--reference $REF_DAT/mmetsp
Popis baza podataka:
Baza | Putanja |
---|---|
eukprot | $REF_DAT/eukprot |
mmetsp | $REF_DAT/mmetsp |
phylodb | $REF_DAT/phylodb |
eukzoo | $REF_DAT/eukzoo |
Sa skriptom:
Primjer je skinut sa https://eukulele.readthedocs.io/en/latest/tutorial.html
#!/bin/sh #$ -N EUkulele_run #$ -pe *mpisingle 28 #$ -cwd #$ -R y module load bioinfo/EUkulele/1.0.2 EUKulele --config curr_config.yaml
alignment_choice: diamond choose_parallel: parallel column: SOURCE_ID consensus_cutoff: 0.75 create_tax_table: 1 cutoff: tax-cutoffs.yaml database: mmetsp download_reference: 0 individual_or_summary: individual jobname: test mets_or_mags: mags names_to_reads: 0 nucleotide_extension: .fna organisms: - Phaeocystis;antarctica original_tax_table: taxonomy-table.txt original_taxonomy: taxonomy-table.txt output: out protein_extension: .faa protein_map: protein-map.json ref_fasta: reference-pep-trunc.pep.faa reference: reference_DIR force_rerun: 1 salmon_dir: 0 samples: samples_MAGs scratch: scratch subroutine: all tax_table: tax-table.txt taxonomy_organisms: - species transdecoder_orfsize: 100 use_salmon_counts: 0
Bez skripte:
#!/bin/sh #$ -N EUkulele_run #$ -pe *mpisingle 28 #$ -cwd #$ -R y module load bioinfo/EUkulele/1.0.2 EUKulele --sample_dir samples_MAGs -m mags --database mmetsp --tax_table taxonomy-table.txt --protein_extension .faa --protein_map prot-map.json --ref_fasta reference.pep.fa --reference $REF_DAT/mmetsp