You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 4 Next »

EUKulele je python paket koji omogućuje brzu taksonomsku oznaku metagenomskih i metatranskriptomskih podataka korištenjem pristupa posljednjeg zajedničkog pretka (Last Common Ancestor -LCA) za usklađivanje uzoraka s referentnom bazom podataka.


Dostupne verzije i pripadajući moduli:

VerzijaModul
2.0.6bioinfo/EUkulele/2.0.6

Korištenje

EUKulele po defaultu koristi sve dostupne dretve. S toga je potrebno ga staviti na cijeli čvor. Nije još razrješeno u izvornom kodu da koristi određen broj dretvi. Kad mu se zada, on svejedno zauzme sve.

Postoji 2 načina pokretanja, pomoću skripte i izravnih naredbi.

Ovisno o opciji baze podataka za korištenje, EUKulele će pokušati skinuti bazu lokalno. Zbog velike količine podataka skinuli smo ih sve i putanja je spremljena u $REF_DAT. Molimo da koristite pravilno tu putanju.

Potrebno je odrediti argumenate kako bi EUKulele uspješno očitao referentne podatke:

Npr.

--database mmetsp

--tax_table taxonomy-table.txt

--protein_extension .faa

--protein_map prot-map.json

--ref_fasta reference.pep.fa

--reference $REF_DAT/mmetsp

Popis baza podataka:

BazaPutanja
eukprot$REF_DAT/eukprot
mmetsp$REF_DAT/mmetsp
phylodb$REF_DAT/phylodb
eukzoo$REF_DAT/eukzoo

Sa skriptom:

Primjer je skinut sa https://eukulele.readthedocs.io/en/latest/tutorial.html

#!/bin/sh
#$ -N EUkulele_run
#$ -pe *mpisingle 28
#$ -cwd
#$ -R y

module load bioinfo/EUkulele/1.0.2

EUKulele --config curr_config.yaml 

curr_config.yaml
alignment_choice: diamond
choose_parallel: parallel
column: SOURCE_ID
consensus_cutoff: 0.75
create_tax_table: 1
cutoff: tax-cutoffs.yaml
database: mmetsp
download_reference: 0
individual_or_summary: individual
jobname: test
mets_or_mags: mags
names_to_reads: 0
nucleotide_extension: .fna
organisms:
- Phaeocystis;antarctica
original_tax_table: taxonomy-table.txt
original_taxonomy: taxonomy-table.txt
output: out
protein_extension: .faa
protein_map: protein-map.json
ref_fasta: reference-pep-trunc.pep.faa
reference: reference_DIR
force_rerun: 1
salmon_dir: 0
samples: samples_MAGs
scratch: scratch
subroutine: all
tax_table: tax-table.txt
taxonomy_organisms:
- species
transdecoder_orfsize: 100
use_salmon_counts: 0

Bez skripte:

#!/bin/sh
#$ -N EUkulele_run
#$ -pe *mpisingle 28
#$ -cwd
#$ -R y

module load bioinfo/EUkulele/1.0.2  

EUKulele --sample_dir samples_MAGs -m mags --database mmetsp --tax_table taxonomy-table.txt --protein_extension .faa --protein_map prot-map.json --ref_fasta reference.pep.fa --reference $REF_DAT/mmetsp
   
  • No labels