Opis
DIAMOND je aplikacija za usklađivanje sekvenci za pretraživanje proteina i prevedene DNK, dizajniran za analizu visokih performansi velikih podataka o sekvencama. Ključne karakteristike su:
- Parno poravnanje proteina i prevedene DNK brzinom 100x-10 000x od BLAST-a.
- Proteinsko grupiranje do desetaka milijardi proteina
- Poravnanja pomaka okvira za analizu dugog čitanja.
- Mali zahtjevi za resursima i pogodan za rad na standardnim stolnim ili prijenosnim računalima.
- Različiti izlazni formati, uključujući BLAST u paru, tablični i XML, kao i taksonomsku klasifikaciju.
Dostupne verzije:
Verzija | Modul | Supek | Padobran |
---|---|---|---|
2.1.8 | scientific/DIAMOND/2.1.8 |
Primjer korištenja:
dmd.pbs
#!/bin/bash #PBS -N dmd-cluster #PBS -l select=1:ncpus=12:mem=64GB #PBS -q cpu cd $PBS_O_WORKDIR module load scientific/DIAMOND/2.1.8 diamond cluster -d astral-scopedom-seqres-gd-sel-gs-bib-95-2.07.fa -o clusters.tsv --approx-id 40 --threads $NCPUS --memory-limit 64G --header
Dostupne baze za korištenje
Baze se nalaze u $BLASTDB varijabli
- nr/nr
- nr/nr_tax - baza sa taksonomskim značajkama
- swissprot/swissprot
- nt/nt_fa/nt
- pfam/Pfam-A.fasta
- cog/cog-20.fa
dmd.pbs
#!/bin/bash #PBS -N dmd-blastp #PBS -l select=1:ncpus=12:mem=64GB #PBS -q cpu cd $PBS_O_WORKDIR module load scientific/DIAMOND/2.1.8 diamond blastp -d $BLASTDB/swissprot/swissprot -q protein.fa -o matches_swissprot.tsv --threads $NCPUS