Opis

DIAMOND je aplikacija za usklađivanje sekvenci za pretraživanje proteina i prevedene DNK, dizajniran za analizu visokih performansi velikih podataka o sekvencama. Ključne karakteristike su:

  • Parno poravnanje proteina i prevedene DNK brzinom 100x-10 000x od BLAST-a.
  • Proteinsko grupiranje do desetaka milijardi proteina
  • Poravnanja pomaka okvira za analizu dugog čitanja.
  • Mali zahtjevi za resursima i pogodan za rad na standardnim stolnim ili prijenosnim računalima.
  • Različiti izlazni formati, uključujući BLAST u paru, tablični i XML, kao i taksonomsku klasifikaciju.

Dostupne verzije:

VerzijaModulSupekPadobran
2.1.8scientific/DIAMOND/2.1.8(error) (tick) 


Primjer korištenja:

dmd.pbs
#!/bin/bash

#PBS -N dmd-cluster
#PBS -l select=1:ncpus=12:mem=64GB
#PBS -q cpu

cd $PBS_O_WORKDIR

module load scientific/DIAMOND/2.1.8

diamond cluster -d astral-scopedom-seqres-gd-sel-gs-bib-95-2.07.fa -o clusters.tsv --approx-id 40 --threads $NCPUS  --memory-limit 64G --header

Dostupne baze za korištenje

Baze se nalaze u $BLASTDB varijabli

  • nr/nr
  • nr/nr_tax - baza sa taksonomskim značajkama
  • swissprot/swissprot
  • nt/nt_fa/nt
  • pfam/Pfam-A.fasta
  • cog/cog-20.fa
dmd.pbs
#!/bin/bash

#PBS -N dmd-blastp
#PBS -l select=1:ncpus=12:mem=64GB
#PBS -q cpu

cd $PBS_O_WORKDIR

module load scientific/DIAMOND/2.1.8

diamond blastp -d $BLASTDB/swissprot/swissprot -q protein.fa -o matches_swissprot.tsv --threads $NCPUS