Salmon je alat za brzu kvantifikaciju prijepisa iz RNA-seq podataka. Za kvantificiranje je potreban skup ciljnih prijepisa (bilo iz referentnog ili de-novo sklopa). Sve što trebate za pokretanje Salmona je FASTA datoteka koja sadrži vaše referentne transkripte i (skup) FASTA/FASTQ datoteka(a) koje sadrže vaša čitanja. Po izboru, Salmon može koristiti unaprijed izračunata poravnanja (u obliku SAM/BAM datoteke) transkripata umjesto sirovih čitanja.
Način Salmona koji se temelji na kartiranju odvija se u dvije faze; indeksiranje i kvantificiranje. Korak indeksiranja neovisan je o čitanjima i potrebno ga je pokrenuti samo jednom za određeni skup referentnih prijepisa. Korak kvantifikacije je očito specifičan za skup očitavanja RNA-seq i stoga se izvodi češće.
Alociranje 8-12 threadova za Salmon postiže najviše brzine za izračune. Odabir threadova više od 12 će rezultirati da ti threadovi budu zauzeti i neiskorišteni.
Supek
#PBS -N index
#PBS -q cpu
#PBS -l select=1:ncpus=12
cd ${PBS_O_WORKDIR}
module load scientific/salmon/1.10.0
salmon index -t gentrome.fa.gz -d decoys.txt -p $NCPUS -i salmon_index --gencode