CD-HIT je široko korišten program za klasteriranje bioloških sekvenci kako bi se smanjila redundantnost sekvenci i poboljšala izvedba drugih analiza sekvenci. CD-HIT je izvorno razvijen za klasteriranje proteinskih sekvenci za stvaranje referentnih baza podataka sa smanjenom redundancijom (Li, et al., 2001.), a zatim je proširen za podršku klasteriranju nukleotidnih sekvenci i usporedbu dva skupa podataka (Li i Godzik, 2006.). Web poslužitelj CD-HIT implementiran je 2009. godine, što korisnicima omogućuje grupiranje ili usporedbu sekvenci bez upotrebe CD-HIT-a iz naredbenog retka. Poslužitelj nudi interaktivno sučelje i dodatne alate za vizualizaciju.