process in bioinformatics that aligns (identifies equivalent sites within) molecular sequences
via PubMed
L'allineamento di sequenze è una procedura bioinformatica con cui vengono messe a confronto ed allineate due o più sequenze primarie di aminoacidi, DNA o RNA. L'allineamento permette di individuare regioni identiche o simili che possono avere relazioni funzionali, strutturali o filogenetiche (evolutive). Spesso l'allineamento viene utilizzato per verificare se una sequenza di interesse sia presente all'interno di un database di sequenze conosciute oppure se ne esista una simile. Un allineamento di sequenze, prodotto dal programma tra due proteine a dito di zinco identificate dal loro numero di accesso GenBank. Le basi di sequenze allineate formano delle righe all'interno di una matrice, mentre le colonne sono formate dove possibile da basi identiche o simili. Spazi (gap, identificati in un allineamento dal trattino -) possono essere introdotti per ottenere il maggior numero di identità tra sequenze e per compensare eventuali inserimenti o rimozioni (indel) evolutive di basi. Se due sequenze sono omologhe gli errori in un allineamento possono essere interpretati come singole mutazioni, mentre gli spazi come indel introdotti in una sequenza dopo il punto di divergenza. Nell'allineamento di sequenze di aminoacidi la similarità tra basi nella stessa colonna fornisce informazioni sulla conservazione di una particolare regione della proteina. L'assenza di sostituzioni o la presenza esclusiva di sostituzioni conservative (un aminoacido sostituito ad un altro con un gruppo laterale R con simili proprietà biochimiche) in una regione del polipeptide può indicare che questa regione è importante a livello strutturale o funzionale. Programmi specializzati nell'allineamento possono offrire due opzioni: allineamenti globali o locali. L'allineamento globale è un'ottimizzazione che cerca di estendere l'appaiamento delle basi lungo le intere sequenze; l'allineamento locale invece cerca di identificare regioni di similarità all'interno di sequenze che possono essere molto diverse. L'allineamento locale è solitamente preferito, nonostante sia più difficile da produrre, dato l'aggiunto problema dell'identificazione di regioni simili.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata · CC0
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).