AJUDA LePMA (Learning Progressive Multiple Alignment)
--Conceptes--
Format Fasta
El format Fasta és el més estès i
acceptat arreu del món amb el qual es formalitzen les seqüències
de cara a un tractament de dades unificat i estàndard.
Aquest format consisteix a introduir un nom
de seqüència precedit pel caracter '>' i, a la següent línia, la
seqüència en questió representada per la succeció d'inicials
dels nucleòtids que la formen o el caràcter '-' per representar un gap.
Això es repeteix per cada seqüència que es vulgui introduir.
Per exemple:
>s1
atgact
>s2
cct-a
Arbre Guia (o Dendograma)
Un dendograma o arbre guia és un arbre
jeràrquic, similar a un arbre filogenètic, que mostra gràficament
la succeció ordenada d'alineaments segons les similituds entre les
seqüències i clusters implicats.
Matriu de Puntuacions
La matriu de puntuacions és una matriu
simètrica que ens mostra les puntuacions de similituds (o distàncies)
entre tot parell de seqüències o clusters en un moment donat de
l'alineament múltiple.
En el primer pas s'obtenen les puntuacions
alineant totes les seqüències dos a dos. Pero a partir del segon
pas, s'aplica una fórmula aproximatòria per calcular les similituds
respecte els clusters que van apareixent.
Matriu de Similitud
Donades dues seqüències, la matriu de
similitud ens mostra una comparació d'ambdues caràcter a caràcter
podent observar quin valor o similitud final s'obté.
En la nostra aplicació, aquesta matriu la
podem observar clicant sobre qualsevol valor de la primera matriu
de puntuacions (la del primer pas de l'alineament).