AYUDA LePMA (Learning Progressive Multiple Alignment)
--Conceptos--
Formato Fasta
El formato Fasta es el más extendido i aceptado en el mundo para la
formalización de secuencias de cara a un tratamiento de datos
unificado i estándard.
Este formato consiste en introducir un nombre de secuencia precedido
por el caracter '>' i, en la siguiente línea, la secuencia en
cuestión representada por la sucesión de iniciales de los nucleótidos
que la forman, o el caracter '-' para representar un gap. Esto se
repite para cada secuencia que se quiera introducir.
Por ejemplo:
>s1
atgact
>s2
cct-a
Árbol Guía (o Dendograma)
Un dendograma o árbol guía es un árbol jerárquico, similar a un
árbol filogenético, que muestra gráficamente la sucesión ordenada
de alineamientos según las similitudes entre las secuencias i
clústers implicados.
Matriz de Puntuaciones
La matriz de puntuaciones es una matriz simétrica que nos muestra
las puntuaciones de similitudes (o distancias) entre todo par de
de secuencias o clústers en un momento dado del alineamiento
múltiple.
En el primer paso se obtienen las puntuaciones alineando todas las
secuencias dos a dos. Pero a partir del segundo paso, se aplica una
fórmula aproximatoria para calcular las similitudes respecto a los
clústers que van apareciendo.
Matriz de Similitud
Dadas dos secuencias, la matriz de similitud nos muestra una
comparación de las dos carácter a carácter pudiendo observar que
valor o similitud final se obtiene.
En nuestra aplicación, esta matriz la podemos observar pulsando
sobre cualquier valor de la primera matriz de puntuaciones (la del
primer paso del alineamiento).