Парное выравнивание последовательностей - это процесс сопоставления двух последовательностей, с тем чтобы достичь максимального уровня идентичности (и консервативности в случае аминокислотных последовательностей). Цель парного выравнивания - оценить степень возможного подобия и гомологию.
Гомология - подобие, объясняемое общим происхождением. При этом исходную структуру (то есть самого предка) часто бывает трудно определить, поскольку в ходе смены поколений она последовательно видоизменялась.
Выделяют несколько типов гомологов.
Ортологи - гомологичные последовательности в различных видах, которые произошли от общего гена в ходе видообразования.
Паралоги - гомологичные последовательности внутри одного вида, которые возникли путем дупликации.
Подход к определению подобия состоит в выстраивании последовательностей в линию, одну над другой, и вставке дополнительных пропусков (гапов) до тех пор, пока знаки в соответствующих позициях обеих строк не придут в соответствие.
При проведении парного выравнивания выбор последовательностей (белковые или нуклеотидные) зависит от целей исследования. С одной стороны, белковые последовательности могут быть информативнее, чем нуклеотидные, так как кодируются двадцатью символами, а не четырьмя. Кроме того, белковые последовательности дают возможность оценить большую по времени ретроспективу изменений. С другой стороны, выравнивание DNA позволяет оценить идентичность комплементарной DNA (cDNA), изучить некодирующие регионы DNA и полиморфизмы.
При сравнении последовательностей в парном выравнивании формируется оценка Score, которая определяется как сумма совпадений,
несовпадений и гапов. Гапы и несовпадения являются отрицательными числами, и их наличие уменьшает Score (S). Пример