14.1. Методы предсказания свойств белков
После успешного секвенирования целых геномов первостепенной задачей биологических исследований является извлечение биологически осмысленного содержания из последовательностей нуклеотидов. Программы алгоритмического просмотра последовательностей геномной DNA и поиска генов позволяют распознавать кодирующие белок области. Предсказание помогает установить структуры закодированных в геноме молекул, их взаимодействия, организацию функций и взаимодействий в пространстве и времени на протяжении всей жизни организма. Предсказания генов направлены на определение областей геномной DNA, которые кодируют белки, предсказания белков - на определение структуры по аминокислотной последовательности.
Знание структуры белковых молекул важно для понимания их функций и разработки эффективных фармацевтических препаратов. Однако напрямую определять структуру белков не всегда возможно из-за сложности, стоимости и ограниченности возможностей экспериментов. На данный момент количество расшифрованных последовательностей белков значительно превышает число их известных структур. В связи с этим целесообразно использовать теоретические подходы для предсказания структур белков, то есть определения расположения атомов молекулы в трехмерном пространстве.
Первичная аминокислотная последовательность позволяет делать надежные предсказания ряда физико-химических свойств белка (например, молекулярного веса).
Для предсказания вторичной структуры современные алгоритмы используют разные подходы, в частности, по аминокислотной после-
довательности белка с неизвестной структурой делаются предсказания вторичной структуры - отнесение участков последовательности к спиралям или тяжам листов; проводится множественное выравнивание последовательностей с выбором наиболее успешных вариантов (около 70-75%).