Главная | Обратная связь | Поможем написать вашу работу!

Распознавание фолда с использованием библиотеки известных фолдов

ФОЛДИНГ

Фолдинг - сворачивание белков (и других биомакромолекул) из развёрнутой конформации в «нативную» форму - физико-химический процесс, в результате которого белки в своей естественной среде (растворе, цитоплазме или мембране) приобретают характерные только для них пространственную укладку и функции. С термодинамической точки зрения самосворачивание белка является переходом белковой молекулы в наиболее статистически вероятную конформацию (что практически можно приравнять к конформации с наименьшей потенциальной энергией). С кинетикой же фолдинга связывают так называемый парадокс Левинталя, согласно которому, если бы молекула белкá длиной хотя бы в 100 аминокислотных остатков «перебирала» все возможные конформации, прежде чем свернуться в нативную форму, этот процесс потребовал бы времени, превышающего время существования Вселенной. Однако из практики известно, что максимальное время сворачивания ограничивается минутами, типичное время - порядка миллисекунд, а кратчайший требуемый срок, зарегистрированный для трёхлистового β-слоя - всего 140 нс.

Решение парадокса Левинталя заключается в том, что молекула никогда не принимает подавляющего большинства теоретически возможных конформаций. Кооперативные эффекты фолдинга - одновременное формирование «зародышей» вторичной структуры, являющихся энергетически стабильными и уже не изменяющимися в процессе дальнейшего сворачивания - приводят к тому, что молекула белка находит «кратчайший путь» на воображаемой гиперплоскости потенциальной энергии к точке, соответствующей нативной конформации белка. Нативная конформация при этом отделена заметным энергетическим промежутком (potential energy gap) от подавляющего числа несвёрнутых форм, а ближайшая её окрестность определяет естественную конформационную подвижность молекулы.

Ограниченность понимания механизмов фолдинга связана ещё и с тем, что его сложно наблюдать экспериментально: это достаточно быстрый динамический процесс.

СЛОЖНОСТИ МОДЕЛИРОВАНИЯ БЕЛКОВ

В настоящее время последовательности всех белков конвертируются из прочтённых геномов множества организмов в аннотированные базы данных, доступные через интернет. Так, число последовательностей в базе Swiss-Prot <http://cn.expasy.org/sprot/relnotes/relstat.html> (версия 55.1 от 18 марта 2008 года), курируемой и аннотируемой специалистами вручную, составляет ≈360 000, а число записей в базе TrEMBL <http://www.ebi.ac.uk/swissprot/sptr_stats/index.html> (версия 38.1), аннотированных автоматически по доступной геномной информации, приближается к 5.5 миллионам.

Инструментарием для решения задачи определения пространственного строения белковых молекул является рентгеноструктурный анализ (РСА) и спектроскопия ядерного магнитного резонанса (ЯМР). Эти методы ещё не достигли той степени зрелости, чтобы можно было получить структуру любого интересующего исследователей белка с ограниченными временными и материальными затратами.

Сложность заключается в получении нужных количеств белка, подготовке препарата, пригодного для изучения дифракции рентгеновских лучей или ядерного магнитного резонанса в меченном изотопами образце, и в анализе данных. Каждый этап этой задачи часто требует уникального подхода и поэтому не может быть полностью автоматизирован. Особенно сложно охарактеризовать структуру белков, образующих сложные молекулярные комплексы, и интегральные белки биологических мембран (составляющих до трети от общего числа белков в большинстве организмов). Поэтому, даже с учётом того, что расшифровкой структур белков занимаются не только научные коллективы по собственной инициативе, но и международный консорциум PSI (Protein Structure Initiative <http://www.nigms.nih.gov/Initiatives/PSI>), задачей которого является максимально полная и широкая структурная характеризация всего белкового разнообразия в живом мире, число белков с известной структурой сравнительно невелико. По состоянию на 22 декабря 2009, число структур в Брукхэйвенском банке белковых структур (PDB <http://www.rcsb.org/>) ≈ 57 000, но если из этого множества исключить повторные эксперименты на одних и тех же белках в различных условиях, а также структуры искусственно модифицированных и близкородственных белков, это число сократится до менее чем 10 000, составляя ≈1-2% от общего числа практически важных белков.

Выход из сложившейся ситуации могут дать методики теоретического предсказания пространственной структуры, решающим преимуществом которых является сравнительно высокая скорость и низкая трудоёмкость получения моделей строения белков. Оборотной стороной этого преимущества оказывается «качество» моделей - точность предсказания, которая не всегда является достаточной для практически важных задач (например, изучения взаимодействия рецептора с лигандами). Однако в условиях ограниченной доступности структурных данных по интересующему исследователей объекту, молекулярная модель оказывается разумной заменой - особенно учитывая тот факт, что более или менее реалистичные модели могут быть построены для >50% всех белков с неизвестной структурой.

МЕТОДЫ МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННОЙ СТРУКТУРЫ БЕЛКА

Распознавание фолда с использованием библиотеки известных фолдов

Распознавание фолда - это первая стадия для построения модели трехмерной структуры белка. Применяется, если отсутствует информация о близких гомологах исследуемого белка, пространственная структура которых расшифрована ранее. При этом удается предсказать корректно укладку для ~75% белков. Точности построенной на базе этого метода модели недостаточно, чтобы исследовать механизмы функционирования макромолекулы и, в конечном счете, создаваемой молекулярной системы.

Предсказание архитектуры белковой глобулы на основе знаний об атомных воздействиях (метод ab initio или de novo)

Этот термин означает, что в предсказании не используют в явном виде информации о структуре других белков. Все вычисления, как правило, производятся в эмпирических силовых полях, описывающих парные взаимодействия в классической системе частиц, представляющей молекулу белка. Сами же эти силовые поля в неявном виде включают данные о структуре молекул (не обязательно белковых) - такие как парциальные заряды и массу атомов, а также длины и углы валентных связей, - и к квантово-механическим методам отношения не имеют.

Наиболее «физически корректные» подходы из этой группы заключаются в основном в расчётах МД для моделирования процесса и результата фолдинга, однако эти методы из-за их огромной вычислительной сложности и неточности функций потенциальной энергии достигают успеха лишь для некоторых очень небольших белков. В остальных же случаях - тоже, относящихся к маленьким белкам (не более 150 аминокислотных остатков), - прибегают к дополнительным приближениям с целью уменьшить вычислительную сложность расчёта.

Для увеличения вычислительной эффективности, в de novo подходах часто используются упрощённые модели представления белка - отдельные аминокислотные остатки, присутствующие в модели, представлены не так подробно, как в полноатомных подходах: вся боковая цепь моделируется лишь одним-двумя центрами («псевдоатомами»). De novo фолдинг проводится в специальном силовом поле, оценивая огромное количество вариантов укладки сворачиваемой молекулы по значению потенциальной энергии. Идентификация конформации, значительно более «низкой» по потенциальной энергии, чем остальные, может служить признаком конца поиска - аналогично тому, как нативная конформация с некоторым отрывом отстоит от несвёрнутых промежуточных состояний.

Чтобы как-то приблизиться к природному механизму сворачивания, исследователи пытаются выделить в последовательности моделируемого белка структурно консервативные фрагменты (аналогичные тем, что в природе сворачиваются первыми и в дальнейшем уже остаются неизменными) и как бы «собирают мозаику» из этих фрагментов. Эта процедура позволяет существенно сократить время расчётов.

Одним из научных коллективов, активно занимающихся предсказанием структуры белков de novo, является вашингтонская лаборатория <http://depts.washington.edu/bakerpg/> Дэвида Бэйкера. Разрабатываемая ими программа Rosetta генерирует ансамбль моделей, получающихся после «сборки» структурно-консервативных фрагментов молекулы в специализированном силовом поле. Короткие (4-10 аминокислотных остатков) фрагменты последовательности моделируемого белка выступают «зародышами» структуры будущей, а конформацию этим фрагментам «назначают», используя конформации гомологичных фрагментов из белков с уже известной структурой. Программа TASSER использует похожий подход. Короткие структурные фрагменты «собираются» в специализированном силовом поле, а результат (модель, предположительно близкая к нативной) выбирается из ансамбля предсказаний с помощью идентификации наиболее плотного структурного кластера - являющегося, по мнению исследователей, «гнездом» физически реалистичных моделей.

12 Следующая ⇒

Воспользуйтесь поиском по сайту: