Главная | Обратная связь | Поможем написать вашу работу!

Определение полной первичной структуры ДНК генома человека

Исчерпывающая физическая карта генома человека (и любого другого организма) должна представлять собой полную последовательность нуклеотидов ДНК всех его хромосом. Благодаря тому, что к решению такой грандиозной по объему задачи привлечены многие хорошо финансируемые лаборатории в разных странах мира и для этих целей используются автоматические высокопроизводительные секвенаторы, она представляется скорее рутинной, чем захватывающей. Секвенирование начинается с субклонирования небольших рестрикционных фрагментов ДНК, образуемых в результате рестрикции предварительно клонированных более крупных фрагментов, и первичная структура коротких фрагментов далее определяется одним из известных методов.

Опубликованные одновременно в 1977 г. методы секвенирования ДНК А. Максама и У. Гилберта, а также Ф. Сенгера сделали процесс определения первичной структуры генов доступным любой биохимической лаборатории. С тех пор метод Сенгера, основанный на случайной терминации синтеза ДНК in vitroкак следствие включающихся в синтезируемую цепь ДНК дидезоксирибонуклеозидмонофосфатов, получил широкое распространение. Дальнейшим развитием метода Сенгера было использование в продукте реакции флуоресцентной метки вместо радиоактивной, что позволило автоматизировать процесс секвенирования. Во многих случаях для определения первичной структуры того или иного участка ДНК теперь уже нет необходимости в предварительном клонировании соответствующего фрагмента, поскольку разработаны эффективные методы секвенирования непосредственно продуктов ПЦР. Все это резко стимулировало эффективность анализа первичной структуры генов. Однако необходимо иметь в виду, что длина ДНК даже самой маленькой Y-хромосомы человека составляет 50 м.п.о., а лучшие автоматические секвенаторы сегодняшнего дня позволяют определять за один год последовательность из ~0,1 м.п.о. Это наглядно демонстрирует масштабы задачи, которую предстоит решить[3].

Базы данных получаемой информации

Полное использование информации о структуре генома человека в биологии и медицине станет возможным лишь в отдаленном будущем. Еще долгие годы предстоит собирать и обрабатывать получаемую информацию, устранять противоречия между экспериментальными данными разных лабораторий. Одна только запись всей последовательности нуклеотидов генома человека обычным шрифтом потребует ~200 томов книг по 1000 страниц каждая. Анализ такого объема информации неминуемо повлечет за собой необходимость разработки новых подходов в информатике и будет невозможен без создания уникальных алгоритмов обработки информации с помощью вычислительной техники.

По мере накопления информации о последовательностях нуклеотидов различных частей генома человека на первое место будут выходить задачи по идентификации среди них функционально значимых. В первой части книги уже подчеркивалось, что даже определение границ генов в ряде случаев является трудно разрешимой задачей. То же относится и к идентификации регуляторных последовательностей генов. Не исключено, что накопление новых данных о структуре генома человека, в конце концов, потребует пересмотра как критериев функциональной значимости нуклеотидных последовательностей генома, так и самой концепции гена.

Крупнейшей базой данных по структуре генома человека в настоящее время является GDB (Genome Data Base), созданная и поддерживаемая в университете Дж. Гопкинса (Балтимор, США). Кроме известных последовательностей нуклеотидов генома человека в ней хранится вся получаемая информация о генетических маркерах, зондах и контигах, ассоциированных с генетическими заболеваниями. Проводятся работы по включению в базу данных результатов физического картирования генома. В этом же университете поддерживается база данных по менделевскому наследованию у человека (Online Mendelian Inheritance in Man Database), которая представляет собой каталог наследуемых признаков и наследственных заболеваний человека.

Четыре другие базы данных хранят все известные последовательности нуклеотидов, включая последовательности нуклеотидов генома человека: GenBank и Genome Sequence Data Base (GSDB) в США, European Molecular Biology Laboratory (EMBL) Nucleotide Sequence Database в Великобритании, а также DNA Data Bank of Japan (DDBJ). В этих базах данных в 1996 году хранилось ~200 м.п.о. последовательностей нуклеотидов, предоставленных как самими авторами, так и вводимых из статей, опубликованных в периодических изданиях. В России Институтом молекулярной биологии РАН поддерживается аналогичная база данных по геному человека (Hugene) с более скромными задачами, работающая на отечественном программном обеспечении. Основной международной базой данных по последовательностям аминокислот является Protein Identification Resource (Швейцария).

Принесет ли молекулярной генетике определение полной первичной структуры генома человека принципиально новые знания? Действительно, максимальную информацию о функционировании генома и функциональной значимости его основных частей могло бы принести только полное сравнительное секвенирование двух геномов, принадлежащих разным индивидуумам. Это позволило бы отделить консервативные последовательности от последовательностей, изменяющихся в процессе онтогенеза. Ведь даже в двух соседних соматических клетках одного организма последовательности нуклеотидов различаются из-за соматического мутагенеза. Выполняемая же программа исследований по геному человека в конечном счете даст только усредненную информацию. Если же, как это предполагается в разделе 5.3, основной функцией избыточных последовательностей, составляющих ~90% генома млекопитающих, является обеспечение запрограммированной скорости изменения отдельных генетических локусов под действием мутаций, и(или) поддержания пространственной структуры кодирующих частей генов, то полное секвенирование таких последовательностей будет лишено большого смысла. Каков будет конец этой истории, может показать только будущее.

ЗАКЛЮЧЕНИЕ

Современная генетика находится на взлете. Новые факты обнаруживаются настолько быстро, что едва хватает времени на то, чтобы просто осознать их появление. Еще труднее уловить многочисленные связи между ними. Уже сейчас многие главы монографии хотелось бы переписать заново и реализацию этого замысла сдерживает лишь бесконечность такого пути. В этом заключении я хотел бы, с известной долей субъективности, отметить несколько новых направлений генетических исследований, которые достаточно явно обозначились к настоящему времени и, на мой взгляд, могут определять некоторые будущие направления генетических исследований.

Геномика. Конец 1990-х годов отмечен определением полной первичной структуры геномов нескольких организмов. В настоящее время уже имеются полные данные о последовательности нуклеотидов целых геномов нескольких эубактерий, архебактерии и эукариотического организма – дрожжей. На подходе получение таких данных о геномах дрозофилы, нематоды C. elegans, арабидопсиса и человека. По мере развития этих исследований молекулярная биология получит через соответствующие базы данных доступ к неограниченному числу первичных структур природных белков и нуклеиновых кислот. Ключевой проблемой, которую необходимо решить в связи с накоплением такого рода информации (и которая пока далека от своего разрешения) является возможность соотнесения первичных структур открываемых новых генов с функциями кодируемых этими генами белков и нуклеиновых кислот.

Базы данных последовательностей нуклеотидов целых геномов дают возможность изучения эволюционной истории семейств белков разных видов организмов. На основании этих данных все аминокислотные последовательности организуют в виде набора ~10 000 независимо эволюционирующих блоков ("модулей"). Для каждого из этих модулей на основании степени сходства или различия их аминокислотных (и соответствующих нуклеотидных) последовательностей строится эволюционное древо, которое отражает эволюционную историю семейств белков и позволяет обнаруживать предполагаемые исходные полипептиды-предшественники. При этом полагают (С.Ф. Беннер с соавторами, 1998 г.), что сопоставление данных эволюционной истории белков с их биохимическими свойствами и пространственной структурой позволит, в конечном счете, связать первичную структуру полипептидов с их биологическими функциями. Решение этой ключевой проблемы геномики будет сопровождаться получением большого количества новой информации о конформации макромолекул, их надмолекулярной организации, механизмах катализа и несомненно обогатит многие области исследований в биологии и химии.

Экспрессией генов управляют большие надмолекулярные комплексы. Определение функций продуктов новых генов на основе их первичной структуры осложняется тем, что многие белки и нуклеиновые кислоты проявляют свою активность и функционируют только в составе больших надмолекулярных комплексов, размеры которых часто приближаются к размерам рибосом. При этом многие белки сами по себе не обладают ферментативной активностью, а выполняют вспомогательные функции, например, молекул-адаптеров, обеспечивающих сборку комплексов и создающих молекулярные интерфейсы для их взаимодействия с регуляторными и каталитическими субъединицами. Наличие таких комплексов, как это было установлено в последнее десятилетие, особенно характерно для клеток эукариотических организмов. Так, исследование молекулярных механизмов транскрипции у эукариот привело к развитию представления о транскриптосоме, гигантскому белковому комплексу, в который кроме холофермента РНК-полимеразы с ее многочисленными субъединицами входят факторы транскрипции, белки-адаптеры, белковые компоненты системы репарации и т.п. При этом размер транскриптосомы приближается к таковому целых рибосом. В гигантские надмолекулярные комплексы организованы и молекулярные машины системы синтеза ДНК (реплисомы), процессинга и редактирования РНК (сплайсомы и эдитосомы), молекулярные компоненты системы протеолитической деградации белков (протеасомы). Создается впечатление, что организация генетических систем, функционирующих на основных этапах реализации генетической информации, в гигантские пространственно упорядоченные комплексы, является общебиологическим принципом.

Комбинаторные принципы. Важным достижением исследований последних лет является обнаружение способности объединения факторов транскрипции в разных сочетаниях в большие белковые комплексы. При этом каждое новое сочетание ограниченного числа факторов придает комплексу уникальные регуляторные свойства. Возможность такого объединения определяется наличием в их полипептидных цепях гомологичных доменов, которые обеспечивают соответствующие белок-белковые взаимодействия. Реализация комбинаторного принципа позволяет клетке расширить регуляторные возможности системы транскрипции без привлечения новых генов, то есть более эффективно использовать генетическую информацию своего генома.

Принципы комбинаторики стали находить широкое применение в прикладных молекулярно-биологических исследованиях. Использование автоматических синтезаторов нуклеиновых кислот позволяет с легкостью получать в одной пробирке наборы олигонуклеотидов, содержащие все теоретически возможные нуклеотидные последовательности и следовательно ассоциированные с ними (прямо или косвенно) возможные биологические активности. Разработанные простые системы скрининга позволяют выделять из пула случайных последовательностей нуклеотидов аптамеры и молекулы рибозимов, обладающие требуемыми биологическими свойствами. С помощью систем, аналогичных фаговому дисплею, среди продуктов трансляции таких олигонуклеотидов обнаруживают новые биологически-активные пептиды.

Четырехмерные модели организации экспрессии генов. Современные карты метаболических путей, с помощью которых пытаются с исчерпывающей полнотой представить все последовательности биохимических реакций, протекающих в клетке, своей чрезмерной сложностью обнаруживают слабость данного прямолинейного подхода к отображению биохимической информации. Попытки разворачивания на плоскости в виде двухмерной карты всей последовательности биохимических реакций, высокоупорядоченных в пространстве и во времени, делают такие всеобъемлющие схемы малоприменимыми на практике. С аналогичными трудностями придется столкнуться и генетикам при построении моделей, которые бы отображали многочисленные отношения между экспрессирующимися генами. Делом будущего является установление физических и функциональных связей между надмолекулярными комплексами высокоорганизованных в пространстве генетических подсистем, которые упорядоченно изменяются во времени. Реализация такого комплексного подхода к анализу генетических систем позволит отчетливо увидеть в цитозоле и органеллах клеток единую генетическую систему организма.

Генетический индетерминизм: генотип не определяет всей нормы реакции организма. Программа-максимум, которую можно было бы сформулировать, исходя из будущих достижений геномики, это предсказание всех морфологических и физиологических особенностей взрослого организма на основании одной лишь первичной структуры его генома или генотипа его родителей. Возможно ли это? Такая постановка вопроса напоминает рассуждения философов-детерминистов о предсказании любого события в мире при наличии полных знаний об исходных условиях, в которых оно происходит, а также о причинно-следственных связях между явлениями. История науки решила эту проблему не в пользу детерминистов. Выбор путей перехода сложной физической системы в альтернативные состояния часто бывает случайным. И в этом отношении живой организм, по-видимому, не является исключением.

Неопределенность преобразования генома в индивидуальном развитии.

Неопределенность понятия гена.

⇐ Предыдущая 88 89 90 91 92 93 94 959697 Следующая ⇒

Воспользуйтесь поиском по сайту: