Если уж речь идет и размерах, то надо смотреть на минимальный размер генома в пределах класса или рода, который является более показательным и отражает сложность данного генома.
См.слайд 1.18. Максимальный размер генома в основном связан с полиплоидизацией. У растений чрезвычайно легко проходит полиплоидизация, поэтому у них наблюдается высокий разброс размера генома. У амфибий такой довольно большой разброс обеспечивается достаточно легко протекающей полиплоидизацией. Внутри рода Xenopus есть виды, которые отличаются своей плоидностью (диплоидные, тетраплоидные, гексаплоидные). Не смотря на различия в плоидности, основные характеристики генов будут одинаковы. Если учитывать минимальный размер генома, то получается относительно плавный график. В этом графике размер генома монотонно возрастает в соответствии с нашими представлениями о сложности организации данного организма. См. слайд 1.16.,1.14. Короче, корреляция со сложнотью устройства организма больше прослеживается не в размере генома, а в минимальном количетсве генов для данной группы организмов. Гораздо более показательной характеристикой генома является не его размер, а количество генов в геноме. Лучше брать минимальное количество генов в каждой группе, чтобы не мучаться с тем, кодуа отнести полиплоидов. Для микоплазм характерно минимальное количество генов – это 500 генов, для бактерий – 1,5 тысячи, для одноклеточных эукариот около 5 тысяч или чуть меньше генов, для дрозофилы – 13 тысяч генов, у растений – 25 - 26 тысяч генов и у млекопитающих 23 тысяч генов (нынешний консенсус относительно количества генов в геноме млекопитающих). Это из секвенированных геномов. Растения и млекопитающие по количеству «уникальных»? генов принципиально не различаются. Если взять произвольного представителя млекопитающего и растения, то у растения количество всех генов будет в несколько раз больше, чем у млекопитающих. Одноклеточные эукариоты по количеству генов в геноме млекопитающих отличаются непринципиально (в 4 раз количество генов отличается), а размер генома млекопитающих во много раз больше (12 млн пар нуклеотидов у одноклеточных эукариот и 3 млрд у млекопитающих, то есть на 2 порядка больше). Нестыковка количества генов с количеством нуклеотидных пар в геноме объясняется тем, что значительная часть генома является некодирующей последовательностью. Некодирующая последовательность почти вся состоит из в той или иной степени повторяющейся ДНК, что является результатом деятельности транспозонов. Геном эукариот очень толерантен к избыточному количеству ДНК. В настоящее время нет однозначного объяснения, почему геном эукариот толерантен к избыточному количеству ДНК.
Этот слайд показывает процент уникальных и повторяющихся последовательностей, последние бывают высоко повторяющиеся, сателлитными ДНК и умеренно повторяющиеся и высоко повторяющиеся последовательности. В этой таблице для E. coli получилось 100% уникальных последовательностей, что не совсем верн о, т. к. у нее есть транспозоны. Транспозонов редко бывает больше, чем несколько штук. Чем сложнее организм, тем большее количество повторов содержится в его геноме. У нематод достаточно много уникальной ДНК, у мух чуть меньше. Для высших организмов, особенно для млекопитающихся и для большинства растений, как минимум половина генома – это повторы. Есть просто транспозоны, а есть еще и сегментные дупликации, которые широко представлены в геномах растений. Как появляются сегментные дупликации? Считается, что большая часть таких дупликации – это результат сначала полиплоидизации генома, а затем перестроек этого полиплоида. На примере генома Arabidopsis считается, что в геноме можно проследить последствия двух полных дупликаций генома. Данные области на хромосоме являются синтемичными областями. Синтемичные области представляют собой гомологичные последовательности, расположенные в одинаковом порядке, которые могут прерываться какими-то негомологичными последовательностями. Гомологичные участки могут располагаться на различных хромосомах или на одной хромосоме. Кодирующие последовательности значительно более консервативны, чем некодирующие, поэтмоу на них основное внимения при поиске дупликаций обращают.
Множество таких дупликаций располагаются в пределах одной хромосомы с одного плеча на другое – это возможно, вероятно, когда после дупликации даннйо хромосомы ее участок вернулся на исходную хромосому.
Корреляция размера и количества генов. Для бактерий размер генома строго пропорционален количеству генов в этом геноме. Это связано с тем, что в среднем до 9 0% генома у бактерий представляет собой кодирующую ДНК, причем уникальную в большинстве случаев. В редких случаях наблюдаются существенные отклонения (Micobacterium lepra – редуцирующийся геном, много псевдогенов). Даже если сравнивать Micobacterium lepra с Micobacterium tuberculosis, то у Micobacterium lepra примерно половина генов является нефункциональной (псевдогены). Причем, псевдогены Micobacterium lepra возникли относительно недавно. Поэтому число генов Micobacterium lepra намного меньше размера генома (около 2 тыс. генов). Просто стандартные механизмы удаления нефункциональной ДНК из бактериального генома еще не успели поработать должным образом в геноме Micobacterium lepra. Micobacterium lepra это относительно новый патоген, который еще не привел свой геном в соответствие с необходимым кодирующим потенциалом. Существенные отклонения есть и у Mycoplasma genitalium. Для многоклеточных организмов количество генов стартует от 13 тысяч – это минимально количество из сиквенированных геномов. Полиплоидизация значительно увеличивает количество генов. Если взять растения, у которых известно количество генов, то у риса – 40 - 50, у тополя за 50 тысяч генов в геноме. Как измерять плотность генома? (Таблицу наизусть, т. к. она четко показывает основные характеристики генома.) Для бактерий средний размер генома – 3 - 4 млн нуклеотидных пар. В этом геноме кодируется столько же тысяч генов (срединй размер рамки 950 п.о.). Для дрожжей 12 – 14 млн пар нуклеотидов и 5-5.5 тысяч генов. Для растений минимум 125 млн пар нуклеотидов и 25 – 26 тысяч генов. Для нематод 100 млн пар нуклеотидов и 18 – 19 тысяч генов. Для двукрылух (точнее для дрозофилы) характерен минимальный размер генома от 180 млн пар нуклеотидов в геноме и около 13 – 14 тысяч генов. У Anopheles gambiae в геноме за 278 млн нуклеотидных пар, а у ближайшего родственника этого комара имеют геномы по 400, 600 и 800 млн пар нуклеотидов в геноме. Среди комаров также распространена полиплоидизация. Каждый год для Homo sapiens «теряется» приблизительно тысяча генов.
См. слайд 1.22.,1.23 Если анализировать белки, то оказывается, что сходство внутри протеома одного и того же организма, как правило, сводится только к частям белков, к отдельным доменам (обособленным функциональным блокам белков). Если рассматривать сходство доменов, то можно все число доменов, которое присутствует в протеоме данного организма, упростить (т. е. считать сходные домены за один). Тогда получаются вот эти цифры. Это число уникальных белковых доменов (фактически это число семейств белковых доменов). Реально домены внутри одного семейства выполняют одну и ту же функцию. Это число функциональных модулей, из которых собраны белки организма. Существует 700 - 750 таких доменных семейств. Все эти цифры одного порядка. Шаг от бактерий к одноклеточным эукариотам совсем небольшой, добавляется всего 100 доменных семейств. От одноклеточным эукариотам к многоклеточным – добавляется еще примерно 150 доменных семейств. Арабидопсис имеет на 150 доменных семейств больше, чем нематода. Позвоночные животные имеют на 200 доменных семейств больше, чем беспозвоночные. Колоссальное различие между бактериями и дрожжами, дрожжами и беспозвоночными, беспозвоночными и позвоночными обеспечивается минимальными различиями на уровне белковых доменов. Вывод из этой информации: основные эволюционные процессы идут не за счет изобретения каких-то новых белковых структур, а за счет рекомбинации уже имеющегося материала. В ходе эволюции образуются различные комбинации из одних и тех же белковых модулей. Новые комбинации несколько видоизменяются, чтобы «подшлифовать» входящие в белок домены для оптимальной совместной работы. В результате получается существенно большее количество белков, а исходные первичные аминокислотные последовательности различаются слабо.
Интересно, что у многокеточных эукариот определенного таксона – более 60% генов являются для него специфичными, присутствующими только в нем, т.е. такая уникальность в генных последовательностях различных таксонов обусловленная всего лишь перекомбинацией универсальных в определенной степени структурных единиц, кодирующих домены. Если сравнивать крупный таксон в рангах класса для многоклеточных животных с каким либо другим таксоном в этом классе, то приблизительно половина или чуть меньше всех белков оказывается уникальными. Когда мы говорим об уникальных белках, мы не учитываем то, что в состав этих якобы уникальных белков входят совсем не уникальные домены. Это уникальная рекомбинация белковых доменов, которая отличает данный таксон от другого. См. слайд 1.24. Лишь 1% генома человека это экзоны, которые действительно что-то кодируют. В этот 1% входят кодирующие белок гены и не кодирующие белок гены (т. е. гены микроРНК). Гены занимают приблизительно одну четверть всего генома человека, т. к. интроны очень длинные. В интронах много «мусора», там располагается значительная часть транспозонов. У растений интроны короткие, т. к. не содержат транспозонов. Гены растений значительно более компактные, не смотря на то, что они состоят из такого же количества интронов и экзонов. Это связано с особенностями сплайсинга у растений. У животных есть системы сплайсинга, способные находить и состыковывать далеко расположенные экзоны друг с другом. У растений такая система отсутствует либо она не эффективна и поэтому нет транспозонов внутри генов. Транспозоны присутствуют у растений в межгенных областях. Около половины всего генома человека – это транспозонные элементы. Но это не активные транспозонные элементы. В геноме человека активен лишь один транспозон (L1?), все другие мобильные генетические элементы инактивированы. Даже у ближайших родственников человека транспозоны более активны. У человекообразных обезьян транспозоны более активны, а у других млекопитающих они значительно более активны. См. слайд 1.26. Сколько генов из имеющихся абсолютно необходимы живому организму для судествования? На данном слайде все абсолютно необходимые гены разбиты на функциональные категории (гены базового метаболизма ДНК, гены экспрессии информации, заложенной в ДНК). Наиболее показательными исследованиями в этой области являются исследования под руководством Вентера, которые осуществлялись по направленной инактивации генов в геноме Mycoplasma. В геноме Mycoplasma есть приблизительно 500 генов. В результате данного исследования было обнаружено, что приблизительно 300 – 350 генов являются минимальным набором функций, который необходим для поддержания клеточной формы жизни в абсолютно идеальных лабораторных условиях. У других организмов (особенно у эукариот) сложно проводить подобные эксперименты по инактивации генов.
В конце 90-х годов стала доступна методика РНК-интерферениции. Вышли стать по инактивации генов у Caenorhabditis elegans с помощью метода РНК-интерферениции. Параллельно с этими работами были опубликованы данные по геному Caenorhabditis elegans. Для осуществления РНК-интерференицииу Caenorhabditis elegans, Caenorhabditis можно кормить E.coli, которая экспрессирует интерферирующую ДНК. Для РНК-интерферениции необходима двухцепочечная РНК, т. к. она узнается комплексом DICER (?). DICER преобразует двухцепочечную РНК в малую интерферирующую РНК. RISC-коплекс (в его состав входит и SLICER) сначала разделяет малую интерферирующую РНК, а потом гибридизует (?) одну из цепей с матрицей. В копийный вектор с двумя промоторами вставляются гены, необходимые для РНК-интерферениции. С помощью этого вектора синтезируется смысловая и антисмысловая цепи. В результате клетка получает достаточное количество двухцепочечной РНК. Нематода ест клетки с большим количеством двухцепочечной РНК. Были клонированы абсолютно все гены нематоды. Была сделана попытка определить с помощью метода РНК-интерферениции гены нематоды, которые являются жизненно необходимыми. В результате этих экспериментов было обнаружено, что только 10% всех генов являются жизненно необходимыми (т. е. инактивация этих генов была летальна для нематод). Инактивация оставшихся 90% генов нематод не привела к летальному исходу. Но эффективность сайленсинга никогда не бывает стопроцентной, в лучшем случае она составляет 95% (т. е. в клетке разрушено 95% данной РНК). В некоторых случаях для выполнения определенных функций в клетке достаточно и 5% данной РНК. С помощью инактивации генов методом РНК-интерферениции было обнаружено, что у дрозофилы к жизненно необходимым генам относится только ¼ всех ее генов. Из-за не 100% эффективности методики РНКи сложно сказать, насколько полученным результатам можно верить. Лекция №3 КЛАССИЧЕСКИЕ ПОДХОДЫ К ОПРЕДЕЛЕНИЮ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГЕНОМА Конструирование геномных библиотек проводят, даже если сиквенс известен. На схеме представлены 2 альтернативных подхода к секвенированию генома. Классический подход («клон за клоном»), когда сначала делается какая-то геномная карта, затем делается коротенькая библиотека со вставками определенной длины (энциклопедия генов) – от нескольких десятков до нескольких сот т.н.п., потом делается дробление на небольшие случайные фрагменты (Шотган), они секвенируются с двух концов, с каждого по 500-1000 н.п., из этих последовательностей собираются последовательности сначала одного кусочка, а потом такие куски стыкуются друг с другом. Есть несколько нюансов: 1. Сначала может быть построена физическая карта, и клоны могут быть упорядочены относительно друг друга, потом их состыковывают. 2. Сначала пытаются состыковать клоны между собой, потом то, что не стыкуется, стыкуют друг с другом при помощи методик физического картирования. Альтернативный подход – шотган всего генома, когда геном сразу полностью дробится на случайные куски, из которых пытаются собрать какую-то последовательность, а потом собранные кусочки располагают на геномной карте. Стадия финиширования при этом получается достаточно длинной. Таким образом, есть два подхода: шотган и «клон за клоном». Шотган быстрее, легче автоматизируется, но дает геномы худшего качества, с достаточно большим числом ошибок. При иерархическом подходе, когда секвенируется клон за клоном, затрачивается больше ручного труда и получается в целом медленнее, но качество сиквенса получается более высокое. Если посмотреть на последовательность фаз геномных проектов, то первая и последняя всегда одна и та же. Первая – конструирование геномных библиотек, последняя – аннотация генома, поскольку голые буквы ничего не значат, а промежуточные стадии немножко различаются. В случае иерархического подхода одновременно идет физическое картирование и отбор клонов секвенирования, т.к. физические карты строятся на основе этих клонов, это 2 совмещенных стадии. Потом, когда карта уже есть, идет (шотган?) секвенирование уже небольших клонов. Выделенные жирным шифтом стадии наиболее продолжительны. В случае Шотган-подхода сначала идет массовое секвенирование случайных клонов, затем компьютерное конструирование геномных последовательностей, потом – закрывание пробелов, которых получается довольно много (финиширование). Как правило, здесь не обходится без создания геномных библиотек, в которые попадают клоны, отсутствующие в первичном Шотгане. Эта стадия наиболее трудоемкая. И то, и другое сводится к физическому картированию генома, но в первом случае (шотган) картируется небольшая часть генома, а во втором случае («клон за клоном») – весь. Первый вариант быстрее и дешевле, и хуже, второй – дороже, но качественнее.
Воспользуйтесь поиском по сайту: ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|