Секвенирование нуклеиновых кислот


Секвенирование нуклеиновых кислот - это определение их первичной нуклеотидной последовательности.


Процесс подготовки проб: фрагменты ДНК, которые необходимо «прочитать» многократно копируются, затем нарезаются на короткие отрезки, которые будут служить матрицей для комплиментарных цепочек ДНК и очищаются.


Некоторые задачи генетического анализа:

  • расшифровка абсолютно неизвестных последовательностей ДНК, например, генома какого-нибудь нового вида (секвенирование "de novo");
  • обнаружение индивидуальных отличий конкретного образца от обобщенной последовательности, которая в общих чертах уже известна (ресеквенирование);
  • анализ генетических полиморфизмов, включая однонуклеотидные (SNP-типирование);
  • анализ эпигенетических модификаций ДНК, например профиля метилирования;
  • анализ профиля экспрессии отдельных клеток секвенированием кДНК, полученной из тотальной мРНК клетки, например, для диагностики вирусных и раковых заболеваний и др.

Таблица сравнения производительности секвенаторов.

Капиллярные секвенаторы:
  Модель   Формат   Количество
  капилляров
  Производительность
  за запуск
  310, Life Technologies   48/96   1   0,4 - 1,0 х 10 3 п.н.
  3500, Life Technologies   96/384   8   3,2 - 8,0 х 10 3 п.н.
  3500xl, Life Technologies   96/384   24   9,6 - 24,0 х 10 3 п.н.
  3730, Life Technologies   96/384   48   19,2 - 48,0 х 10 3 п.н.
  3730xl, Life Technologies   96/384   96   38,4 - 96,0 х 10 3 п.н.
  GeXP, Beckman Coulter   96   8   3,2 - 8,0 х 10 3 п.н.

Пиросеквенаторы:
  Модель   Количество
  проб
  Производительность
  за запуск
  PyroMark Q24, Qiagen   24   1,4 - 4,8 х 10 3 п.н.
  PyroMark Q96, Qiagen   96   5,7 - 19,2 х 10 3 п.н.

"NGS"-секвенаторы:
  Модель   Технология   Длина чтений   Производительность
  за запуск
  MiSeq, Illumina   Solexa   150 п.н.   1 х 10 9 п.н.
  GA IIx, Illumina   Solexa   150 п.н.   95 х 10 9 п.н.
  HiScanSQ, Illumina   Solexa   100 п.н.   150 х 10 9 п.н. (+ Arrays)
  HiSeq 1000/1500, Illumina   Solexa   100 п.н.   300 х 10 9 п.н.
  HiSeq 2000/2500, Illumina   Solexa   100 п.н.   600 х 10 9 п.н.
  PGM, Life Technologies   ionTorrent   200 п.н.   1 х 10 9 п.н.
  IonProton, Life Technologies   ionTorrent   200 п.н.   100 х 10 9 п.н.
  5500, Life Technologies   SOLiD   60 п.н.   10 х 10 9 п.н.
  5500xl, Life Technologies   SOLiD   60 п.н.   300 х 10 9 п.н.
  5500w, Life Technologies   WildFire   60 п.н.   1000 х 10 9 п.н.
  GS Junior, Roche   454   500 п.н.   4 х 10 7 п.н.
  GS FLX+, Roche   454   900 п.н.   7 х 10 8 п.н.


Классификация генетических анализаторов.

  1. По гомогенности пробы:
  2.    ♦ гомогенная проба (очищенный раствор молекул НК, полученных из одного источника, одинаковой структуры и практически одинаковой длины) -
        "классические" секвенаторы;
       ♦ негомогенная проба ("библиотека" молекул НК, которые могут отличаться по длине, по структуре и могут быть получены из различных источников) -
        "NGS" - секвенаторы.
  3. По длине прочтений:
  4.    ♦ короткие чтения;
       ♦ средние чтения;
       ♦ длинные чтения.
  5. По используемой технологии:
  6.    ♦ метод Маскама и Гилберта (химический);
       ♦ технология по методу Сэнгера;
       ♦ метод пиросеквенирования;
       ♦ технология "454";
       ♦ технология "ionTorrent";
       ♦ технология "SOLiD";
       ♦ технология "Solexa";
       ♦ технология "WildFire".
  7. По количеству отдельных чтений за запуск.
  8. По количеству одновременно анализируемых образцов (мультиплексирование).
  9. По времени, необходимому на запуск.
  10. По дополнительным требованиям.
  11. По стоимости секвенатора.
  12. По стоимости одного запуска.
  13. По стоимости анализа отдельной пробы.
  14. По методам генетического анализа.


Методы секвенирования.

Метод Маскама и Гилберта (химический).
Один из методов основан на химической деградации ДНК. Он был предложен в 1976 году Максамом и Гилбертом и назван их именем. Суть метода сводится к следующему: один из концов фрагмента ДНК метят с помощью изотопа фосфора 32Р. В последнее время вместо радиоактивной вводят флюоресцирующую метку. Ее можно «цеплять» и к нуклеотидам, причем для каждого типа нуклеотидов подбирать различную окраску. Препарат меченой ДНК делят на четыре порции и каждую из них обрабатывают реагентом, специфически разрушающим одно или два из четырех оснований, причем условия реакции подбирают таким образом, чтобы на каждую молекулу ДНК приходилось лишь несколько повреждений.
Разрушение идет в 2 этапа. На первом этапе происходит модификация азотистого основания и последующее выщепление его. На втором этапе производят гидролиз ДНК в местах выщепления оснований. Пуриновые основания модифицируются диметилсульфатом. Адениновые остатки метилируются по третьему атому азота, гуаниновые – по положению N7. Если такую модификацию обработать 0,1 М HCl при 0оС, то выщепляется метиладенин. При последующей инкубации в щелочной среде (0,1 М NaOH) при температуре +90оС происходит разрушение сахаро-фосфатной связи в местах выщепления оснований. Обработка поврежденных молекул пиперидином приводит к гидролизу ДНК по остаткам метилгуанина. Пиримидиновые основания модифицируются гидразином. В бессолевой среде модифицируется и цитозин, и тимин, в присутствии 2 М NaCl модифицируется только цитозин. При дальнейшей обработке пиперидином происходит расщепление ДНК по точкам модификации. Можно использовать и другие реакции химической модификации оснований и расщепления по ним молекул ДНК. В результате получается набор меченых фрагментов, длины которых определяются расстоянием от разрушенного основания до конца молекулы. Фрагменты, образовавшиеся во всех четырех реакциях, подвергают электрофорезу в четырех соседних дорожках; затем проводят радиоавтографию, и те фрагменты, которые содержат радиоактивную метку, оставляют "отпечатки" на рентгеновской пленке. По положению отпечатков можно определить, на каком расстоянии от меченого конца находилось разрушенное основание, а зная это основание - его положение. Так набор полос на рентгеновской пленке определяет нуклеотидную последовательность ДНК. Аналогично наблюдают флюоресцентное окрашивание. Если для каждого из четырех нуклеотидов был подобран свой цвет флюоресцентной метки, то при электрофорезе их наносят на 1 дорожку. Тогда расположение нуклеотидов отмечено штрихами разного цвета, а процедуру считывания легко автоматизировать.


"Классический" метод Сэнгера (ферментативный).
Метод секвенирования НК путем "обрыва цепи" (Ф.Сэнгер) основан на синтезе новой ДНК-цепи на анализируемой ДНК-матрице с участием ДНК-полимеразы в присутствии праймера и смеси дезоксинуклеотидтрифосфатов (dATP, dGTP, dCTP, dTTP) и на случайном обрыве синтезируемой цепи при встраивании одного из меченных разными флуоресцентными красителями дидезоксинуклеотидов (ddATP, ddGTP, ddCTP, ddTTP). Поскольку "обрыв цепи" происходит статистически, то получается весь набор ДНК-фрагментов, отличающихся между собой по длине всего на один нуклеотид. Затем полученная смесь ДНК-фрагментов обрабатывается формамидом для расхождения цепей и подвергается капиллярному электрофорезу в полиакриламидном геле, в результате чего фрагменты распределяются по длине. Сканирование лазером, возбуждающим флуоресценцию красителей, которыми были помечены дидезоксинуклеотидфосфаты, позволяет определить последовательность нуклеотидов исходной молекулы НК.

В клетке ДНК-полимераза I участвует в процессе репликации, заполняя пробелы между вновь синтезированными фрагментами ДНК (фрагментами Оказаки). Для работы фермента в пробирке требуются предшественники ДНК - дезоксирибонуклеотидтрифосфаты (dNTP), а также одноцепочечная матрица, на которой должен быть небольшой двухцепочечный участок - затравка, с которого начинается синтез (рис. 1). Синтезированы модифицированные дидезоксирибонуклеотиды, в которых дезоксирибоза 3’-ОН отсутствует, для каждого из четырех оснований ДНК. ДНК-полимераза включает эти предшественники в ДНК. Однако, включившись в ДНК, модифицированное основание не может образовать фосфодиэфирную связь со следующим дезоксирибонуклеотидом. В результате рост (элонгация) данной цепи останавливается (терминируется) в том месте, где в ДНК включился дидезоксирибонуклеотид (ddNTP). Поэтому их называют терминаторами элонгации.

     Рис. 1. Ферментативный метод секвенирования ДНК.

Реакционная смесь по Сэнгеру состоит из цепи ДНК, нуклеотидную последовательность которой надо определить, короткого фрагмента "меченой" ДНК, комплементарной концевому отрезку этой цепи (затравка), одного из четырех ddNTP и соответствующего dNTP в строго определенном соотношении (чтобы они конкурировали), а также остальных трех dNTP. Готовят четыре смеси, каждая из которых содержит один из четырех ddNTP. В каждой из пробирок образуется набор меченых фрагментов разной длины. Длина их зависит от того, в каком месте в цепь включен дефектный нуклеотид. Полученные меченые фрагменты ДНК разделяют в полиакриламидном геле (с точностью до одного нуклеотида), проводят радиоавтографию и по картине распределения фрагментов в четырех пробах устанавливают нуклеотидную последовательность ДНК (рис. 1).

В настоящее время определение точной нуклеотидной последовательности любого сегмента ДНК умеренной длины - вполне разрешимая задача. Уже определена последовательность нескольких сотен генов про- и эукариот. Зная последовательность гена и генетический код, легко определить аминокислотную последовательность кодируемого им белка. Раньше для определения структуры белка приходилось делать тщательный и весьма трудоемкий анализ выделенного и очищенного белка. Сейчас часто бывает проще определить структуру белка через нуклеотидную последовательность, чем с помощью прямого секвенирования. Если секвенирование белка занимает месяцы и даже годы, то ДНК удается секвенировать за несколько недель.

Определение последовательности ДНК привело также к тому, что были обнаружены области, которые не кодируют белки, но принимают участие в регуляции экспрессии генов и репликации ДНК. В 1996 году был секвенирован геном дрожжей, в 1998 г. – геном арабидопсиса, в 2000 году – геном человека, однако в данном случае речь идет только об установлении последовательности нуклеотидов, так как генетическая структура и функции отдельных участков генома еще не идентифицированы, это более сложная задача.

Сразу вслед за разработкой быстрых методов секвенирования появились столь же быстрые и простые методы синтеза сравнительно длинных олигонуклеотидов с определенной, заранее заданной последовательностью. Теперь за три-четыре дня можно синтезировать последовательность из 12 - 20 нуклеотидов. Автоматизация этой процедуры еще более облегчает и ускоряет синтез. Появились приборы - ДНК-синтезаторы, которые выполняют эту работу за несколько часов.

В "классических" секвенаторах для анализа используется гомогенная проба. Обычно до начала секвенирования производят амплификацию участков ДНК, последовательность которых требуется определить, при помощи ПЦР. В результате получается гомогенная проба одинаковых ДНК-фрагментов. Негомогенность исходной пробы, или ошибки в ходе ПЦР-реакции могут привести к тому, что не удастся однозначно определить генетическую структуру молекулы нуклеиновой кислоты.


Метод пиросеквенирования.
Метод секвенирования НК (П. Ниреном) основан на синтезе новой ДНК-цепи на иммобилизированной анализируемой ДНК-матрице с участием ДНК-полимеразы в присутствии праймера при последовательном добавлении каждого дезоксинуклеотидтрифосфата (dATP, dGTP, dCTP, dTTP). При встраивании нуклеотида стехиометрически высвобождается пирофосфат (PPi). Пирофосфат (PPi) ферментом ATP-сульфурилазой в присутствии аденозин-5'-фосфосульфата (dATPαS) превращается в ATP, которая является "топливом" для фермента люциферазы, превращающей люциферин в оксилюциферин с испусканием света. Свет регистрируется камерой и далее анализируется компьютерной программой. Невстроенные нуклеотиды подвергаются деградации ферментом апиразой, и реакция начинается с новым нуклеотидом.


Бисульфитный метод.
Метод для определения паттерна (профиля) метилирования ДНК основан на бисульфитной обработке ДНК, первращающей остатки цитозина в остатки урацила, но не затрагивающей метилированные остатки 5-метилцитозина. Дальнейший анализ сводится к различению однонуклеотидных полиморфизмов, и к разделению цитозинов и тиминов в прочитанных последовательностях.