История
История
На втором вебинаре 12 ноября 2021 г, посвященном высокопроизводительному секвенированию, Диана Дроботова, ведущая направление по генотипированию в компании Thermo FS, рассказала об аппаратном обеспечении и реактивах компании для генотипирования на основе технологии NGS – панели AgriSeq и микрочипового анализа Axiom – в исследованиях растений, в том числе для селекции сельскохозяйственных культур в аграрном и лесном секторах.
Перспективная востребованная технология высокопроизводительного генотипирования, популярная сейчас в Европе и во всем мире, активно внедряется и в российскую научную практику, в том числе в растениеводстве.
Преимущества геномной селекции и в растениеводстве и в животноводстве состоят в том, что существенно сокращается время, которое требуется для получения новых сортов растений. Стандартная классическая селекция сопряжена с определенными ограничениями и трудностями. В частности, гены при скрещивании остаются связанными друг с другом, и в дальнейшем это затрудняет определение каких-то положительных свойств и качеств. Более того: выбранные гены могут передаваться с нежелательными. Либо вместе с приобретением одного желательного гена происходит потеря другого. Так что такое скрещивание сопровождается появлением огромного количества новых неизвестных генетических перестроек. Одним словом. классическая селекция сегодня – это метод трудоемкий и неточный.
Если говорить о геномной селекции, то существенно сокращается время получения нового сорта. Если в классической нужно несколько лет, то в геномной в течение нескольких месяцев можно получить полную информацию о растении и принять решение, использовать ли его далее в селекции. Такие технологии позволяют получить растения с выбранными характеристиками и затем использовать их в программах селекции. Существенно сокращается не только время, но и собственно стоимость работы по получению улучшенного генофонда.
Использование геномной селекции в растениеводстве нужно для нескольких целей.
Прежде всего это поиск новых маркеров, связанных с высоким потенциалом урожайности, качеством культур, с устойчивостью к определенным местным условиям выращивания, улучшенной питательной ценностью, с какими-то фенотипическими свойствами. Селекция на устойчивость позволяет снизить потери урожая вследствие воздействия болезней и вредителей.
Кроме того, можно искать маркеры, которые связаны с качеством, например, зерна, выходом муки, числом падения, содержанием крахмала и белка, высотой амилограммы.
Можно уточнять происхождение сорта, строить филогенетическое дерево, а также получать новые сорта растений, в том числе с полигенной устойчивостью, производить оценку и обеспечивать сохранность полученного генетического фонда растительных культур без потери целевых свойств. Известно, что большинство каких-то фенотипических признаков связаны не с одним, а с несколькими генами, и потому важно найти максимальное количество генов, связанных с каким-либо признаком.
И самое главное, что дают геномные технологии в селекции растений – поддержание генетического разнообразия, оценка генетического потенциала.
Любая селекция строится на четырех главных задачах:
(Рис. 1)
- создание референсной выборки растений;
- выбор модели, оценка модельных параметров по референсной выборке – это зависит от задач лаборатории;
- применение выбранной построенной модели к рабочей выборке;
- актуализация референсной выборки и как результат – оценка точности геномной селекции.
Одна из сложных, трудоемких и дорогостоящих задач – это создание референсной выборки растений. Это основная задача, с которой сталкиваются все селекционеры.
Если мы оценить тренды рынка научных технологий, можно увидеть, что по оценкам западных экспертов ожидается рост востребованности технологий, связанных с генотипированием примерно в полтора-два раза. Востребованность маркер-ассоциированной селекции (когда работают с маркерами, которые нашли) к 2026 г планирует показать рост в полтора раза. Примерно такой же рост прогнозируется для спроса на технологию чипов.
Сейчас огромное количество исследований и акцентов связывают именно с геномными технологиями, прежде всего с генотипированием – с поиском новых маркеров, их валидацией, и собственно само понятие генотипирования – инструмент генотипирования – работает с единичными нуклеотидными заменами, так называемыми SNP, которые распределены по геному растения или животного. Их насчитывают миллионы, но не все полиморфизмы связаны с какими-то признаками. Селекционерам интересны маркеры, связанные с фенотипом, с какой-то предрасположенностью, с генетическими заболеваниями. Поэтому поиск новых маркеров, «снипов» или полиморфизмов, и валидация открытых – то, чем занимается генотипирование как технология. Инструмент – это и есть те самые маркеры, которые ищут исследователи.
Это нужно для получения дополнительной информации о генах и связанных с ними полиморфизмах. Нужно найти ассоциацию – провести так называемый GWAS, полногеномный поиск ассоциаций между полиморфизмами и фенотипическими признаками.
И точность отбора, и точность селекционных программ зависит от количества полиморфизмов, найденных на первом этапе. Чем больше полиморфизмов найдено применимо к объекту исследования, тем точнее будет селекция.
Схематически это выглядит так. В начале селекции необходимо получить максимальное количество полиморфизмов для дальнейшей сортировки, фильтрации и выбора нужных маркеров. На первом этапе для этого используется две технологии – NGS (полногеномное секвенирование) либо использование микрочипов высокой плотности, то есть примерно несколько сотен тысяч, до миллиона маркеров.
Вторым этапом будет проверка, валидация этих маркеров, потому что не все полиморфизмы хорошо работают, не все они связаны с какими-то признаками, и на втором этапе исследователи переходят к микрочипам средней плотности – примерно несколько десятков тысяч полиморфизмов. На этом этапе валидируются и выбираются маркеры, которые представляют интерес.
После того, как выбраны нужные маркеры, которых обычно насчитывается несколько сотен (в пределах тысячи, в каких-то случаях 2000), потребуется рутинный скрининг. Это по сути диагностика, скрининг, в котором растения регулярно тестируются на определенное количество маркеров (в пределах тысячи). Эта технология носит название таргетного NGS, это маркер-ассоциированная селекция.
Компания ThermoFisher Scientific предлагает решения под любые задачи связанные с геномной селекцией.
На первом этапе для поиска новых маркеров используется NGS и чипы высокой плотности. Потом, когда количество маркеров сокращается, при переходе в маркер-ассоциированную селекцию, потребуется таргетное генотипирование с использованием метода NGS. Далее при сокращении маркеров менее чем до 100 используются ПЦР и капиллярный электрофорез.
Thermo FS является пионером в области разработки и внедрения микрочипов и на сегодня занимает лидирующее положение в мире по инновациям и широте решений, предлагаемых для геномной селекции.
Как видно, невозможно использовать один какой-то метод в геномной селекции, потому что ее процесс предусматривает несколько различных этапов, каждый из которых требует определенного оборудования, предназначенного для решения определенных задач. Поэтому Thermo FS максимально охватывает все задачи, которые могут быть связаны с внедрением геномной селекции.
Наверно, одна из самых интересных и перспективных технологий, которая сейчас имеет бешеную популярность в России, особенно в 2021 году – видимо, после пандемии – это технология микрочипов. (Рис. 3)
Генотипирование с использованием микрочипов Axiom – это задачи больше научно-исследовательского плана, поисковые, связанные с полногеномным поиском и валидацией полиморфизмов.
Работать приходится с неизвестными либо с известными полиморфизмами, чтобы выбрать маркеры, релевантные к целевым сортам. Это могут быть некие известные и широко использованные сорта, а могут быть какие-то местные, уникальные для отдельных регионов России.
Для этого на данном этапе используется технология микрочипов – чипы высокой и средней плотности.
Чип представляет собой плашку, состоящую из 96 лунок, каждая из которых – это один образец. Если рассмотреть эту лунку, можно увидеть, что она содержит ДНК-зонды, которые были нанесены на поверхность микрочипа методом фотолитографии. Это отличительная особенность решений Thermo FS от других технологий, это уникальная характеристика чипов, представляемых компанией.
Каждая лунка состоит из нескольких сотен тысяч ячеек – квадратиков размером 5 на 5 микрон, каждый из них содержит огромное количество одинаковых зондов, чтобы один полиморфизм специфично связался с ДНК-зондом. Если говорить о чипе высокой плотности – несколько сотен тысяч маркеров – то сетка будет разбиваться на несколько сотен тысяч квадратиков.
Другие технологии чипов, распространенные сейчас на рынке, имеют определенные ограничения.
(Рис. 4)
Самый яркий пример – это технология с использованием микрочастиц. При производстве чипов у других производителей используется пул частиц. Зонды присоединяются к специальным частицам – шарикам, а затем, когда производится покрытие чипа, этот пул частиц наносится рандомным способом. Соответственно, часть этих частиц просто вылетает, не доходит до своих мест прикрепления лунок на чипе, и получается, что примерно от 5 до 20% маркеров на таких сторонних чипах теряется. Поэтому пользователь, который заказывает себе условные 50 тысяч маркеров, в реальности получает гораздо меньше ввиду ограничения технологии.
Поэтому задачей Thermo FS было предложить рынку технологию, которая не имеет таких ограничений, потому что очень важно на первом этапе селекции максимально охватить маркеры, которые могут быть связаны с какими-то признаками.
Технология фотолитографии позволяет поддерживать одинаковый контент – набор маркеров – независимо от партии: первая ли это партия, когда мы только начинаем работать, либо это партии через год или два.
Синтез ДНК-зондов происходит непосредственно на чипе в режиме реального времени, мы фактически видим, в каком месте какой нуклеотид присоединяется, то есть обеспечен контроль синтеза зондов в режиме реального времени. Поэтому при использовании данной технологии отсутствует выпадение маркеров.
Thermo FS работает со сложными геномами, берет в работу не только стандартные простые геномы, но и работает с биаллельностью, с высокой долей ГЦ оснований в составе, с гомологией/псевдогенами, определяет копийность благодаря программному обеспечению с широкими возможностями.
(Рис. 6)
С помощью чипов определяют 4 вида маркеров: не только «снипы», но и инсерции, делеции и вариации числа копий генов, которые также связаны с какими-либо признаками.
Очень часто спрашивают, как сравнивать результаты, поскольку есть много разных референсных баз. Формат данных Thermo FS, который получается на приборах компании, можно конвертировать в различные другие форматы, например, Long Format (Illumina) для сравнения результатов.
У программного обеспечения Axiom Analysis Suite есть отдельный пакет FitTetra или Fitpoly, позволяющий работать с полиплоидными и диплоидными организмами, что крайне важно в генотипировании растений.
Thermo FS предлагает три формата:
- 96 образцов – чип высокой плотности, несколько сотен тысяч маркеров;
- 384 образца – чип средней плотности, около 65 тысяч маркеров;
- «Мини-96» – 96 образцов с таким же контентом, как в формате 384, но для использования меньшего количества образцов. Он пригоден для рутинных задач, когда образцов не так много.
h2>Аппаратное обеспечение и рабочий процесс технологии Axiom«Сердце» системы – сканер микрочипов GeneTitan Multi-Channel Instrument. Эта станция позволяет автоматизировать все этапы работы с микрочипами, начиная от гибридизации, окрашивания, получения изображения, промывок – прибор делает все самостоятельно. Нет необходимости каких-то ручных манипуляций.
Рабочий процесс, схема которого представлена выше, занимает около 5 дней с момента выделения пробы, включая амплификацию, гибридизацию, связывание, получение сигнала. В среднем все эти процессы занимают около недели в зависимости от протокола.
(Рис. 7)
На первом этапе требуется стандартная пробоподготовка, полногеномная амплификация, фрагментация, она осуществляется в течение двух дней. В первый день работа ведется примерно полтора часа, второй день также полтора часа и дальше на третий день чип загружается в станцию. Дальнейшие этапы производятся внутри станции.
Thermo FS располагает самым большим каталогом микрочипов. Если просуммировать готовые чипы и пользовательские решения, изготовленные для партнеров, это не даст исчерпывающего списка продукции, а составит лишь его небольшую часть, поскольку многие компании не готовы открыто делиться информацией о том, какие чипы от каких производителей они используют, и потому связанная с ними продукция не фигурирует в информационных материалах Thermo, что не отменяет активного международного партнерства компании по всему миру.
На слайде представлены данные, свидетельствующие, что работа ведется и с основными объектами – пшеница, кукуруза, рис, рожь, соя – и с уникальными, особенными. Есть работы, связанные с хлопком, клубникой, розой, виноградом, картофелем, рисом и т.д. Перечень очень обширен. В некоторых случаях Thermo FS просит своих партнеров поделиться контентом – раскрыть его, это очень важно для российских пользователей, да и вообще возможность такого общения с любым пользователем очень значима.
В качестве примера приведено несколько слайдов главного и востребованного во всем мире чипа по генотипированию пшеницы Axiom Wheat HD genotyping Array.
Набор состоит из двух чипов высокой плотности. Так как пшеница полиплоидная, количество зондов на каждый маркер увеличено. Поэтому для охвата максимального количества полиморфизмов 817 тысяч полиморфизмов разбито на два чипа. Так что комплект включает в себя два чипа обязательно. Набор может быть использован в селекционной программе, направленной на ускорение генетического улучшения современных сортов пшеницы.
Все полиморфизмы были получены совместно с университетом Бристоля (Великобритания) – это одно из главных учреждений по работе с пшеницей. у Thermo FS с ним была совместная работа, связанная с изготовлением первого коммерчески доступного чипа. Все результаты, которые сейчас находятся внутри чипа Axiom Wheat HD genotyping Array – это маркеры, найденные в результате взаимодействия с этим университетом.
Обычно этот чип используют на первом этапе, когда начинают работать с местными (пользовательскими) сортами пшеницы. Чип предоставляет возможность максимального охвата полиморфизмов, поиска и выбора полиморфизмов, которые ассоциированы с конкретными линиями.
При этом можно определять локусы количественных признаков, проводить разработку предпосевной зародышевой плазмы – это одни из основных задач, которые можно решать с помощью чипа.
Контент получен путем 48-кратного секвенирования экзома 41 глобальной линии. Он включает в себя порядка 100 тысяч полиморфизмов десяти элитных сортов пшеницы, около 300 тысяч полиморфизмов элитных гексаплоидной пшеницы и девяти староместных сортов, около 650 тысяч «снипов» гексаплоидной пшеницы и родственников, включая Triticum urartu, Thinopyrum и рожь.
Следующий чип – Axiom Wheat Breeder`s genotyping Array.
(Рис. 8, 9)
Этот чип содержит чуть меньше маркеров, он тоже был разработан с университетом Бристоля и идеально подходит для скринингов в программе селекции пшеницы. Он решает сходные задачи. Здесь чуть меньше полиформизмов – информацию о чипе и описание контента можно посмотреть на специализированном сайте, эта информация есть в открытом доступе.
https://www.cerealsdb.uk.net/cerealgenomics/CerealsDB/indexNEW.php
(Рис. 10)
У Thermo FS есть сейчас несколько проектов из разных стран – не только в России. Пользователи заходят на сайт, выбирают полиморфизмы, которые есть в открытом доступе, и мы вместе решаем вопрос о кастомизации чипа. Не всегда все полиморфизмы нужны, иногда проще выбрать небольшое их количество, чтобы провести небольшой предварительный скрининг.
В любом случае в исследованиях наступает момент, когда потребуется кастомизация – индивидуальная разработка чипа. Дело в том, что стандартные чипы готовые предназначены для первичного скрининга, а задачи у каждой лаборатории свои, как и сорта растений, с которыми она работает. Поэтому в конечном счете следующим этапом будет переход к кастомным решениям.
И здесь Thermo FS также занимает лидирующие позиции именно по индивидуальной работе с клиентами. У компании есть все ресурсы, чтобы помочь пользователям выбрать контент, изготовить демо-дизайн, валидировать его и произвести в короткие сроки.
Важный момент выбора контента заключается в том, что не всегда пользователи знают, какие полиморфизмы, какие маркеры необходимо выбрать. Для создания кастомного чипа нужно знать полное описание маркера: на какой хромосоме находится, место его расположения. Но эта информация не всегда доступна пользователю. Поэтому команда биоинформатиков Thermo FS, которые работают с микрочипами, может помочь найти либо из открытых источников, либо из собственных баз Thermo, либо в общении с пользователями, готовыми поделиться контентом. Пользователю предложат перечень маркеров и затем помогут в их выборе, чтобы создать чип индивидуального дизайна.
Следующий важный этап – валидация чипа, потому что даже если найти описание и выбрать полиморфизмы, не всегда они работают хорошо.
Поэтому перед тем, как запустить большое производство кастомных чипов, изготавливается демо-чип, он валидируется – проверяется в работе с реальными образцами. Если все хорошо работает, производитель переходим к большой партии, к массовому производству.
Для изготовления партии индивидуальных чипов, в отличие от других компаний, Thermo FS не настаивает на больших заказах от пользователя. Поскольку все ресурсы у компании свои, она не зависит ни от кого и может изготовить совершенно небольшую минимальную партию заказа. Конечно, это зависит от характера чипов, средней или высокой плотности, количество составляет порядка 500 образцов. Производятся они в течение чуть более месяца: 4-6 недель достаточно для изготовления кастомного чипа.
Кроме того, на чипе можно совмещать разный контент. Например, если в институте есть несколько разных лабораторий или центр коллективного пользования, можно сделать кастомный чип для нескольких лабораторий, разбитый на несколько видов маркеров: одна его часть может относиться, например, к пшенице, другая к рису, кукурузе и т.д.
В настоящее время рабочий прибор, на котором производится такое генотипирование, расположен в лаборатории ООО «Геномед» (Москва).
(Рис. 11)
Туда можно приехать, посмотреть, как работает прибор, ознакомиться с технологией, сотрудники «Геномеда» ответят на все вопросы сторонних пользователей, заинтересованных в приобретении таких систем. Кроме того, пользователи могут отправить туда свои образцы, чтобы прогенотипировать их – это будет услуга на аутсорсинге. Прибор этот сейчас достаточно часто используется в связи с большим количеством запросов, так что в любое время можно увидеть его работу.
Технология таргетного генотипирования с использованием NGS под названием AgriSeq – это рутинный скрининг, который проводится на NGS секвенаторах и предназначен для работы с известными маркерами. Обычно их количество составляет от 100 до 5000 маркеров, главным образом даже до 2000, с производительностью от 96 образцов за запуск и до 3000 образцов в день.
(Рис. 12)
Это этап исследований, который логично вытекает из результатов поиска маркеров. Когда пользователь остановился на конкретных маркерах, связанных с видовой принадлежностью, предрасположенностью к чему-либо, устойчивостью, резистентностью, то есть описывающих какие-то признаки, можно переходить к таргетному генотипированию.
Эта технология на рынке достаточно новая, ей всего несколько лет, и она сейчас очень популярна за счет того, что она дешевле полногеномного NGS: таргетное генотипирование позволяет существенно сократить стоимость анализа образца.
Это готовое решение требует специализированной мультиплексной химии; благодаря наличию баркодов можно генотипировать до полутора тысяч образцов в день, но так как секвенатор поддерживает два чипа, возможность расширяется до 3 тысяч образцов в день.
(Рис. 13)
Как и в случае микроматричного анализа, возможно совмещение разных панелей, разных объектов на одном чипе.
Программное обеспечение позволяет автоматически определять генотипы, длина прочтения составляет 200 пар основания, так что можно выявлять искомые полиморфизмы и попутно находить новые в пределах длины прочтения.
В таргетном генотипировании используется зарекомендовавшая себя технология полупроводникового секвенирования: когда цепочка ДНК строится присоединением нуклеотидов, после присоединения нуклеотида высвобождается ион водорода и детектор фиксирует разницу pH.
Рабочий процесс в технологии AgriSeq занимает чуть меньше времени, чем в случае с микрочипами – порядка двух-трех дней в зависимости от протокола.
(Рис. 14)
На первом этапе происходит стандартная подготовка библиотеки – требуется либо 3 часа ручного труда либо 1 час с автоматизацией. На следующем этапе выполняется темплирование – подготовка панели системой Ion Chef System, от пользователя требуется при этом порядка 15 минут. Так выглядит эта станция для подготовки и темплирования.
Следующий этап – секвенирование – производится на секвенаторах Ion GeneStudio S5, при этом требуется потратить на загрузку 15 минут, далее сам процесс секвенирования занимает рекордно малое время – 2.5 часа, после чего начинается этап анализа данных.
(Рис. 15)
Thermo FS предлагает три вида секвенаторов – это классический Ion GeneStudio S5, но в трех разных конфигурациях в зависимости от того, какие чипы используются (Ion 510, Ion 520, Ion 530 или выше): это собственно S5, базовый прибор Ion GeneStudio S5 Plus или Ion GeneStudio S5 Prime, который работает с новым чипом от Thermo FS Ion 550 Chip с максимальной емкостью (100-130 млн прочтений, до 200 пар оснований).
К секвенаторам предлагается широкий выбор чипов. В зависимости от количества образцов и количества маркеров чипы можно менять, у них разные характеристики.
Что важно и что нравится пользователям, так это отсутствие необходимости как-то апгрейдить систему. Покупая один прибор, в зависимости от задач можно выбрать чипы разной емкости. Например, когда образцов очень много и поставлена задача заработать с большим количеством маркеров, можно выбрать чип Ion 550 (работает только на Ion GeneStudio S5 Prime) или Ion 540. Если оказалось, что задач меньше, меньше образцов и маркеров, можно остановиться на менее емком чипе, чтобы соответствующим образом скорректировать себестоимость анализа. Приборы эти гибкие и подстраиваются под любые задачи и любой поток исследований.
Емкость чипа вычисляется по формуле. Нужно знать, какое количество образцов предполагается в прогоне и каково количество маркеров, потому что эти два показателя наиболее важны. Количество маркеров умножают на количество образцов на чип и учитывается покрытие. Обычно рекомендуется использовать покрытие 100. Можно брать меньше, но при использовании значения 100 есть гарантия, что все данные будут достоверны. Итак, произведение этих трех значений дает емкость чипа.
Это важно: если мало количество маркеров и образцов, то вся емкость чипа не будет использована, и это повысит себестоимость анализа.
Средняя доля выявленных генотипов (call rate) по разным организмам составляет от 96% до 99%. Это высокий показатель: обычно биоинформатики берут в работу образцы с минимальным показателем 95%. К тому же средняя доля выявленных генотипов у Thermo FS выше, чем у других аналогичных технологий, представленных на рынке. Есть достаточно много публикаций, позволяющих говорить об этом уверенно.
Как и в случае с микрочипами, у Thermo FS есть своя команда биоинформатиков, которая поможет сделать кастомную панель, выбрать маркеры для первичного скрининга.
Сейчас компания предлагает около 130 кастомных панелей.
Нужно отметить, что технология и химия AgriSeq были анонсированы достаточно недавно – год-полтора назад (на 2021 год), и за такой отрезок времени разработки новых панелей ушли от нуля очень далеко и продолжают развиваться: аквакультура, растения, по которым сейчас даже больше панелей, в Европе на это настоящий бум. И по животным тоже количество панелей растет.
(Рис. 16)
Огромное количество панелей по растениям – оно составляет примерно 2/3 образцов, если посмотреть глобально, Только треть рынка составляют решения для таргетного NGS-генотипирования животных.
(Рис. 17)
Готовые панели есть по собакам, кошкам, КРС, лошадям, овцам, аквакультуре, подсолнечнику. Все остальные панели, указанные на слайде – решения, которые в Thermo FS изготавливали для его пользователей, и их можно продублировать под задачи новых клиентов.
Опять-таки можно совмещать разные виды маркеров, разные объекты на одном чипе.
И порядок запуска в производство аналогичен микрочипам: сначала создается дизайн и демо-панель, затем проверка работы панели, далее производство и поддержка на стадии обработки результатов. Аналогичен и подход к решению сложных задач: технологии от Thermo FS под силу работа с трудными геномами за счет мощного программного обеспечения, открывающего широкие возможности в обработке данных.
Ознакомиться с технологией можно непосредственно в Москве: среди нескольких проектов сегодня Thermo FS сотрудничает с академией имени К.И. Скрябина – лабораторией молекулярной генетики и геномики птицы, которая дала добро на то, чтобы сейчас к ним отправляли к ним образцы для генотипирования и новые пользователи могли ознакомиться с технологией.
(Рис. 18)
Ссылки на остальные части вебинара
С помощью личного кабинета Вы сможете: