Лука Ванджохи (Luka Wanjohi) - региональный старший научный сотрудник Международного центра картофеля в Уганде и работает в проекте «Развитие генетики сладкого картофеля и инновационные системы семян» (SweetGAINs). Он поговорил со специалистом по региональным коммуникациям Вивиан Атакос о том, как статистика способствует прорыву в селекции растений, оптимизируя сбор и передачу информации.
В: Когда кто-то думает о селекции растений, статистика и сбор данных не обязательно первое, что приходит на ум. Какую роль играет управление данными в разработке и внедрении улучшенных сортов растений?
ЛМ: Данные можно рассматривать как основу исследовательской деятельности. Sweet GAINs работает в разных странах с разными партнерами, у каждого свой способ сбора данных и управления своей исследовательской деятельностью. Надлежащие и очень стандартизованные действия по управлению данными необходимы, чтобы гарантировать, что мы сможем успешно использовать данные для принятия решений о выборе. Селекционеры полагаются на данные, чтобы принимать правильные решения о выборе. Перед выпуском разновидности мы хотим понять, что мы заменяем. Почему мы думаем, что в стране нужен выпуск нового сорта.
Q: Каковы риски несистематизации данных, генерируемых современной селекционной программой?
ЛМ: Если мы не собираем наши данные и не определяем собираемые нами черты стандартизованным образом, нам становится трудно обмениваться данными. Вы обнаружите, что, когда у вас нет систематического способа управления данными, люди, которых не было при создании этих данных, могут столкнуться с трудностями при работе с этими данными. И наконец, отсутствие систематизации данных означает, что вы рискуете внести много ошибок, потерять данные или собрать поврежденные данные. Это очень затрудняет использование этих данных без того, что мы называем курированием данных - дорогостоящим и утомительным процессом. Даже после курирования некоторые данные будут потеряны или непригодны для использования.
В: Почему важно применять Стандартные рабочие процедуры для управления данными в селекции растений?
ЛМ: Очевидные преимущества, которые мы видим в отношении внедрения этих Стандартных операционных процедур (СОП), заключаются в том, что мы можем устанавливать четкие стандарты для высококачественных данных с точки зрения того, как мы разрабатываем наши исследования. Наш подход к цифровизации определяет, как мы собираем данные, какое улучшенное оборудование мы используем и так далее. Другое преимущество заключается в том, что мы обеспечиваем сопоставимость данных, которые мы собираем, сегодня и завтра в разных средах и странах, над которыми мы работаем.
В: Каковы проблемы отсутствия стандартизации данных в программе?
ЛМ: Если мы хотим провести совместный анализ в будущем, нам нужны стандартизированные системы именования. Чтобы отличить расширенное испытание от предварительного испытания, мы используем ту же онтологию. Например, некоторое время назад мы хотели посмотреть, как болезнь, вызванная ретровирусом сладкого картофеля, влияет на наши растения, но это было сложной задачей, потому что в прошлом одна группа могла оценивать по шкале от одного до пяти в зависимости от серьезности воздействия вирус на растении. Затем мы находили другую программу с оценкой от одного до трех, а в другой использовалась система оценок от одного до девяти. Когда мы говорим об онтологии, мы стандартизируем эти оценки, чтобы они были одинаковыми для всех программ. Мы также используем BreedBase для централизации хранения всех наших данных и позволяет нам отслеживать пробные данные по различным (программным) переходам и выявлять потенциальные проблемы на раннем этапе нашей работы, а не обнаруживать, что мы собрали или сохранили неправильные данные прямо на месте. очень, когда нужно сделать анализ.
Q: Как сбор данных и управление ими помогают селекционерам выявлять предпочтительные признаки, оптимизировать свою работу и снижать общие затраты?
ЛМ: Эффективный процесс управления данными помогает селекционерам быстро и экономично собирать данные, что позволяет им собирать большой объем данных, анализировать их и принимать решения о выборе для поддержки своей работы. Селекционеры обычно работают с большим количеством образцов. Я видел испытания в Уганде, где в сюжете было около 7000 записей в испытании, которое касалось 7000 сюжетов. Когда у вас есть большое количество присоединений, вы хотите иметь возможность войти, быстро и эффективно собрать свои данные. Внедрение процесса, позволяющего делать это в цифровом виде, позволяет избежать бумажных записей, которые могут привести к ошибочной транскрипции данных во время оцифровки. В наши инструменты встроены проверки, чтобы гарантировать, что мы собираем правильные данные или максимально ограничиваем ввод данных. Только допустимые значения, которые могут быть собраны. Это позволяет быстро анализировать данные, поскольку они уже оцифрованы, а также быстро и легко делиться ими с коллегами и другими людьми, которые помогают с анализом данных.
В: Расскажите нам о том, как использование штрих-кодов помогает упростить информацию.
ЛМ: В течение некоторого времени мы используем множество этикеток со штрих-кодом. Программы поощряются к тому, чтобы они печатали этикетки для своих материалов на складах и в полевых условиях. Суть этикетки со штрих-кодом заключается в том, чтобы иметь возможность отслеживать перемещение данного образца или данного генотипа в различных областях работы. BreedBase, наша база данных, генерирует уникальный идентификатор для каждого участка, который вы помещаете в поле, и мы помещаем этот идентификатор в штрих-код, чтобы мы могли отслеживать производительность данной записи от поля до сбора урожая и когда приносим в лабораторию на анализ и так далее.
В: Что вы посоветуете другим организациям, которые хотят внедрить стандартные рабочие процедуры в свои программы разведения?
ЛМ: Мы узнали, что наши СОП - это живой документ. Эта разработка была необходима, потому что, когда у вас есть справочный документ, людям становится легко вернуться, посмотреть на него и поддержать людей, разбросанных по всему региону. Я бы посоветовал остальным, что разработка должна быть неотъемлемой частью вашей сегодняшней деятельности. Начните с малого, задокументируйте процедуры, как они есть сегодня. Общайтесь с группами по разведению, с людьми, которые фактически осуществляют деятельность по разведению, и стремитесь постоянно улучшать этот документ. Не стремитесь получить идеальный документ. Начните с написания одного, а затем совместными усилиями всех членов команды постарайтесь охватить все процессы и все рутинные действия в программе разведения. Так что со временем у вас будет документ, который будет как можно более всеобъемлющим и фиксирует все действия, которые вы выполняете в своей программе.
Посетите нас на SoundCloud, чтобы послушать Подкаст SweetGAINS с участием Луки Ванджохи и других ученых, модернизирующих селекцию растений.