Войти в почту

Биоинформатики СПбГУ смогли обнаружить 130000 неизвестных вирусов в публичных геномных данных

Ученые считают, что существует большое количество еще неизвестных науке вирусов, некоторые из которых опасны и могут спровоцировать следующие пандемии. Пресс-служба СПбГУ сообщает, что новое исследование оперирует огромным количеством данных ДНК и РНК. Ученые проанализировали 16 петабайт геномных последовательностей. С таким объемом информации сложно справиться, именно поэтому была создала платформа Serratus, обладающая многими инструментами для эффективной переработки большого количества данных.

«Главная задача коллаборации Serratus заключалась в том, чтобы создать мощное, очень точное и чувствительное «сито» для обработки огромных количеств данных, отобрать данные, относящиеся к РНК-вирусам, сузив масштабы от петабайтов до гигабайтов, доступных для относительно быстрой обработки с применением обычных вычислительных мощностей», – отмечает сотрудник Центра алгоритмической биотехнологии СПбГУ .

В центре алгоритмической биотехнологии СПбГУ был создан сборщик coronaSPAdes , без которого не было бы возможности качественно обработать геномные вирусные данные. Появившаяся в результате совместных усилий платформа может обрабатывать один миллион наборов данных в день при вычислительных затратах менее одного цента на набор данных.

Даже имея частичные последовательности, а не полный геном вирусов, ученые смогли построить генеалогические деревья, которые показывают развитие вирусов и их связь между собой. Так, в ходе работы исследователей было обнаружено 250 гигантских вирусов, способных поражать бактерии. Максимально похожие на них вирусы ранее были найдены у человека из Бангладеша, а также у кошек и собак в Соединенном Королевстве. До появления проекта Serratus ученые знали о существовании примерно 13 500 РНК-вирусов, проект почти в десять раз увеличил это число. К концу десятилетия ученые планируют идентифицировать более 100 миллионов РНК-вирусов. Исследование появилось в журнале Nature.

Фото: Пресс-служба СПбГУ (Коллектив Центра биоинформатики и алгоритмической биотехнологии СПбГУ)