Ученые ЛЭТИ построили “Таблицу Менделеева” для систематизации элементов генетического кода

Ведущий научный сотрудник ИЦ ЦМИД СПбГЭТУ «ЛЭТИ» Владимир Александрович Карасев

Многие объекты в мире поддаются систематизации. Наиболее известным примером является периодическая система химических элементов, закономерности для которой установил русский ученый Дмитрий Иванович Менделеев. Подобные случаи систематизации являются крайне важными. Например, Таблица Менделеева может использоваться, чтобы изучить происхождение химических элементов или прогнозировать поведение ранее неизвестных веществ, обладающих полезными свойствами для человека. Одним из научных объектов, который нуждается сегодня в систематизации элементов, является генетический код. В 1960-ые годы была предложена общепринятая таблица элементов генетического кода, отражающая экспериментально установленные соответствия кодирующих триплетов и аминокислот. Однако бурное развитие исследований в области генетики с применением технологий расшифровки генов и последующей обработки больших баз данных позволило значительно уточнить наши представления о генетическом коде. Стало понятно, что тогдашняя систематизация существенно устарела и не объясняет многие свойства генетического кода. Кроме того, принципы построения общепринятой таблицы сложились исторически и не имеют строгого математического обоснования. Поэтому существует необходимость поиска природных принципов для систематизации генетического кода. «Мы разработали и теоретически обосновали расположение триплетов (единиц ДНК, состоящих из трех нуклеотидов) и кодируемых ими аминокислот в виде Канонической таблицы генетического кода. Название «каноническая» таблица получила в связи с расположением в ней блоков триплетов в последовательности: цитозин (C), гуанин (G), урацил (U), аденин (A), которая называется канонической. Мы сопоставили Каноническую таблицу генетического кода с Периодической системой химических элементов и отметили их сходство: наличие начального элемента, последовательное заполнение вакансий связей в пределах блоков триплетов. Но есть и различия, например, число триплетов, в отличие от химических элементов ограничено»,– рассказывает ведущий научный сотрудник Инжинирингового центра микротехнологии и диагностики (ИЦ ЦМИД) СПбГЭТУ «ЛЭТИ» Владимир Александрович Карасев. В прошлом для составления своей таблицы Дмитрий Иванович Менделеев использовал обнаруженную им фундаментальную природную закономерность связей между элементами: им был сформулирован периодический закон – свойства химических элементов находятся в периодической зависимости от веса атомов. Поэтому для построения теоретически обоснованной таблицы генетического кода ученым ЛЭТИ требовалось найти аналогичный природный фундаментальный принцип для систематизации. В ходе поиска закономерностей специалисты обратили внимание, что неразветвленная цепь любого белка, которая закодирована триплетах, может быть представлена в виде цепного графа – особой математической модели, позволяющей отразить структуру белкового фрагмента. Причем по ряду критериев был определен минимальный фрагмент белка, пригодный для систематизации, который состоит из пяти аминокислот. Ученые ЛЭТИ назвали его пентафрагментом. Математически его структурная форма может быть представлена в виде цепного графа. Затем, уже работая с графами, ученые ЛЭТИ с помощью математического анализа выяснили, что общее число структурных форм графа ограничено и всего их существует 64. Кроме того, все модели по ключевым параметрам можно разделить на четыре блока по 16 вариантов. При этом каждый цепной граф соответствует структурной форме пентофрагмента белка. Используя эти соответствия, на основе системы из 64 цепных графов была построена система из 64 триплетов. Затем ученые добавили каждому триплету связанные с ними аминокислоты – так получилась Каноническая таблица генетического кода, состоящая из 64 ячеек. Результаты работы опубликованы в научном журнале Biosystems. «Полученная таблица позволила наглядно представить в генетическом коде элементы симметрии и антисимметрии и их преобразования друг в друга, а также циклическую периодичность триплетов внутри строк столбцов и блоков таблицы в целом. Наша разработка может служить основой при построении алгоритмов прогнозирования пространственных структур белков с известной последовательностью аминокислот, а также для конструирования новых белков с заранее заданными полезными свойствами. Например, это могут быть новые ферменты, лекарственные средства, средства защиты растений от сорняков (гербициды) и от вредных насекомых (инсектициды) и даже технические электронные устройства молекулярного размера», –рассказывает Владимир Александрович Карасев. Разработка таблицы проводилась в рамках выполнения научного раздела ИЦ ЦМИД “Принципы топологического кодирования цепных полимеров”, являющегося частью бионического направления. Исследования проводятся под руководством директора ИЦ ЦМИД проф. Виктора Викторовича Лучинина. Ключевой целью направления является использование биологических закономерностей для создания принципиально новых технических устройств молекулярного размера.