В МГТУ им. Баумана разработали суперкомпьютер, находящий неочевидные связи
В России разработали первый в мире суперкомпьютер с «интуитивным» процессором на базе отечественной архитектуры «Леонард Эйлер» — он называется «Тераграф». Благодаря особенному процессору компьютер может находить неочевидные связи между параметрами объектов в больших массивах данных и подсказывать оптимальные решения тех или иных задач. Обработав медицинские данные конкретного человека и создав его цифровой двойник, «Тераграф» сможет дать подсказку по индивидуальному лечению. Хотя суперкомпьютер университета Баумана находится на стадии прототипа, потенциальным продуктом уже заинтересовались в двух российских госструктурах.
«Интуиция компьютера
В Московском государственном техническом университете (МГТУ) им. Н.Э. Баумана создан первый в мире суперкомпьютер с процессорами на отечественной микроархитектуре «Леонард Эйлер» – «Тераграф». Об этом «Газете.Ru» сообщили в Министерстве науки и высшего образования РФ, а подробно рассказал генеральный конструктор проекта Алексей Попов.
Компьютер предназначен для работы с так называемыми графами. Как объясняет специалист-исследователь в области машинного обучения компании «Криптонит» Георгий Поляков, графы – это совокупность объектов и связей между ними на основе параметров этих объектов. В математике объекты называются вершинами, а связи между ними – ребрами.
«Существует много примеров из жизни, которые можно представить в виде графа. Например, схема перелетов авиакомпании между городами – это граф. В качестве вершин выступают аэропорты в городах, а в качестве ребер – факт наличия прямого авиационного маршрута между городами», – сказал Поляков.
Заместитель генерального директора по науке и развитию компании ИВК, кандидат физических и математических наук Валерий Андреев добавил, что вычисления с использованием графов позволяют делать качественные прогнозы относительно тех или иных объектов в сложных системах: будь то человек и влияние лекарств на его здоровье, или зерно и влияние его цены на стоимость металлов.
«Вычисления с использованием графов позволяют найти в больших массивах данных информацию о событиях с неочевидной взаимосвязью. Например, о том, как связаны между собой несколько людей, о том, как одни банковские транзакции отразились на динамике других и т.п. Построение жестких связей между объектами и их параметрами позволяют сделать качественный прогноз. Это ценная возможность для любой области деятельности – от банковской сферы и оптовой торговли до криминалистики», – сказал Андреев.
Алексей Попов, генеральный конструктор проекта, говорит, что особенность работы «Тераграфа» c графами в долгосрочной перспективе позволит создавать цифровые двойники людей и проводить на них эксперименты с разными курсами лечения, чтобы подобрать самый эффективный. Процессор, анализируя исходные данные, будет предлагать для курса лечения разные решения. Это свойство устройства он называет «интуицией».
«Представьте, что у вас на компьютере отображаются разные параметры человеческого организма. В программе можно проследить влияние разных препаратов на них, не подвергая опасности пациента. Подобрав оптимальное решение в программе, лечение можно применить к человеку», – сказал Попов.
На чем сделан компьютер
«Тераграф» представляет собой систему на базе центрального процессора Intel под управлением Linux, к которой подключены три вспомогательных вычислительных модуля – процессоры «Леонард Эйлер». Последние визуально выглядят как видеокарты, подключенные к материнской плате.
«Для создания модулей «Леонард Эйлер» мы использовали ПЛИСы [программируемые логические интегральные схемы. — «Газета.Ru»], пустые «болванки» чипов AMD, на которые мы записали инструкции нашей архитектуры как прошивку», – говорит Попов.
Он уточняет, что на уровне железа процессоры университета имени Баумана основаны на чипах AMD, однако работают по уникальным алгоритмам, созданным российскими учеными. Чип без таких алгоритмов нельзя называть процессором. Процессором его делает низкоуровневое ПО, в качестве которого выступает архитектура «Леонард Эйлер».
Попов утверждает, что при необходимости можно создать и уникальный – российский – чип на архитектуре «Леонард Эйлер». Однако такой задачи разработчики пока перед собой не ставят. Как минимум потому, что в России нет средств для производства чипов такого уровня.
Каждый модуль «Леонард Эйлер» обладает 24 ядрами с тактовой частотой всего 200 МГц. Однако при работе с графами даже этих технических характеристик хватает, чтобы обогнать по производительности мощнейшие серверные процессоры Intel Xeon с частотой 3 ГГц.
«При сопоставимых технических характеристиках эффективность процессоров на архитектуре «Леонард Эйлер» на порядки выше, чем у Intel», – отметил Попов.
В то же время он подчеркнул, что кратность этой эффективности справедлива только для расчетов с использованием графов. В задачах, где требуются классические арифметические расчеты, процессоры «Леонард Эйлер» не конкурент х86 и ARM. Именно поэтому разработчики против позиционирования своего проекта в качестве конкурента Intel, AMD, «Байкала» или «Эльбруса». И «Леонард Эйлер» может быть вспомогательным компонентом для центрального процессора, а не его заменой.
Высокая эффективность процессоров «Леонард Эйлер» при работе именно с графами обусловлена как раз архитектурой, которая настроена под работу с ними, а не арифметическими формулами.
«Да, классические процессоры на платформах х86 и ARM тоже могут работать с графами. Однако ввиду своей логики, заложенной на уровне инструкций, они рассчитывают каждый граф последовательно, а «Леонард Эйлер» может считать миллионы графов параллельно», – сказал Попов.
Другими преимуществами процессоров на новой российской архитектуре являются экономичность материалов, требуемых для изготовления процессоров, и энергопотребление. Такие чипы требуют в 200 раз меньше кремния, чем один микропроцессор семейства Intel Xeon, и потребляют в 10 раз меньше энергии. В перспективе это открывает возможность для использования процессоров «Леонард Эйлер» в устройствах интернета-вещей.
Проблемы графа
Хотя разработка специалистов университета им. Баумана кажется перспективной, ее использование на практике очень проблематично. Об этом прежде всего говорит сам Попов.
«Проблема в том, что для работы нашего процессора, исходная информация, массив данных, должна быть записана как графы. Однако в подавляющем большинстве информация в базах данных систематизируется в табличном формате», – отмечает он.
По его словам, у этой проблемы есть несколько решений. Первое – это составление новых баз данных графовым способом. Второе – преобразование табличных архивов в графовые. И оба варианта требуют времени.
«Сегодня данная разработка специалистов университета им. Баумана представляется мне актуальной только в рамках исследовательской деятельности. Актуальность решения для IT-индустрии, на мой взгляд, пока невелика», – говорит Валерий Андреев из ИВК.
По его словам, проблема в том, что IT-индустрия движется в сторону уплотнения транзисторов в процессорах и в меньшей степени смотрит на альтернативные системы вычисления. Однако, по его словам, в ближайшем будущем ситуация может радикально измениться, поскольку текущий вектор развития индустрии достиг предела.
«Усилия специалистов университета им. Баумана ни в коем случае нельзя считать напрасными. Я уверен, что рано или поздно придет время, когда эта разработка российских инженеров многим понадобится», – уверен он.
Сам Попов отмечает, что несмотря на стадию прототипа, проектом уже заинтересовались в Департаменте информационных технологий Москвы и Центре системной биологии при Роспотребнадзоре.
На данный момент «Тераграф» готовится к пилотному использованию в стенах университета имени Баумана. По словам Попова, суперкомпьютер будет использоваться для расчета угроз безопасности государства на основе подготовленных командой разработчиков графов. Проект должен стартовать до конца 2022 года.