Роботов научат имитировать естественное распознавание речи

12 июля 2018, 11:18

Российские ученые представили новый подход к машинному распознаванию речи на основе биоморфных нейроподобных сетей. Авторы хотят построить нейроноподобную систему распознавания речи, в перспективе — без программной составляющей. Если эта попытка будет успешной, можно будет имитировать естественный принцип распознавания речи, воспринимать голос или другие смысловые идентификаторы так же, как это делает человек. Работа опубликована в журнале Programming and Computer Software.

Роботов научат имитировать естественное распознавание речи — © Mario Anzuoni/Reuters

В середине XX века ученые стали обсуждать возможность создания искусственного мозга. Были проанализированы сети «формальных» искусственных нейронов и показано, как они могут выполнять простые логические функции. Постепенно сформировались два основных подхода к изучению искусственного интеллекта. Один из них — программно-прагматический, в рамках которого построено множество систем распознавания образов, автоматических переводчиков, игровых программ, роботов и других прикладных систем. Однако они, решая свою узкую задачу, имеют мало общего с биологическим мозгом и не обладают его свойствами. Второй подход, бионический, был попыткой ученых понять, как работает живой организм. В рамках этого подхода некогда были придуманы искусственные нейронные сети, которые, впрочем, впоследствии почти потеряли сходство со своим биологическим прообразом, перейдя в разряд программно-прагматических методов.

Основное свойство природных систем управления — это их адаптивность — способность обучаться, «дообучаться» и переобучаться прямо в процессе управления. Благодаря этому свойству природа находит способы управлять объектами любой сложности. Однако на данный момент искусственные системы управления практически не обладают такими свойствами. Они требуют либо предварительной настройки по математической модели, либо предварительного обучения на больших обучающих выборках.

«Отличия нашего подхода от "искусственных нейронных сетей" начинаются уже с модели нейрона, — поясняет руководитель коллектива авторов новой работы Александр Жданов из МФТИ. — Отдельный нейрон понимается в нашем "методе автономного адаптивного управления" как самостоятельная самообучающаяся система распознавания. Этот нейрон наблюдает за сигналами, которые поступают на его входы, и проверяет все время два критерия. Первый критерий — структурный: не повторяется ли конфигурация, удовлетворяющая заложенному в нейрон требованию. При обнаружении сигнала, который удовлетворяет этому требованию, начинает проверяться статистический критерий. Если сигнал, который удовлетворил первому критерию, наблюдается достаточно много раз, то этот прообраз считается неслучайным, нейрон становится обученным, а образ сформированным. С этого момента нейрон меняет свое функционирование и приобретает способность распознавать этот образ при каждом его появлении».

Однако главное отличие нейроноподобной системы «автономного адаптивного управления» от нейросетей в том, она решает задачу адаптивного управления, а искусственные нейросети — только задачу распознавания (или аппроксимации). Задача адаптивного управления требует не только распознавания, но и решения задач поиска и накопления знаний, моделирования эмоций, принятия решений и некоторых других.

Принцип работы нейрона Мак-Каллока — Питтса в обычных нейросетях другой. Нейрон — это пороговый сумматор, и задачу распознавания решает не он один, а вся сеть. Обучение выглядит так: на вход сети подается сигнал, соответствующий объекту из обучающей выборки. Для всех нейронов подобраны определенные веса на их входы. Дальше каждый нейрон суммирует каждый сигнал, умноженный на вес для данного входа. Эта сумма сравнивается с некоторой активационной функцией, и сразу выдается какой-то выходной сигнал. Затем, зная, что нужно получить на выходе всей сети, и видя, что на самом деле эта сеть выдала, по определенному алгоритму начинают меняться веса у всех нейронов в этой сети, чтобы сеть выдала нужный результат. И так происходит, пока все объекты из обучающей выборки не будут показаны помногу раз, и все веса не будут изменены, — пока сеть не начнет выдавать то, что от нее требуется.

Нейроны в новом подходе способны обучаться, чтобы воспринимать зашумленную или неполную информацию. В работе описана следующая методика: если во время того, как нейрон наблюдает сигналы от реального объекта, сопровождать его появление каким-то сигналом искусственного происхождения — звуком, картинкой, жестом — то, в конце концов, найдется нейрон, у которого эти два события начнут ассоциироваться. То есть наблюдение реального объекта и распознавание идентификатора станут для него связаны. Затем нейрон сможет распознавать этот же объект либо при его появлении, либо при предъявлении только искусственного идентификатора без собственно объекта.

Авторы работы создали описанную систему на примере мобильного робота. Робот видит какие-то препятствия на своем пути. Если сопровождать появление этих препятствий звуковыми идентификаторами: препятствие слева — говорить, что препятствие слева, и наоборот, — робот начинает распознавать эти препятствия вместе со словами. И через некоторое время он начинает реагировать уже только на слова. Если он научится объезжать препятствие, то с какого-то момента можно будет беспричинно сказать, например, что препятствие слева — робот распознает образ препятствия слева и повернет вправо.

Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.

Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.