1 месяц назад 31 октября 2023 в 14:58 5400

Исследователи МТУСИ создали нейросетевую архитектуру для распознавания голосовых команд, эффективность которой составляет 87,17%. Данное решение предназначено для взаимодействия с промышленными роботами.

Специалисты МТУСИ нашли оптимальной 5-слойную архитектуру нейронной сети с 8-128 нейронами на слой. Сеть была обучена на большом объеме данных, в который в числе прочего вошли более 64 000 аудиофайлов с 30 англоязычными командами, треть из них относятся к задачам робототехники.

По словам студента магистратуры Данила Подпалого, следующие шаги — сбор русскоязычного набора данных, ориентированного накомандыманипуляторов, повышение точностидо95% и возможность прямой интеграции с роботами.

Новая разработка МТУСИ ориентирована на широкое применение — от автономного управления роботами до взаимодействия человека и машины. Голосовое управление без помощи рук позволяет более эффективно выполнять задачи, не прерывая рабочий процесс ради ручного программирования интеллектуального оборудования.

Исследователи МТУСИ считают, что внедрение их нейронной сети может вывести автоматизацию предприятий на новый уровень за счет оптимального распределения задач между человеком и машиной. Голосовое управление обеспечивает интуитивно понятный интерфейс для управления робототехническими системами без использования рук.

По мере развития нейросетевого распознавания речи и обработки естественного языка возможности голосового управления станут неотъемлемой частью совместной работы промышленных роботов и другого автоматизированного оборудования. Работа команды МТУСИ является важным шагом на пути к автоматизации с помощью голоса.

Никто не прокомментировал материал. Есть мысли?