| Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
| Разработчики: | Наносемантика (Nanosemantics Lab) |
| Дата последнего релиза: | 2025/10/23 |
| Технологии: | RPA - Роботизированная автоматизация процессов, Речевые технологии, Средства разработки приложений |
Содержание |
Основные статьи:
- Распознавание речи (технологии, рынок)
- Речевые технологии: на пути от распознавания к пониманию
- RPA (Robotic process automation, Роботизированная автоматизация процессов)
DialogOS - диалоговая платформа, средство управления диалоговыми роботами (чат-ботами, голосовыми и текстовыми роботами). DialogOS позволяет создавать и обучать диалоговых роботов, применяемых для обработки запросов пользователей в режиме связанного диалога.
2025
Завершение создания системы для голосового управления в робототехнике
«Наносемантика» завершила создание универсального программного комплекса, который позволяет управлять роботами с помощью естественной речи без требований к высокой мощности оборудования. В основе комплекса ‒ DialogOS: платформа обеспечивает голосовой интерфейс, распознает и синтезирует речь, интегрируется с внешними системами через API. Для внедрения достаточно устройства с микрофоном и динамиком. Об этом компания сообщила 2 декабря 2025 года.
Нейросети позволяют роботам воспринимать речь в том виде, в каком она звучит в обычном разговоре. Там, где раньше требовалось строгое соблюдение команд, система теперь корректно обрабатывает свободные формулировки, опираясь на смысл и интонации.
В комплекс включены собственные решения компании: диалоговая платформа DialogOS для создания голосовых и текстовых роботов, NLab Speech ASR для точного распознавания речи и NLab Speech TTS для её синтеза. Текущая версия DialogOS совместима с Gemini и отечественной генеративной моделью, при этом архитектура комплекса заранее рассчитана на подключение любых других LLM. «Наносемантика» протестировала все крупные LLM от ведущих разработчиков, и в зависимости от специфики задачи в комплекс может быть подключена наиболее актуальная модель.
| |
Ключевой задачей при разработке этого комплекса была модульность и независимость от аппаратной платформы. Мы реализовали клиент-серверную архитектуру, где на конечном устройстве ‒ будь то робот-собака или промышленный манипулятор ‒ запускается лишь ультралегкий клиент. Вся сложная обработка, включая KWS, VAD и интеграцию с LLM через DialogOS, происходит на сервере. Такой подход позволяет нам гарантировать высокую производительность и качество распознавания независимо от вычислительных мощностей самого робота, а также централизованно обновлять и масштабировать «мозг» всей системы, сказал Егор Кириллов, бизнес-аналитик, ООО «Лаборатория Наносемантика».
| |
Комплекс уже прошёл испытания на роботе-собаке. Она умеет поддерживать диалог, выполняет голосовые команды и откликается на своё имя ‒ «Квант». Для этого была настроена комбинация KWS и VAD, позволяющая роботу отслеживать обращение в реальном времени. «Квант» говорит синтезированным голосом «Лео» из библиотеки компании, хотя при необходимости можно подключить и сторонние варианты.
| |
Мы видим устойчивый спрос на решения, которые позволяют компаниям быстрее внедрять роботизированные системы и снижать стоимость их интеграции. Rомплекс делает голосовое управление стандартной функцией, а не дорогостоящей кастомной разработкой. Это открывает путь к масштабным внедрениям ‒ от логистики до сервисной робототехники ‒ и значительно ускоряет цифровую трансформацию наших клиентов, отметила Сабина Спирина, генеральный директор, ООО «Лаборатория Наносемантика».
| |
Сервис для точной оценки ответов виртуальных ассистентов
«Наносемантика» значительно расширила функционал платформы DialogOS: среди последних обновлений сервис для точной оценки ответов виртуальных ассистентов. Инструмент разметки отдельных реплик (шагов) и всего чата (сессии) позволит пользователю платформы точечно проанализировать диалог и сделать его более эффективным.
DialogOS – профессиональная диалоговая платформа, сочетающая в себе самые разные инструменты и технологии, необходимые для создания, мониторинга и поддержки диалоговых роботов различного уровня сложности. Также используется для построения архитектуры коммуникаций в роботизированных системах и цифровых аватарах.
Теперь пользователи ИИ-системы могут оценить эффективность и уместность как конкретного ответа чат-бота в вопросно-ответной связке, так и диалоговую сессию полностью, проставив им специальные метки (положительная, нейтральная, отрицательная). Фильтры позволяют выбрать сессии по определенным параметрам и задать для них временной промежуток, а по завершении разметки система формирует отчет с метрикой качества общения чат-бота.
Сервис будет полезен бизнес-аналитикам, сценаристам диалогов и всем пользователям DialogOS, активно отслеживающим показатели распознавания и уровень удовлетворенности ответами чат-бота. На основе полученной статистики они смогут адекватно оценить, насколько хорошо ассистент настроен и справляется с поставленной задачей, а также «отловить» слабые места и сформировать список необходимых доработок.
Также в разработке находится еще один инструмент аналитика и сценариста ‒ «Карта диалогов» ‒ который поможет визуализировать набор диалогов в виде построенного графа. Он наглядно демонстрирует, в каких местах разговора происходит зацикливание и отток клиентов, и другие состояния, в которые они попадали в диалоге. При анализе графа можно понять, на какие узлы стоит обратить внимание и какие диалоги нужно просмотреть более детально.
| | В основе функционала разметки лежит принцип качественного анализа: в выборку включаются случайные сессии за определенный период, формируя репрезентативный набор данных. Такой подход позволяет ставить и проверять гипотезы, делать выводы на основе статистики и прогнозировать дальнейшее поведение ассистента, ‒ сказал Григорий Шершуков, директор по продуктам компании «Наносемантика». | |
Разметка сессий будет доступна клиентам «Наносемантики» на платформе DialogOS в бета-версии уже в ноябре 2025 года.









