Проект

Стартап «НаВстрече» вместе с «Иневилс» построил облачную платформу для транскрибации встреч, суммаризации и распознавания спикеров

Заказчики: Актру-Образовательные Технологии

Москва; Информационные технологии

Подрядчики: Иневилс (Inevils)
Продукт: Проекты ИТ-аутсорсинга

Дата проекта: 2023/11 — 2024/11
Технология: ИТ-аутсорсинг
подрядчики - 904
проекты - 2833
системы - 204
вендоры - 136

2025: Построение облачной платформы для транскрибации встреч

Компания «Актру-Образовательные Технологии» в конце апреля 2025 года сообщила TAdviser о реализации проекта совместными усилиями стартапа «НаВстрече» и ИТ-компании «Иневилс» по созданию облачной платформы для транскрибации встреч, суммаризации и распознавания спикеров.

Как сообщалось, «НаВстрече» — российский технологический стартап, основанный в 2020 году. Изначально он развивал решения для гибридного обучения для высшего образования, но в процессе развития бизнес- модель сместилась в сторону B2B и B2G-сегмента. Сервис «НаВстрече» — интеллектуальная платформа для записи и анализа онлайн-коммуникаций и офлайн-совещаний.

Разработку нескольких системных модулей команда «НаВстрече» доверила ИТ-компании «Иневилс», обладающей компетенциями в построении архитектур на основе нейросетевых моделей. Работы начались с простого модуля записи звука, но в процессе сотрудничества продукт развился в полноценную облачную платформу с функциями транскрибации, суммаризации и подключением ботов.

Основатель стартапа обратил внимание на повсеместную проблему: записи онлайн-встреч — будь то в ведомствах, университетах или бизнесе — часто не структурированы, качество звука низкое, а переслушивание занимает много времени. Чтобы решить эту задачу, изначально планировалось создать сервис, который записывает звук и переводит его в текст. Позже стало ясно, что одной транскрибации недостаточно — пользователям нужны сжатые, понятные саммари и автоматическое определение, кто что говорил.

Также с самого начала учитывался интерес со стороны госкомпаний, поэтому архитектура должна была предусматривать возможность работы в изолированном контуре без выхода в интернет.

Что было сделано:

  • Этап 1: Модуль записи и основа бэкенда. Команда «Иневилс» разработала дополнение к серверной основе и реализовала первый модуль — захват звука с микрофона и его базовая обработка. Поскольку проект развивался итеративно, этот этап рассматривался как стартовая точка, не перегруженная лишним функционалом.
  • Этап 2: Транскрибация речи. Следующим шагом стал модуль перевода аудио в текст. Использовались готовые модели (в частности, Whisper), настроенные под задачи проекта. Учитывалась необходимость точной разбивки по временным меткам.

Фрагмент транскрибированного текста с временными метками

  • Этап 3: Суммаризация. Один из самых чувствительных компонентов — формирование саммари. Реализовано два варианта:
    • Коробочное решение — для клиентов с закрытым контуром (например, госструктур);
    • Облачное решение — с подключением мощных нейромоделей, обеспечивающих оптимальное качество суммаризации.

  • Этап 4: Браузерные боты. Разработан телеграм-бот, а также организована инфраструктура браузерного ВКС-бота, которого можно «приглашать» в онлайн-встречи. Уже реализована интеграция с Google Meet, Яндекс.Телемостом и Zoom.

Интерфейс подключения бота в звонок

Команда стартапа искала не просто подрядчика «под задачу», а партнёра, способного развивать архитектуру по мере роста продукта. В пользу «Иневилс» сыграли три вещи:

  • опыт работы с ИИ и нейросетями задолго до их массового применения;
  • понимание стартап-логики (итеративный рост, меняющиеся требования);
  • готовность выстраивать долгосрочные отношения и развивать продукт по мере его масштабирования.

Главной технологической проблемой стал разрыв между ожиданиями по качеству суммаризации и реальными ресурсами в коробочной версии. Качественные языковые модели требуют высокопроизводительных GPU и большого объёма памяти — таких мощностей на старте проекта у заказчика не было.

Чтобы не откладывать запуск продукта, команда «Иневилс» приняла решение временно сосредоточиться на облачном варианте: он позволил быстро развернуть стабильную версию сервиса с оптимальным качеством саммари. Параллельно архитектура коробочного решения была сохранена и отложена до момента, когда появятся доступные ресурсы. На апрель 2025 года эта версия дорабатывается и тестируется на аппаратных платформах с учётом оптимизаций под TensorRT. Второй значимый вызов касался организации процессов. Изначально работа строилась как классическая схема «подрядчик-заказчик» с отдельными задачами. Но уже на раннем этапе стало понятно, что продукт требует гибкой и быстрой доработки, часто без формализованных ТЗ. Решением стал переход на совместный бэклог и единый цикл планирования: команды синхронизировали спринты, приоритизировали задачи вместе и стали работать как одна продуктовая команда. Это позволило быстрее реагировать на изменения и не терять время на длинные итерации согласования.

Совместными усилиями «НаВстрече» и «Иневилс» были достигнуты следующие результаты:

  • Платформа, которая умеет: записывать и транскрибировать встречи, делать саммари, протоколы и другие отчеты, анализировать и формировать рекомендации пользователям;
  • Архитектура, готовая к коробочной и облачной эксплуатации;
  • Встроенная интеграция с видеосервисами;
  • Подключаемые боты;
  • Возможность масштабирования под госструктуры и корпоративный сектор.

Система была создана не только усилиями «Иневилс», но именно благодаря их работе система получила важные модули, включая основной модуль транскрибации.

Планы:

  • Добавить функцию диаризации. Для многих клиентов критично понимать, кто именно что сказал. На одном аудиотреке может быть несколько голосов — и система должна не просто «расшифровать», а ещё и подписать реплики. В этом и помогает AI-диаризация — модель определяет спикеров, разделяет фразы и вносит их в итоговый текст.
  • Расширить список интеграций;
  • Повысить качество саммаризации с помощью дообучения;
  • Добавить генерацию ссылок на встречи;
  • Реализовать пользовательские сценарии хранения и маршрутизации расшифровок.

«
В стартапах не бывает стабильных требований. Мы это знаем. Поэтому сделали систему, которую можно быстро дорабатывать без переработки всего ядра. И это сработало.

рассказал Дмитрий Дудников, CEO «Иневилс»
»