Проект

Deeray сократила расходы в 30 раз за счет использования AI-сервисов Cloud.ru

Заказчики: Deeray (Дирэй)

Информационные технологии

Продукт: Cloud Advanced
Второй продукт: Cloud.ru Evolution Foundation Models

Дата проекта: 2025/04 — 2025/10
Технология: Cloud Computing
подрядчики - 110
проекты - 267
системы - 397
вендоры - 173
Технология: IaaS - Инфраструктура как услуга
подрядчики - 231
проекты - 1354
системы - 476
вендоры - 245
Технология: PaaS - Platform As A Service - Бизнес-платформа как сервис
подрядчики - 154
проекты - 567
системы - 275
вендоры - 161
Технология: Речевые технологии
подрядчики - 106
проекты - 366
системы - 480
вендоры - 284

2025: Перенос продуктовой среды в Сloud.ru

ИТ-компания Deeray — разработчик AI-платформы речевой и текстовой аналитики для бизнеса — перенесла продуктовую среду в Сloud.ru. Благодаря миграции компания сократила затраты на инференс языковых моделей в 30 раз и получила надежную инфраструктуру для обработки 4 миллионов минут речи ежемесячно. Об этом компания Cloud.ru сообщила 21 ноября 2025 года.

Решение Deeray не просто переводит речь в текст, а выявляет контекст всего диалога. Например, может определить, был ли решен вопрос человека, который обратился в колл-центры организации. Deeray использует ансамбли разных LLM вместо одной универсальной модели, как это делают конкуренты. Конфигурация подбирается с учетом экономической целесообразности и задач проекта — от семантического анализа до мультимодальной обработки данных. Такая архитектура требует экономической эффективности GPU-ресурсов и стабильности работы инфраструктуры.

Deeray снизила затраты на применение популярных open source моделей с помощью сервиса Cloud.ru Evolution Foundation Models. Для сравнения, одна из представленных в нем моделей (Qwen 2.5) обходится компании в 20 рублей за 1 миллион выходных токенов, в то время как конкурирующие решения стоят около 600 рублей. Средний промпт Deeray содержит 6-8 тысяч токенов в структурированном виде, без учета системных промптов, что дает примерно экономию в 30 раз на каждом запросе.

Также доступ к производительным GPU-серверам Cloud.ru позволил Deeray справиться с резким увеличением клиентов из среднего и малого бизнеса. На ноябрь 2025 года платформа стабильно обрабатывает 4 миллионов минут речи и 1,5 миллиона чатов ежемесячно, при этом сохраняя возможность для роста. Кроме того, за счет дообучения моделей компании удалось значительно сократить количество ошибок распознавания речи и в ряде доменных областей добиться показателя в 1,5% против 25-29% у конкурентов.

«
Для бизнеса, чьи продукты построены на базе AI, цена на открытые языковые модели и графические ускорители была определяющим фактором. В случае с Cloud.ru стоимость ресурсов оказалось самой доступной на российском рынке, — сказал основатель и генеральный директор Deeray Дмитрий Щербаков.
»

«
Мы стараемся совершенствовать процессы и улучшать экономику создания продуктов, не делая их дороже. Мы делаем AI-продукты доступными, чтобы стимулировать компании переходить от работы с технологией в R&D-формате к коммерческому потреблению, — сказал ведущий менеджер по продажам Cloud.ru Алексей Ри.
»

Deeray с 2018 года входит в число представителей российского рынка, использующих собственные большие языковые модели вместо готовых решений. С момента запуска компания реализовала более 400 проектов.