MTS AI и Сколтех: Детоксификатор языка

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: MWS AI, МВС ИИ (ранее MTS AI, МТС ИИ) Центр искусственного интеллекта МВС, Сколтех (Сколковский институт науки и технологий, Skoltech)
Дата премьеры системы: 2022/03/22
Технологии: Речевые технологии

Основные статьи:

2022: Представление детоксификатора

22 марта 2022 года компания MTS AI сообщила, что совместно со «Сколтехом» создала детоксификатор языка - ИИ-решение, которое распознает токсичные слова и выражения, а затем удаляет их либо заменяет близкой по смыслу, но не оскорбительной лексикой. Это решение позволяет сохранить смысл фразы и снизить градус агрессии в общении. Детоксификатор можно использовать не только в социальных сетях, но и в общении с голосовыми помощниками, чат- и войс-ботами.

Примеры замены лексики с помощью детоксификатора
«
«Интернет – источник информации, не только достаточно большой и доступный, но и стихийно развивающийся. Контент создают сами пользователи, поэтому проблема безопасного и нетоксичного общения всегда актуальна. Споры в комментариях часто перерастают в оскорбления, пользователи «на эмоциях» выражают своё мнение в грубой форме, ведь написать и отправить текст - дело нескольких секунд. Скорость генерации контента настолько высока, что невозможно качественно фильтровать его вручную. Часто социальные сети просто блокируют оскорбительные высказывания. Наше решение позволяет не просто удалять сообщения или банить пользователей, а предлагать замену текста на более нейтральный, при этом не теряя сути сообщения», -

сказала Ирина Кротова, старший разработчик в группе NLP MTS AI.
»

Разработка MTS AI и «Сколтеха» актуальна для российского рынка, поскольку большинство подобных решений предназначены для английского языка. Для русскоязычных пользователей подобных сервисов практически нет, а разработанные ранее решения, по утверждению компании, оказались неэффективными.Международный конгресс по anti-age и эстетической медицине — ENTERESTET 2026

MTS AI и «Сколтех» предложили два типа моделей для создания ботов и приложений, которые убирают негативную лексику из речи. Первый подход использует языковую модель BERT, основанную на нейросетевой архитектуре «Трансформер». Модель осуществляет точечное редактирование текста – находит в нем негативные слова и выражения, заменяет их на нейтральные синонимы или вовсе удаляет.

Второй подход также основан на архитектуре «Трансформер», однако он решает другую задачу - условную генерацию текста по входному запросу. То есть языковая модель создает нейтральную версию токсичной фразы. Для академического соревнования была подготовлена модель детоксификации на основе языковой модели ruT5.

«
«В рамках данного проекта, совместно с коллегами из МТS AI удалось создать ряд технологий для детектирования и переписывания токсичного контента. Предложенные методы и модели могут быть использованы для предотвращения репутационных рисков компании (чат-бот, обученный на текстах из сети, может ответить токсично). Возможны и другие применения. Например, до отправления комментария пользователю может быть предложена менее токсичная формулировка его сообщения. В подобном сценарии использования, свобода выражения не страдает, но количество эмоционально написанных негативных комментариев может быть значительно сокращено. В результате данного сотрудничества кроме методов, моделей и наборов данных появилось немало научных статей, опубликованных совместным коллективом исследователей, инженеров и студентов из «Сколтеха» и МТС», -

сказал Александр Панченко, PhD, старший преподаватель «Сколтеха» и руководитель совместной лаборатории «МТС-Сколтех».
»

Протестировать возможности детоксификатора языка можно самостоятельно. Например, просто обругать бота в мессенджере Telegram. Подробнее о методах и моделях, которые были использованы в рамках данного подхода, можно узнать в статье «Методы детоксификации текстов для русского языка», подготовленной специалистами MTS AI и «Сколтеха», а также на страничке совместной лаборатории «МТС-Сколтех» в области ИИ. 



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (40)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Naumen (Наумен консалтинг) (16)
  Другие (258)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Проф ИТ (Prof IT) Ростов-на-Дону (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  ОБИТ (3)
  Другие (30)

  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Сбер Бизнес Софт (1)
  Сбербанк (1)
  ТелеМедХаб (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 24)
  SteadyControl HoReCa (1, 24)
  Другие (503, 298)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 31)

  СалютДевайсы (ранее SberDevices) (2, 2)
  Сбербанк (2, 2)
  ТелеМедХаб (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТС Exolve Голосовой робот - 30 (6, 24)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  BSS Digital2Speech - 21 (21, 0)
  Сбер: GigaChat (ГигаЧат) - 20 (17, 3)
  EXpress Защищенный корпоративный мессенджер - 16 (16, 0)
  Другие 214

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  BSS Digital2Speech - 5 (5, 0)
  SmartLogger II - 4 (4, 0)
  Другие 11

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  Сбер: GigaChat (ГигаЧат) - 3 (3, 0)
  Prof IT: Vocamate AI - 3 (3, 0)
  Другие 36

  Сбер: GigaChat (ГигаЧат) - 8 (7, 1)
  МТС Exolve Виртуальная АТС - 6 (6, 0)
  YandexGPT - 4 (4, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Naumen Erudite - 3 (3, 0)
  Другие 24

  Сбер: GigaChat (ГигаЧат) - 2 (1, 1)
  Другие -1