Яндекса: RATE (Refined Assessment for Translation Evaluation) Метрика для оценки машинного перевода

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2025/12/04
Технологии: Data Quality - Качество данных

Основная статья: Управление качеством данных

2025: Представление метода для оценки и улучшения машинного перевода

Исследователи Яндекса разработали новый метод оценки качества машинного перевода. Об этом компания сообщила 4 декабря 2025 года. Эту разработку можно использовать для совершенствования моделей, которые уже переводят тексты довольно точно, но делают это не всегда естественно. Например, в неформальном диалоге модель может перевести «sorry, my bad» как «приношу извинения, это моя вина» вместо «извини, ошиблась». Пользователь заметит, что нейросеть выбрала излишне официальный тон, но существующие системы оценки перевода такие ошибки игнорируют. Данный метод помогает обращать внимание нейросетей на такие недочёты.

Данная система оценки Яндекса называется RATE (Refined Assessment for Translation Evaluation — улучшенная метрика для оценки перевода). Она не используется напрямую для дообучения моделей перевода. Но RATE позволяет с высокой точностью оценить, где именно современные модели ошибаются и что нужно улучшить, чтобы их переводы стали точнее и естественнее для пользователя.

В отличие от других метрик, RATE оценивает перевод по трём главным для пользователя критериям: точность передачи смысла, естественность языка и соответствие стилю оригинала. Это позволяет использовать метод для любых типов текстов. Например, с его помощью в новостях можно проверить точность передачи фактов, в постах соцсетей — выявить чрезмерную формальность фраз, а в художественных текстах — оценить стиль и плавность речи. RATE не только отмечает саму ошибку, но и оценивает её значимость — от небольших неточностей до сильных искажений.

По информации Яндекса, сравнение на данных международного конкурса WMT показало, что RATE выявляет в семь раз больше ошибок, чем другие методы оценки — MQM (Multidimensional Quality Metrics — многомерные показатели качества) и ESA (Error Span Annotation — аннотация диапазона ошибок). Результаты эксперимента оценивали высококвалифицированные ИИ-тренеры. Сравнение доказывает, что другие метрики не обнаруживают множество недочётов в переводах нейросетей, которые замечают пользователи.

Эксперимент показал: модели машинного перевода достигли значительного прогресса в точности. При этом эталоном естественности и плавности речи по-прежнему остаётся человеческий перевод, хотя большая языковая модель Яндекса уже приблизилась к этому уровню, опередив такие модели, как Claude-3.5 и GPT-4.

«
Когда мы работали с другими методами, нам не хватало детализации. MQM слишком сложный, а ESA замечает только грубые ошибки. Эти метрики помогают проверить точность, но не позволяют оценить, насколько перевод получается естественным. А именно это сегодня стало главным критерием для пользователя в восприятии перевода. RATE позволяет оценить и точность, и естественность перевода, даёт более полную картину его качества и может подсказать разработчикам, как развивать модель для улучшения перевода, — сказала Екатерина Еникеева, руководитель команды оценки качества перевода в Яндексе.
»

Яндекс уже использует RATE для улучшения своих моделей, адаптируя их переводы под разные сценарии — от деловой переписки до неформального общения. RATE также помогает Яндексу создавать алгоритмы, ориентированные на живую человеческую речь, а не только на формальные критерии.



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Datareon (Датареон) (276)
  Axelot (Акселот) (178)
  Loginom Company (Аналитические технологии) (128)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
  Софрос (Sofros) (34)
  Другие (684)

  Datareon (Датареон) (33)
  Axelot (Акселот) (24)
  Софрос (Sofros) (12)
  Яндекс.Облако (Yandex Cloud) (3)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (49)

  Axelot (Акселот) (20)
  Datareon (Датареон) (19)
  Софрос (Sofros) (13)
  Юниверс Дата (УК ЮД Капитал) (5)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (4)
  Другие (68)

  Axelot (Акселот) (8)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (5)
  Софрос (Sofros) (4)
  Цифровые технологии и платформы (ЦТиП) (3)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (3)
  Другие (93)

  1С-Рарус (1)
  Napoleon IT (Наполеон Айти) (1)
  Институт искусственного интеллекта (ИИИ) МФТИ (1)
  Лаборатория измерительных систем (1)
  ОБИТ (1)
  Другие (13)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Datareon (Датареон) (1, 474)
  Loginom Company (Аналитические технологии) (3, 240)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
  АйТи Про (IT Pro) (1, 18)
  Дата-Центр Автоматика (1, 16)
  Другие (78, 82)

  Datareon (Датареон) (1, 66)
  Юниверс Дата (УК ЮД Капитал) (2, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
  АйТи Про (IT Pro) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Другие (2, 2)

  Datareon (Датареон) (1, 53)
  Юниверс Дата (УК ЮД Капитал) (2, 5)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
  Теком (1, 3)
  TData (ТДата) (1, 2)
  Другие (2, 3)

  Datareon (Датареон) (1, 12)
  Loginom Company (Аналитические технологии) (1, 4)
  Юниверс Дата (УК ЮД Капитал) (2, 3)
  Data Sapience (Дата Сапиенс) (1, 1)
  TData (ТДата) (1, 1)
  Другие (4, 4)

  Datareon (Датареон) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Datareon Platform - 474 (474, 0)
  Deductor - 226 (226, 0)
  HFLabs Фактор - 51 (28, 23)
  АйТи Про: BI.Qube - 18 (18, 0)
  HFLabs Подсказки - 17 (17, 0)
  Другие 55

  Datareon Platform - 66 (66, 0)
  Юниверс Платформа для управления данными - 3 (2, 1)
  HFLabs Фактор - 2 (1, 1)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Дата-Центр Автоматика: Data-Track Индустриальная платформа - 1 (1, 0)
  Другие -1

  Datareon Platform - 53 (53, 0)
  Юниверс Платформа для управления данными - 5 (1, 4)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  HFLabs Фактор - 3 (1, 2)
  Ростелеком Платформа управления данными - 2 (0, 2)
  Другие -11

  Datareon Platform - 12 (12, 0)
  Юниверс Платформа для управления данными - 4 (1, 3)
  Loginom - 4 (4, 0)
  Ростелеком Платформа управления данными - 2 (0, 2)
  Modus ETL Управление корпоративным хранилищем данных - 1 (1, 0)
  Другие -5

  Datareon Platform - 1 (1, 0)
  Другие 0