Schema-Guided Dialogue (SGD)
Набор диалогов для обучения голосовых помощников

Продукт
Разработчики: Google
Дата премьеры системы: октябрь 2019 г
Отрасли: Интернет-сервисы
Технологии: Речевые технологии

Содержание

2019: Анонс

В конце октября 2019 года стало известно о том, что Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Проект американской корпорации получил название Schema-Guided Dialogue (SGD).

«
Современные виртуальные помощники помогают пользователям выполнять широкий спектр задач, включая поиск рейсов, поиск ближайших мероприятий и фильмов, резервирование чего-либо, поиск информации в интернете и др., — говорят инженер-программист Абхинав Растоги (Abhinav Rastogi) и технический руководитель отдела Google Research Пранав Хайтан (Pranav Khaitan). Несмотря на огромный прогресс, проблемы адаптивности часто упускаются из виду в современных моделях. Частично это связано с отсутствием подходящих наборов данных, которые соответствуют масштабу и сложности, с которыми сталкиваются такие виртуальные помощники.
»

Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Новый проект американской корпорации получил название Schema-Guided Dialogue (SGD)

В базу SGD входит 18 тыс. проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом. Диалоги могут разбиты по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Для большинства тем предусмотрено несколько разных API, многие из которых имеют пересекающиеся функции, но разные интерфейсы, отражающие типичные сценарии реального мира.

По словам создателей SGD, это первый набор данный, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Разработчики также заявляют, что унифицированная модель, которая лежит в основе открытой модели Google для отслеживания состояния диалогов, облегчает представление общих знаний между похожими концепциями в разных сервисах. Это позволяет разработчикам обращаться к новым сервисам, которые ранее не обучались на основе данных из SGD.[1]

Смотрите также Голосовые помощники (бормотографы)



Примечания



СМ. ТАКЖЕ (69)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Сбербанк (18)
  Другие (265)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  ОБИТ (3)
  Другие (31)

  Сбербанк (3)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Just AI (1)
  TargetAI (Таргет плюс) (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 42)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 27)
  SteadyControl HoReCa (1, 24)
  Другие (512, 308)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Сбербанк (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 32)

  СалютДевайсы (ранее SberDevices) (2, 4)
  Сбербанк (2, 4)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  Just AI (1, 1)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (1, 1)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТС Exolve Голосовой робот - 31 (7, 24)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  Сбер: GigaChat (ГигаЧат) - 23 (20, 3)
  BSS Digital2Speech - 21 (21, 0)
  EXpress Защищенный корпоративный мессенджер - 16 (16, 0)
  Другие 220

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  BSS Digital2Speech - 5 (5, 0)
  SmartLogger II - 4 (4, 0)
  Другие 11

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  YandexGPT - 3 (3, 0)
  BSS: Виртуальный голосовой ассистент - 3 (3, 0)
  Другие 36

  Сбер: GigaChat (ГигаЧат) - 8 (7, 1)
  МТС Exolve Виртуальная АТС - 6 (6, 0)
  YandexGPT - 4 (4, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Naumen Erudite - 3 (3, 0)
  Другие 25

  Сбер: GigaChat (ГигаЧат) - 4 (3, 1)
  Lad: GPTZator - 2 (2, 0)
  Сбер SaluteSpeech (SmartSpeech) - 1 (1, 0)
  T-Bank VoiceKit - 1 (0, 1)
  LazyDoc Программный комплекс для заполнения и анализа медицинской документации - 1 (1, 0)
  Другие 0