Яндекс: YaFSDP Библиотека для ускорения обучения больших языковых моделей

Продукт
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2024/06/11
Технологии: ITSM - Системы управления IT-службой

2024: Представление библиотеки YaFSDP

Яндекс разработал библиотеку YaFSDP и выложил ее в опенсорс. Об этом разработчик сообщил 11 июня 2024 года. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру.

Библиотека Яндекса рассчитана в первую очередь на большие языковые модели, хотя она подходит и для других нейросетей — например, таких, которые генерируют изображения. YaFSDP позволяет сократить расходы на оборудование для обучения моделей — это особенно важно для стартапов и, к примеру, научных проектов.

Одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Яндекс разработал YaFSDP в процессе обучения своей генеративной модели нового поколения YandexGPT 3. Компания уже протестировала библиотеку на сторонних нейросетях с открытым исходным кодом. Например, если бы YaFSDP использовалась применительно к модели LLaMA 2, этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней.

Исходный код YaFSDP уже есть на GitHub[1]. Посмотреть подробности замеров можно в репозитории GitHub, а почитать про разработку библиотеки — на Хабре.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (320)
  Comindware (Колловэар) (254)
  Softline (Софтлайн) (125)
  Okdesk (Облачные Решения) (39)
  Террасофт (Terrasoft, ТС-Консалтинг) (38)
  Другие (694)

  Comindware (Колловэар) (78)
  Okdesk (Облачные Решения) (14)
  Naumen (Наумен консалтинг) (11)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (7)
  Крок (3)
  Другие (28)

  Naumen (Наумен консалтинг) (14)
  Okdesk (Облачные Решения) (9)
  Comindware (Колловэар) (8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (7)
  БизнесАвтоматика НПЦ (3)
  Другие (17)

  Naumen (Наумен консалтинг) (18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (12)
  SimpleOne (Симпл 1) (9)
  Softline (Софтлайн) (3)
  КСК Технологии (2)
  Другие (17)

  SimpleOne (Симпл 1) (2)
  Angara Security (Ангара Технолоджиз Груп, АТ Груп) ранее Angara Technologies Group (1)
  Naumen (Наумен консалтинг) (1)
  Softline (Софтлайн) (1)
  Астра Группа компаний (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (7, 342)
  Comindware (Колловэар) (1, 257)
  Microsoft (16, 123)
  OmniNet (ОмниНет) (4, 55)
  Террасофт (Terrasoft, ТС-Консалтинг) (4, 47)
  Другие (566, 598)

  Comindware (Колловэар) (1, 78)
  Rails Jedies
  Okdesk (Облачные Решения) (1, 14)
  Naumen (Наумен консалтинг) (3, 12)
  Nutanix (1, 9)
  Другие (18, 24)

  Naumen (Наумен консалтинг) (3, 14)
  Okdesk (Облачные Решения) (1, 10)
  Rails Jedies
  Comindware (Колловэар) (1, 8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 7)
  Другие (11, 14)

  Naumen (Наумен консалтинг) (4, 18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1, 12)
  SimpleOne (Симпл 1) (1, 9)
  РусБИТех-Астра (ГК Астра) (1, 3)
  Деснол Софт (2, 2)
  Другие (9, 11)

  РусБИТех-Астра (ГК Астра) (1, 3)
  SimpleOne (Симпл 1) (1, 2)
  Naumen (Наумен консалтинг) (2, 1)
  Деснол Софт (1, 1)
  Флант (Flant) (1, 1)
  Другие (1, 1)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen Service Management Platform (NSMP) - 288 (9, 279)
  Comindware Business Application Platform - 257 (257, 0)
  Microsoft System Center 2012 - 58 (18, 40)
  OmniTracker - 55 (41, 14)
  Microsoft System Center Configuration Manager (SCCM) - 50 (50, 0)
  Другие 230

  Comindware Business Application Platform - 78 (78, 0)
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 14 (14, 0)
  Nutanix HCI - 9 (9, 0)
  Naumen Service Management Platform (NSMP) - 7 (3, 4)
  Naumen Service Desk - 6 (0, 6)
  Другие 12

  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 10 (10, 0)
  Naumen Service Desk - 9 (0, 9)
  Comindware Business Application Platform - 8 (8, 0)
  Naumen Service Management Platform (NSMP) - 6 (3, 3)
  ELMA365 Service - 6 (6, 0)
  Другие 2

  ELMA365 Service - 12 (12, 0)
  Naumen Service Desk - 9 (0, 9)
  SimpleOne ITSM (IT Service Management) - 9 (9, 0)
  Naumen Service Management Platform (NSMP) - 8 (1, 7)
  РусБИТех-Астра: ALD Pro - 3 (3, 0)
  Другие -4

  РусБИТех-Астра: ALD Pro - 3 (3, 0)
  Naumen Service Management Platform (NSMP) - 2 (0, 2)
  SimpleOne ITSM (IT Service Management) - 2 (2, 0)
  Service Desk Итилиум - 1 (1, 0)
  Naumen Software Asset Management (SAM) - 1 (1, 0)
  Другие -1