Т-Банк: Turbo Alignment Библиотека инструментов для обучения больших языковых моделей

Продукт
Разработчики: Т-Банк (Тинькофф Банк)
Дата премьеры системы: 2024/10/16
Технологии: Речевые технологии,  Средства разработки приложений

2024: Открытие доступа к Turbo Alignment

Центр искусственного интеллекта Т-Банка открыл доступ к бесплатной библиотеке инструментов Turbo Alignment для обучения больших языковых моделей (LLM) под задачи бизнеса. Библиотека позволит компаниям не разрабатывать ИИ-приложения с нуля, а использовать уже готовые инструменты. Об этом было объявлено 16 октября 2024 года.

Turbo Alignment поможет стартапам и крупному бизнесу, который не специализируется на ИИ, создавать инновационные продукты, которые были бы невозможны без LLM. Например, ассистентов поддержки, которые обрабатывают клиентские запросы и мгновенно предоставляют ответы, инструменты для анализа и обобщения крупных объемов текста, таких как отчеты и исследования, интеллектуальные поисковые системы, способные находить информацию с учетом контекста, а также модели для суммаризации текста.

Плюсы Turbo Alignment для бизнеса:

  • Комплексный подход. Компаниям не придется инвестировать в обучение больших языковых моделей с нуля. Кроме прикладных инструментов для создания ИИ-продуктов бизнесу доступна большая языковая модель T-lite, которая показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7—8 млрд параметров.
  • Снижение затрат на разработку. Turbo Alignment значительно снижает затраты на разработку ИИ-продуктов и количество используемых вычислительных ресурсов за счет использования готовых инструментов и моделей.
  • Экономия времени. По оценке разработчиков Т-Банка, скорость разработки с помощью репозитория — от идеи до продукта — выросла в 4 раза. Это сокращает время на запуск новых ИИ-продуктов и дает бизнесу конкурентное качество.
  • Улучшение клиентского опыта. Продукты на основе LLM делают взаимодействие с пользователями более интерактивным и персонализированным, учитывают их индивидуальные потребности. Это ускоряет обслуживание и повышает удовлетворенность клиентов.

«
Создание библиотеки Turbo Alignment — это часть нашей стратегии по развитию российской ИТ-индустрии. Как один из лидеров опенсорса, мы видим свою миссию в том, чтобы делиться с рынком своими разработками. У большинства компаний не хватает ресурсов для разработки продуктов на основе больших языковых моделей. Поэтому мы выпустили в опенсорс не только модель T-lite, но и библиотеку инструментов для ее прикладного использования. Так мы делаем ИИ более доступным для обычных людей: чем больше компаний создают ИИ-продукты, тем больше пользователей смогут извлечь пользу из этих технологий,
сказал Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

Библиотека создана при участии ученых из лаборатории научных исследований искусственного интеллекта T-Bank AI Research. В ней исследователи разрабатывают и проектируют новые методы, которые становятся основой их научных открытий. Turbo Alignment дает доступ к последним исследованиям в области AI Alignment, направленным на то, чтобы поведение ИИ было предсказуемым и не выходило из-под контроля человека, соответствовало его потребностям и ценностям. В библиотеке собраны все необходимые метрики и инструменты, которые позволяют понять и проанализировать различные подходы к обучению ИИ.

Преимущества Turbo Alignment для разработчиков:

  • Доступность для небольших и непрофильных команд. Turbo Alignment позволяет даже небольшим командам без значительных ресурсов и глубокой экспертизы в области языковых моделей создавать продукты на основе искусственного интеллекта.
  • Набор готовых инструментов. В репозитории доступен no-code-запуск экспериментов, скрипты для обучения большого количества алгоритмов, модуль для быстрого тестирования моделей и инструменты для мониторинга метрик во время обучения.
  • Инструменты для исследований и разработки. Turbo Alignment предоставляет все необходимые средства для добавления новых методов обучения и их сравнения с уже существующими решениями на конкретных задачах.
  • Поддержка сложных процессов обучения. Turbo Alignment оптимизирован для распределенного обучения на нескольких видеокартах и серверах (Multi-GPU и Multi-Node).

«
Современные эксперименты с большими языковыми моделями (LLM) нуждаются в стабильности, воспроизводимости и объяснимости — это ключевые факторы для создания качественных продуктов. Хотя на рынке уже существуют конкурентные решения, они зачастую фрагментированы и требуют доработки. В отличие от них мы объединили все необходимые компоненты в единой библиотеке, что обеспечивает целостность и удобство использования. Turbo Alignment предлагает расширенную функциональность, готовую последовательность работы с данными и инструменты для обучения LLM. Это позволяет быстро проверять научные и продуктовые гипотезы,
отметил Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

В дальнейшем Т-Банк планирует поддерживать и развивать библиотеку Turbo Alignment, добавляя новые методы и обучающие материалы.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Бипиум (Bpium) (10)
  Синимекс (Cinimex) (9)
  Другие (387)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  IFellow (АйФэлл) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Форсайт (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Robin (Робин) (3)
  Форсайт (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (3)
  Солар (ранее Ростелеком-Солар) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  GMCS (1)
  Нота (Холдинг Т1) (1)
  Другие (7)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (588, 301)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Форсайт (1, 3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Сбербанк (1, 2)
  Другие (9, 9)

  Солар (ранее Ростелеком-Солар) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  SL Soft (СЛ Софт) (1, 3)
  Другие (14, 24)

  Мобильные ТелеСистемы (МТС) (2, 3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  T1 Digital (Т1 Диджитал) (1, 1)
  Другие (10, 10)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48 (48, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 12 (12, 0)
  Другие 308

  Solar appScreener (ранее Solar inCode) - 8 (8, 0)
  FIS Platform - 4 (4, 0)
  Java - 2 (2, 0)
  Турбо X - 2 (2, 0)
  Парадокс: MES Builder - 2 (2, 0)
  Другие 21

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  BSS Digital2Go - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Yandex Vision - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Другие 13

  Solar appScreener (ранее Solar inCode) - 3 (3, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  МТС Exolve - 2 (2, 0)
  Т1: Сфера Платформа производства ПО - 1 (1, 0)
  Газпром: Ивентум Конструктор приложений для организации и управления мероприятиями - 1 (1, 0)
  Другие 6

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (44)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (15)
  Другие (187)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  SteadyControl (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Voice Systems Robotics (VSR, VS Robotics) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Naumen (Наумен консалтинг) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3)
  Другие (23)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (346, 206)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (17, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 3)
  СалютДевайсы (ранее SberDevices) (2, 3)
  Другие (19, 32)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТС Exolve Голосовой робот - 29 (5, 24)
  SteadyControl Система контроля и управления персоналом - 23 (23, 0)
  BSS Digital2Speech - 21 (21, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  Naumen Erudite - 13 (13, 0)
  Другие 143

  BSS Digital2Speech - 5 (5, 0)
  SteadyControl Система контроля и управления персоналом - 4 (4, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  МТС Exolve Голосовой робот - 2 (0, 2)
  3i TouchPoint Analytics - 2 (2, 0)
  Другие 8

  МТС Exolve Голосовой робот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  Другие -1

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  BSS Digital2Speech - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 12

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3 (3, 0)
  YandexGPT (YaLM 2.0) - 3 (3, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Другие 21