Т-Банк: Turbo Alignment Библиотека инструментов для обучения больших языковых моделей

Продукт
Разработчики: Т-Банк (Тинькофф Банк)
Дата премьеры системы: 2024/10/16
Технологии: Речевые технологии,  Средства разработки приложений

2024: Открытие доступа к Turbo Alignment

Центр искусственного интеллекта Т-Банка открыл доступ к бесплатной библиотеке инструментов Turbo Alignment для обучения больших языковых моделей (LLM) под задачи бизнеса. Библиотека позволит компаниям не разрабатывать ИИ-приложения с нуля, а использовать уже готовые инструменты. Об этом было объявлено 16 октября 2024 года.

Turbo Alignment поможет стартапам и крупному бизнесу, который не специализируется на ИИ, создавать инновационные продукты, которые были бы невозможны без LLM. Например, ассистентов поддержки, которые обрабатывают клиентские запросы и мгновенно предоставляют ответы, инструменты для анализа и обобщения крупных объемов текста, таких как отчеты и исследования, интеллектуальные поисковые системы, способные находить информацию с учетом контекста, а также модели для суммаризации текста.

Плюсы Turbo Alignment для бизнеса:

  • Комплексный подход. Компаниям не придется инвестировать в обучение больших языковых моделей с нуля. Кроме прикладных инструментов для создания ИИ-продуктов бизнесу доступна большая языковая модель T-lite, которая показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7—8 млрд параметров.
  • Снижение затрат на разработку. Turbo Alignment значительно снижает затраты на разработку ИИ-продуктов и количество используемых вычислительных ресурсов за счет использования готовых инструментов и моделей.
  • Экономия времени. По оценке разработчиков Т-Банка, скорость разработки с помощью репозитория — от идеи до продукта — выросла в 4 раза. Это сокращает время на запуск новых ИИ-продуктов и дает бизнесу конкурентное качество.
  • Улучшение клиентского опыта. Продукты на основе LLM делают взаимодействие с пользователями более интерактивным и персонализированным, учитывают их индивидуальные потребности. Это ускоряет обслуживание и повышает удовлетворенность клиентов.

«
Создание библиотеки Turbo Alignment — это часть нашей стратегии по развитию российской ИТ-индустрии. Как один из лидеров опенсорса, мы видим свою миссию в том, чтобы делиться с рынком своими разработками. У большинства компаний не хватает ресурсов для разработки продуктов на основе больших языковых моделей. Поэтому мы выпустили в опенсорс не только модель T-lite, но и библиотеку инструментов для ее прикладного использования. Так мы делаем ИИ более доступным для обычных людей: чем больше компаний создают ИИ-продукты, тем больше пользователей смогут извлечь пользу из этих технологий,
сказал Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

Библиотека создана при участии ученых из лаборатории научных исследований искусственного интеллекта T-Bank AI Research. В ней исследователи разрабатывают и проектируют новые методы, которые становятся основой их научных открытий. Turbo Alignment дает доступ к последним исследованиям в области AI Alignment, направленным на то, чтобы поведение ИИ было предсказуемым и не выходило из-под контроля человека, соответствовало его потребностям и ценностям. В библиотеке собраны все необходимые метрики и инструменты, которые позволяют понять и проанализировать различные подходы к обучению ИИ.

Преимущества Turbo Alignment для разработчиков:

  • Доступность для небольших и непрофильных команд. Turbo Alignment позволяет даже небольшим командам без значительных ресурсов и глубокой экспертизы в области языковых моделей создавать продукты на основе искусственного интеллекта.
  • Набор готовых инструментов. В репозитории доступен no-code-запуск экспериментов, скрипты для обучения большого количества алгоритмов, модуль для быстрого тестирования моделей и инструменты для мониторинга метрик во время обучения.
  • Инструменты для исследований и разработки. Turbo Alignment предоставляет все необходимые средства для добавления новых методов обучения и их сравнения с уже существующими решениями на конкретных задачах.
  • Поддержка сложных процессов обучения. Turbo Alignment оптимизирован для распределенного обучения на нескольких видеокартах и серверах (Multi-GPU и Multi-Node).

«
Современные эксперименты с большими языковыми моделями (LLM) нуждаются в стабильности, воспроизводимости и объяснимости — это ключевые факторы для создания качественных продуктов. Хотя на рынке уже существуют конкурентные решения, они зачастую фрагментированы и требуют доработки. В отличие от них мы объединили все необходимые компоненты в единой библиотеке, что обеспечивает целостность и удобство использования. Turbo Alignment предлагает расширенную функциональность, готовую последовательность работы с данными и инструменты для обучения LLM. Это позволяет быстро проверять научные и продуктовые гипотезы,
отметил Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

В дальнейшем Т-Банк планирует поддерживать и развивать библиотеку Turbo Alignment, добавляя новые методы и обучающие материалы.



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Бипиум (Bpium) (10)
  Другие (393)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  IFellow (АйФэлл) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Форсайт (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Robin (Робин) (3)
  Форсайт (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Солар (ранее Ростелеком-Солар) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Effective Technologies (Эффектив Технолоджис) (1)
  GMCS (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (607, 308)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Сбербанк (1, 2)
  Другие (9, 9)

  Солар (ранее Ростелеком-Солар) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  SL Soft (СЛ Софт) (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Axiom JDK (БеллСофт) ранее Bellsoft (1, 1)
  Другие (14, 14)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48 (48, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  EXpress Защищенный корпоративный мессенджер - 12 (12, 0)
  Другие 315

  Solar appScreener (ранее Solar inCode) - 8 (8, 0)
  FIS Platform - 4 (4, 0)
  Парадокс: MES Builder - 2 (2, 0)
  Java - 2 (2, 0)
  Siemens Xcelerator - 2 (2, 0)
  Другие 21

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  BSS Digital2Go - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Axiom JDK (ранее Liberica JDK до 2022) - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 4 (4, 0)
  Solar appScreener (ранее Solar inCode) - 3 (3, 0)
  МТС Exolve - 2 (2, 0)
  Т1: Сфера Платформа производства ПО - 1 (1, 0)
  BSS Digital2Go - 1 (1, 0)
  Другие 10

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (45)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (15)
  Другие (196)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  SteadyControl (4)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  SteadyControl (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Naumen (Наумен консалтинг) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Robovoice (Робовойс) (3)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  Другие (31)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 47)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl (1, 23)
  SteadyControl HoReCa (1, 23)
  Другие (381, 217)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl (1, 4)
  SteadyControl HoReCa (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Naumen (Наумен консалтинг) (1, 3)
  SteadyControl (1, 3)
  SteadyControl HoReCa (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  СалютДевайсы (ранее SberDevices) (2, 4)
  Другие (25, 39)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТС Exolve Голосовой робот - 29 (5, 24)
  SteadyControl Система контроля и управления персоналом - 23 (23, 0)
  BSS Digital2Speech - 21 (21, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  Naumen Erudite - 13 (13, 0)
  Другие 152

  BSS Digital2Speech - 5 (5, 0)
  SteadyControl Система контроля и управления персоналом - 4 (4, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  МТС Exolve Голосовой робот - 2 (0, 2)
  Neuro.net Голосовой робот - 2 (2, 0)
  Другие 8

  МТС Exolve Голосовой робот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Другие 0

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  BSS Digital2Speech - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 12

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  EXpress Защищенный корпоративный мессенджер - 4 (4, 0)
  Сбер: GigaChat - 3 (3, 0)
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3 (3, 0)
  Другие 28