Сбер: PyTorch-LifeStream Программная библиотека

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Сбербанк
Дата последнего релиза: 2022/02/01
Технологии: MDM - Master Data Management - Управление основными мастер-данными

Основная статья: Управление данными (Data management)

2022: Предоставление разработчикам бесплатного доступа к PyTorch-LifeStream

1 февраля 2022 года «Сбер» сообщил, что предоставил разработчикам бесплатный доступ к инструменту подготовки датасетов.

«Сбер» сделал открытым инструмент - программную библиотеку PyTorch-LifeStream, содержащую несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных данных (датасетов).

Событийные данные могут представлять собой разные последовательности - истории посещений сайтов, истории покупок, событий в онлайн-играх и так далее. При этом, сгенерированный на основе алгоритмов библиотеки эмбеддинг такой последовательности не будет содержать каких-либо персональных данных.

В библиотеке реализован алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту «Сбера». Кроме того, в библиотеке реализованы методы на основе сторонних научных публикаций, но адаптированные «Сбером» к событийным данным.

«
«Недостаток очищенных, обезличенных и размеченных данных - это один из главных барьеров для дальнейшего развития искусственного интеллекта, для создания новых продуктов и сервисов, которые смогут решать важные научные и социально значимые задачи. Но существуют инструменты, которые позволяют готовить такие данные. Свободный доступ к этим инструментам - важное условие для преодоления барьера. Уверен, что вывод нашей библиотеки в паблик ускорит разработку и внедрение систем искусственного интеллекта в России и, как следствие, будет содействовать конкуренции и экономическому развитию нашей страны», -

говорит Александр Ведяхин, первый заместитель Председателя Правления «Сбербанка».
»

«Сбер» уже давно делится результатами своих исследований в области искусственного интеллекта со всеми желающими. В частности, ранее компания вывела в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (234)
  Axelot (Акселот) (145)
  Цифра (31)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (24)
  АйТи Про (IT Pro) (21)
  Другие (258)

  Datareon (Датареон) (32)
  Axelot (Акселот) (24)
  Commvault (5)
  АйТи Про (IT Pro) (4)
  ЮниДата (UniData) (2)
  Другие (35)

  Datareon (Датареон) (37)
  Axelot (Акселот) (32)
  Цифра (7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5)
  Софрос (Sofros) (4)
  Другие (21)

  Datareon (Датареон) (22)
  Axelot (Акселот) (15)
  Софрос (Sofros) (9)
  Naumen (Наумен консалтинг) (3)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (2)
  Другие (26)

  Первый Бит (2)
  Axelot (Акселот) (2)
  Мобильные ТелеСистемы (МТС) (1)
  Наносемантика (Nanosemantics Lab) (1)
  Софрос (Sofros) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (2, 366)
  Цифра (2, 35)
  Axelot (Акселот) (1, 28)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5, 25)
  Informatica (14, 21)
  Другие (278, 210)

  Datareon (Датареон) (1, 54)
  Commvault (2, 5)
  АйТи Про (IT Pro) (1, 4)
  ЮниДата (UniData) (1, 3)
  SAP SE (1, 2)
  Другие (25, 25)

  Datareon (Датареон) (1, 67)
  Цифра (1, 7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3, 5)
  Axelot (Акселот) (1, 5)
  Платформа больших данных (Platforma) (1, 2)
  Другие (14, 15)

  Datareon (Датареон) (1, 42)
  Axelot (Акселот) (1, 5)
  Цифра (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Тандер Сеть магазинов Магнит (2, 2)
  Другие (15, 16)

  Datareon (Датареон) (1, 4)
  Napoleon IT (Наполеон Айти) (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Технологии Будущего (1, 1)
  Axelot (Акселот) (1, 1)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon Platform - 366 (366, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 35 (35, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 28 (28, 0)
  HFLabs Единый клиент - 22 (22, 0)
  АйТи Про: BI.Qube - 18 (18, 0)
  Другие 200

  Datareon Platform - 54 (54, 0)
  АйТи Про: BI.Qube - 4 (4, 0)
  Commvault Complete Data Protection - 4 (4, 0)
  ЮниДата Платформа управления данными - 3 (3, 0)
  Alation Data Catalog - 2 (2, 0)
  Другие 26

  Datareon Platform - 67 (67, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 7 (7, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5 (5, 0)
  Platforma и HFLabs: Технология безопасного метчинга данных - 2 (2, 0)
  HFLabs Единый клиент - 2 (2, 0)
  Другие 15

  Datareon Platform - 42 (42, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5 (5, 0)
  Naumen Enterprise Search - 3 (3, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 3 (3, 0)
  N3.Управление НСИ - 2 (2, 0)
  Другие 12

  Datareon Platform - 4 (4, 0)
  HFLabs Единый клиент - 1 (1, 0)
  Altcraft Platform - 1 (1, 0)
  Наносемантика NLab Marker - 1 (1, 0)
  Neuroniq.Platform Цифровая интеграционная платформа - 1 (1, 0)
  Другие 4