Сбер: PyTorch-LifeStream Программная библиотека

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Сбербанк
Дата последнего релиза: 2022/02/01
Технологии: MDM - Master Data Management - Управление основными мастер-данными

Основная статья: Управление данными (Data management)

2022: Предоставление разработчикам бесплатного доступа к PyTorch-LifeStream

1 февраля 2022 года «Сбер» сообщил, что предоставил разработчикам бесплатный доступ к инструменту подготовки датасетов.

«Сбер» сделал открытым инструмент - программную библиотеку PyTorch-LifeStream, содержащую несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных данных (датасетов).

Событийные данные могут представлять собой разные последовательности - истории посещений сайтов, истории покупок, событий в онлайн-играх и так далее. При этом, сгенерированный на основе алгоритмов библиотеки эмбеддинг такой последовательности не будет содержать каких-либо персональных данных.

В библиотеке реализован алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту «Сбера». Кроме того, в библиотеке реализованы методы на основе сторонних научных публикаций, но адаптированные «Сбером» к событийным данным.

«
«Недостаток очищенных, обезличенных и размеченных данных - это один из главных барьеров для дальнейшего развития искусственного интеллекта, для создания новых продуктов и сервисов, которые смогут решать важные научные и социально значимые задачи. Но существуют инструменты, которые позволяют готовить такие данные. Свободный доступ к этим инструментам - важное условие для преодоления барьера. Уверен, что вывод нашей библиотеки в паблик ускорит разработку и внедрение систем искусственного интеллекта в России и, как следствие, будет содействовать конкуренции и экономическому развитию нашей страны», -

говорит Александр Ведяхин, первый заместитель Председателя Правления «Сбербанка».
»

«Сбер» уже давно делится результатами своих исследований в области искусственного интеллекта со всеми желающими. В частности, ранее компания вывела в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (156)
  Цифра (31)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (25)
  АйТи Про (IT Pro) (21)
  Другие (288)

  Datareon (Датареон) (37)
  Axelot (Акселот) (25)
  Commvault (5)
  АйТи Про (IT Pro) (4)
  AnalyticsHub (АналитиксХаб) (2)
  Другие (35)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Цифра (7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5)
  Софрос (Sofros) (4)
  Другие (22)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (9)
  TData (ТДата) (3)
  Naumen (Наумен консалтинг) (3)
  Другие (32)

  Datareon (Датареон) (19)
  Axelot (Акселот) (8)
  Первый Бит (3)
  Софрос (Sofros) (3)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (3)
  Другие (20)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (2, 419)
  Цифра (2, 36)
  Axelot (Акселот) (1, 30)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5, 26)
  Informatica (14, 21)
  Другие (307, 262)

  Datareon (Датареон) (1, 60)
  Commvault (2, 5)
  АйТи Про (IT Pro) (1, 4)
  ЮниДата (UniData) (1, 3)
  SAP SE (1, 2)
  Другие (25, 25)

  Datareon (Датареон) (1, 71)
  Цифра (1, 7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3, 5)
  Axelot (Акселот) (1, 5)
  TData (ТДата) (2, 2)
  Другие (16, 18)

  Datareon (Датареон) (1, 57)
  Axelot (Акселот) (1, 6)
  Цифра (1, 4)
  Ростелеком (3, 3)
  TData (ТДата) (3, 3)
  Другие (18, 22)

  Datareon (Датареон) (1, 31)
  TData (ТДата) (2, 3)
  Ростелеком (2, 3)
  Data Sapience (Дата Сапиенс) (2, 3)
  Axelot (Акселот) (1, 2)
  Другие (15, 16)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon Platform - 419 (419, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 36 (36, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 30 (30, 0)
  HFLabs Единый клиент - 23 (23, 0)
  АйТи Про: BI.Qube - 18 (18, 0)
  Другие 212

  Datareon Platform - 60 (60, 0)
  АйТи Про: BI.Qube - 4 (4, 0)
  Commvault Complete Data Protection - 4 (4, 0)
  ЮниДата Платформа управления данными - 3 (3, 0)
  Alation Data Catalog - 2 (2, 0)
  Другие 26

  Datareon Platform - 71 (71, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 7 (7, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5 (5, 0)
  Ростелеком Платформа управления данными - 2 (0, 2)
  HFLabs Единый клиент - 2 (2, 0)
  Другие 15

  Datareon Platform - 57 (57, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 6 (6, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 4 (4, 0)
  Ростелеком Платформа управления данными - 3 (0, 3)
  Naumen Enterprise Search - 3 (3, 0)
  Другие 12

  Datareon Platform - 31 (31, 0)
  Ростелеком Платформа управления данными - 3 (0, 3)
  Data Sapience: Data Ocean Платформа управления данными - 2 (2, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 2 (2, 0)
  HFLabs Единый клиент - 2 (2, 0)
  Другие 11