Platforma и HFLabs: Технология безопасного метчинга данных

Продукт
Разработчики: Платформа больших данных (Platforma), HFLabs (ХФ Лабс), ранее HumanFactorLabs
Дата последнего релиза: 2022/07/19
Технологии: Data Mining,  MDM - Master Data Management - Управление основными мастер-данными

Основные статьи:

2022: Тестирование технологии безопасного метчинга

Разработчик решений для бизнеса на основе больших данных Platforma и ИТ-компания HFLabs протестировали технологию безопасного метчинга данных двух разных игроков. Об этом 19 июля 2022 сообщила компания Platforma. Стороны разработали алгоритм преобразования и совмещения баз данных, который учитывает существующие требования законодательства и позволяет находить пересечения без использования персональных данных. Такая технология помогает компаниям выявлять общих клиентов и предлагать им совместные программы лояльности, новые продукты и сервисы, а также улучшать коммуникацию с пользователями, увеличивать конверсию и т.д.

Первыми участниками пилота стали ВТБ и Ростелеком. С помощью алгоритма были объединены клиентские базы, содержащие суммарно около 250 млн записей. Решение Platforma и HFLabs позволило найти группы клиентов, которые пользуются услугами обоих участников пилота, без использования и передачи их персональных данных. Этого удалось достичь за счет работы с синтетическими идентификаторами — UUID, которые не являются персональными данными и состоят из случайного набора букв и цифр фиксированной длины, а также благодаря двухэтапной схеме распределённого преобразования данных с использованием защищённого ключа-«секрета».

При подготовке к работе данные хэшируются в два этапа с применением сессионного секрета, доступного только владельцам данных, а затем передаются в федеративный хаб – сердце ИТ-архитектуры. Он сравнивает хеши и находит пересечения в клиентских базах. Модель обмена поддерживает несколько способов хеширования данных, в том числе предусмотренные ГОСТом методы.

Одна из ключевых сложностей проекта – разный формат клиентских данных. Даже внутри одного бизнеса нередко существуют различные ИТ-системы (CRM, биллинговые, кредитные портфели и т.д.), где информация хранится в разном формате с разным набором полей, характеристик. Например, в одной системе имя записано как «Наталья», а в другой – «Наталия». Совместное решение HFLabs и Platforma учитывает эту особенность, поэтому сначала происходит поиск схожих данных с помощью механизмов дедупликации и алгоритмов, учитывающих синонимы, опечатки, взаимозаменяемые слова, устаревшие наименования населенных пунктов.

Второй важный критерий при метчинге клиентов — это скорость. Первый этап хеширования может занимать около двух дней. Затем метчинг баз двух компаний, включая второй этап хеширования, может потребовать несколько часов.

«
Специализированное решение, доработанное партнером под нашу задачу, доказало свою работоспособность и эффективность. Оно применимо как для работы с базами физических лиц, так и юридических. Мы намерены масштабировать это решение и оформить в полноценный продукт для бизнеса. Выявление общих клиентов позволит различным компаниям разрабатывать новые совместные программы лояльности или специальные предложения для пользователей, углубить свое знание и понимание клиентов. Вместе с этим потребители быстрее получат доступ к новым услугам: например, банк охотнее выдаст кредит, зная, что клиент исправно оплачивает сотовую связь у провайдера, — рассказал генеральный директор Platforma Алексей Каштанов.
»

«
Наше решение обеспечивает безопасную, быструю и точную идентификацию клиентов в базах разных организаций. Это важный шаг к созданию федеративных экосистем, объединяющих разные компании с равными правами. Бизнес сможет не только найти общих клиентов, но и понять, какие товары и услуги они покупают, – объяснил Константин Степанов, исполнительный директор IT-компании HFLabs.
»

В перспективе на базе разработанной технологии Platforma сможет выступать своего рода дата-банком, где партнеры хранят свои данные в собственных ячейках без доступа к ним со стороны других участников. Вместе с этим пользователи такого сервиса смогут безопасно объединять, метчить свои базы, проводить анализ и строить математические модели на объединенных данных, создавать сервисы и бизнес-продукты, участвовать в монетизации.





Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (743)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Loginom Company (Аналитические технологии) (2)
  Сбербанк (2)
  Другие (55)

  БизнесАвтоматика НПЦ (4)
  CM.Expert (АвтоЭксперт) (2)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Napoleon IT (Наполеон Айти) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  SL Soft (СЛ Софт) (3)
  Полиматика (Polymatica) (2)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Другие (68)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Цифровые технологии и платформы (ЦТиП) (3)
  Loginom Company (Аналитические технологии) (3)
  Ростелеком (3)
  Другие (85)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  SL Soft (СЛ Софт) (4, 15)
  Полиматика (Polymatica) (4, 15)
  Oracle (12, 14)
  Другие (391, 205)

  БизнесАвтоматика НПЦ (1, 12)
  Сбербанк (2, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  Платформа больших данных (Platforma) (1, 2)
  Другие (15, 17)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  SL Soft (СЛ Софт) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Полиматика (Polymatica) (3, 4)
  SL Soft (СЛ Софт) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  К2Тех (1, 1)
  Ростелеком (1, 1)
  Яндекс.Облако (Yandex Cloud) (1, 1)
  Другие (11, 11)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Deductor - 226 (226, 0)
  Visary BI Платформа бизнес-аналитики - 122 (122, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 48 (0, 48)
  Loginom - 14 (14, 0)
  Polymatica Analytics Аналитическая платформа - 14 (13, 1)
  Другие 99

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  Loginom - 2 (2, 0)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  Platforma и HFLabs: Технология безопасного метчинга данных - 2 (2, 0)
  Другие 5

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 6 (0, 6)
  Visary BI Платформа бизнес-аналитики - 4 (4, 0)
  ЦРТ: Speech Analytics Lab - 2 (2, 0)
  Polymatica Analytics Аналитическая платформа - 2 (2, 0)
  PIX Process Management (PIX Процессы) - 2 (2, 0)
  Другие 6

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 11 (0, 11)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Polymatica Analytics Аналитическая платформа - 3 (2, 1)
  Сфера. Интеллектуальный анализ процессов - 1 (1, 0)
  МТС DataOps Platform - 1 (1, 0)
  Другие -10

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 6 (0, 6)
  Loginom - 4 (4, 0)
  ITMan Discovery - 1 (1, 0)
  Yandex SpeechSense - 1 (1, 0)
  Другие -1

Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (275)
  Axelot (Акселот) (186)
  Софрос (Sofros) (36)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (28)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (25)
  Другие (369)

  Datareon (Датареон) (42)
  Axelot (Акселот) (36)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5)
  Софрос (Sofros) (4)
  Платформа больших данных (Platforma) (2)
  Другие (26)

  Datareon (Датареон) (32)
  Axelot (Акселот) (23)
  Софрос (Sofros) (13)
  Юниверс Дата (УК ЮД Капитал) (6)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (4)
  Другие (30)

  Axelot (Акселот) (20)
  Datareon (Датареон) (19)
  Софрос (Sofros) (13)
  Юниверс Дата (УК ЮД Капитал) (10)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (8)
  Другие (33)

  Axelot (Акселот) (8)
  Софрос (Sofros) (4)
  Юниверс Дата (УК ЮД Капитал) (4)
  Arenadata (Аренадата Софтвер) (4)
  DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software (3)
  Другие (24)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (2, 473)
  Axelot (Акселот) (1, 33)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5, 26)
  Юниверс Дата (УК ЮД Капитал) (3, 24)
  SDI Solution (ЭсДиАй Солюшен) (1, 23)
  Другие (345, 322)

  Datareon (Датареон) (1, 77)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3, 5)
  Axelot (Акселот) (1, 5)
  Юниверс Дата (УК ЮД Капитал) (2, 2)
  SDI Solution (ЭсДиАй Солюшен) (1, 2)
  Другие (19, 22)

  Datareon (Датареон) (1, 65)
  Юниверс Дата (УК ЮД Капитал) (3, 6)
  Axelot (Акселот) (1, 6)
  Naumen (Наумен консалтинг) (1, 3)
  Тандер Сеть магазинов Магнит (2, 2)
  Другие (17, 18)

  Datareon (Датареон) (1, 53)
  Юниверс Дата (УК ЮД Капитал) (3, 10)
  Data Sapience (Дата Сапиенс) (2, 3)
  Arenadata (Аренадата Софтвер) (1, 3)
  TData (ТДата) (2, 2)
  Другие (18, 20)

  Datareon (Датареон) (1, 12)
  Юниверс Дата (УК ЮД Капитал) (3, 4)
  Атеуко (Ateuco) (1, 3)
  Axelot (Акселот) (1, 3)
  Arenadata (Аренадата Софтвер) (1, 3)
  Другие (15, 15)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon Platform - 473 (473, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 33 (33, 0)
  Юниверс Платформа для управления данными - 30 (6, 24)
  HFLabs Единый клиент - 23 (23, 0)
  НСИ Semantic MDM - 23 (23, 0)
  Другие 242

  Datareon Platform - 77 (77, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5 (5, 0)
  Юниверс Платформа для управления данными - 3 (1, 2)
  НСИ Semantic MDM - 2 (2, 0)
  HFLabs Центр управления согласиями (ЦУС) - 2 (2, 0)
  Другие 17

  Datareon Platform - 65 (65, 0)
  Юниверс Платформа для управления данными - 8 (2, 6)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 6 (6, 0)
  Naumen Enterprise Search - 3 (3, 0)
  Ростелеком Платформа управления данными - 2 (0, 2)
  Другие 7

  Datareon Platform - 53 (53, 0)
  Юниверс Платформа для управления данными - 11 (1, 10)
  Ростелеком Платформа управления данными - 3 (0, 3)
  ADS - Arenadata Streaming - 3 (3, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 2 (2, 0)
  Другие 5

  Datareon Platform - 12 (12, 0)
  Юниверс Платформа для управления данными - 5 (1, 4)
  ADS - Arenadata Streaming - 3 (3, 0)
  Ateuco: TooLSiD Интеллектуальная система хранения - 3 (3, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 3 (3, 0)
  Другие 7