Arenadata ADB-Spark Connector

Продукт
Разработчики: Arenadata (Аренадата Софтвер)
Дата премьеры системы: 2021/07/22
Технологии: СОА

2021: Выпуск ADB-Spark Connector

Компания Arenadata 22 июля 2021 года сообщила о выпуске инструмента для обмена данными между Arenadata DB (аналитической MPP-СУБД на базе Greenplum) и Apache Spark (фреймворком для распределенной обработки данных, входящим в экосистему Hadoop) — ADB-Spark Connector.

Коннектор построен с использованием Scala 2.11.x, 2.12.x, Twitter Finagle и ScalikeJDBC. В основе его работы — HTTP сервер, реализующий протокол gpfdist. Этот метод, по сравнению с другими существующими способами обмена с ADB, обеспечивает параллельную запись на сегменты Greenplum без участия Master, возможность гибкого партиционирования при чтении данных из Greenplum в Spark, отсутствие необходимости устанавливать утилиту gpfdist на каждой Spark-ноде и другие преимущества.

Для реализации протокола gpfdist взят фреймворк Finagle, показавший лучшую производительность при наличии множества одновременных сессий от сегментов ADB, — по сравнению с изначально выбранным Akka HTTP.

К основным функциям ADB-Spark Connector относятся:

  • чтение данных из Greenplum в Spark с поддержкой различных способов партиционирования;
  • запись данных из Spark в Greenplum с помощью нескольких режимов записи: Append, Overwrite, ErrorIfExists;
  • поддержка push-down операторов;
  • извлечение дополнительных метаданных из Greenplum, включая статистику и схемы распределения данных;
  • автоматическое формирование схем данных;
  • оптимизация выполнения агрегатной функции count.

«
Разработанное нами решение будет полезно для заказчиков, которые при построении своих корпоративных хранилищ комбинируют Arenadata Hadoop и Arenadata DB. ADB-Spark Connector обеспечивает быструю двунаправленную связь между ними, позволяя выполнять чтение и запись данных максимально эффективно,
сказал Дмитрий Плужников, директор департамента системной архитектуры Arenadata.
»

По сравнению с ближайшим аналогом на рынке — Spark-Greenplum коннектором от компании Pivotal — ADB-Spark Connector обеспечивает более гибкое партиционирование (5 способов вместо 2) и большее число типов данных (в том числе интервалы и массивы), а также предоставляет дополнительные функциональные возможности, включая поддержку Batch-режима в Spark, сбор статистики для построения планов запросов при помощи Catalyst и выполнение произвольных SQL-запросов через Master-ноду ADB.

На июль 2021 года ADB-Spark Connector поддерживает версии Spark 2.3.x и 2.4.x. В дальнейших планах по развитию продукта — добавление поддержки Spark 3.x и реализация функционала стриминга.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (234)
  Axelot (Акселот) (137)
  Неофлекс (Neoflex) (41)
  Диасофт (Diasoft) (39)
  IFS Russia & CIS (ИФС Регион РУ) (21)
  Другие (245)

  Datareon (Датареон) (32)
  Axelot (Акселот) (24)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Cloud.ru (Облачные технологии) ранее SberCloud (1)
  Cognitive Pilot (Когнитив Роботикс) (1)
  Другие (13)

  Datareon (Датареон) (37)
  Axelot (Акселот) (32)
  EKassir (Екассир - Банковские Системы) (2)
  Ред Софт (Red Soft) (2)
  Софрос (Sofros) (2)
  Другие (2)

  Datareon (Датареон) (22)
  Axelot (Акселот) (15)
  Софрос (Sofros) (8)
  Первый Бит (2)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (2)
  Другие (3)

  Axelot (Акселот) (2)
  Datareon (Датареон) (1)
  EKassir (Екассир - Банковские Системы) (1)
  ИнфоТеКС (Infotecs) (1)
  СИГМА (Санкт-Петербург) (1)
  Другие (2)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (1, 366)
  IBM (5, 50)
  IFS (1, 46)
  Диасофт (Diasoft) (6, 38)
  Неофлекс (Neoflex) (3, 25)
  Другие (136, 163)

  Datareon (Датареон) (1, 54)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  EKassir (Екассир - Банковские Системы) (1, 2)
  Neti (Нэти) (1, 1)
  Вингс Солюшнс (Wings Solutions) (1, 1)
  Другие (7, 7)

  Datareon (Датареон) (1, 67)
  Ред Софт (Red Soft) (1, 2)
  EKassir (Екассир - Банковские Системы) (1, 2)
  RockITSoft, Рокитсофт (ранее Croc Code, Крок Регион) (1, 1)
  Инполюс (Inpolus) (1, 1)
  Другие (0, 0)

  Datareon (Датареон) (1, 42)
  Первый Бит (1, 2)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 2)
  Высокие цифровые технологии (ВЦТ) (1, 1)
  Другие (0, 0)

  Datareon (Датареон) (1, 4)
  СИГМА (Санкт-Петербург) (2, 1)
  EKassir (Екассир - Банковские Системы) (1, 1)
  Технологии Будущего (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon Platform - 366 (366, 0)
  IFS Applications - 46 (46, 0)
  Flextera - 31 (31, 0)
  IBM WebSphere - 26 (26, 0)
  Neoflex Adapters - 21 (21, 0)
  Другие 199

  Datareon Platform - 54 (54, 0)
  FIS Platform - 4 (4, 0)
  EKassir Адаптер для Системы быстрых платежей (СБП) - 2 (2, 0)
  ОТР.Опора - 1 (1, 0)
  Neti: Интеграционный модуль Microsoft Dynamics AX-1С - 1 (1, 0)
  Другие 6

  Datareon Platform - 67 (67, 0)
  Ред-Шлюз - 2 (2, 0)
  EKassir Адаптер для Системы быстрых платежей (СБП) - 2 (2, 0)
  Инполюс: Polus ESB - 1 (1, 0)
  Другие 0

  Datareon Platform - 42 (42, 0)
  FIS Platform - 2 (2, 0)
  БИТ.Адаптер - 2 (2, 0)
  Другие 0

  Datareon Platform - 4 (4, 0)
  Сигма.ИВК - 1 (1, 0)
  Сигма. СУП СПД Пионер - 1 (1, 0)
  EKassir Адаптер для Системы быстрых платежей (СБП) - 1 (1, 0)
  Другие 0