Разработчики: | Meta Platforms |
Дата премьеры системы: | 2013/01/15 |
Дата последнего релиза: | 2015/12/12 |
Технологии: | СУБД |
Presto - распределенная СУБД. Реализована на Java.
Система поддерживает стандартный язык запросов SQL и допускает создание кластеров из сотен узлов, обрабатывая на них петабайты данных.
Архитектура Presto словами одного из разработчиков[1]:
«Клиент отправляет SQL координатору Presto. Координатор разбирает запрос, анализирует его, а затем планирует исполнение запроса. Диспетчер соединяет конвейер исполнения, даёт поручения узлам, которые расположены ближе всего к данным, и следит за продвижением обработки. Клиент извлекает данные из внешней ступени, которая, в свою очередь, заимствует их с ещё более низких уровней».
Архитектура Presto, 2014
Система способна компилировать в байт-код Java запросы SQL и делает это так, чтобы избежать проблем с выделением памяти и сборкой мусора. На этом превращения запроса на заканчиваются: виртуальная машина, исполняющая байт-код, «на лету» компилирует его в машинный код. В результате он выполняется ещё быстрее.
В начале 2013 года первые версии системы внедрили в Facebook. Весной 2013 года соцсеть начала полномасштабный переход на Presto. На 7 июля 2015 года система работает на нескольких гигантских кластерах (количество узлов в одном из них может достигать тысячи), ежедневно исполняя более 30 тысяч запросов к петабайту информации.
Исходные коды Presto опубликованы на сервисе Github - репозиторий.
Система доступна по лицензии Apache.
2016: Teradata активно поддержала проект Presto
30 июня 2016 года корпорация Teradata сообщила о сертификации нескольких решений для бизнес-аналитики и визуализации данных в распределенной СУБД Presto.
К этим решениям относятся Information Builders, Looker Data Platform, платформа визуальной аналитики Qlik, набор аналитических инструментов Tableau и ZoomData. Компания MicroStrategy обязалась выполнить сертификацию и завершает тестирование приложения Microsoft Power BI.
Несколько сертификаций предоставляют заказчикам большие возможности выбора и способствуют эффективному использованию профессиональных навыков и инвестиций в инструменты бизнес-аналитики, чтобы анализировать данные в Hadoop.
Сертификация приложений бизнес-аналитики и аналитических приложений для использования с распределенной СУБД Presto, поддерживаемой Teradata, является важным начинанием в отрасли. Это весьма своевременный шаг, учитывая многие проблемы, с которыми в настоящее время сталкиваются компании при развертывании и использовании платформы Hadoop. В то время, когда технология Presto, благодаря корпорации Teradata, стала решением по выполнению SQL-запросов на Hadoop в корпоративном секторе, интеграция с инструментами бизнес-аналитики добавит необходимые функциональные возможности для эффективного использования в рамках организации. Независимо от предпочитаемого компанией поставщика приложений бизнес-аналитики и аналитических приложений, положительный результат заключается в появлении эффективного механизма выполнения аналитических запросов, который открывает новую яркую страницу в области визуальной аналитики для всех пользователей Hadoop. Клаудиа Имхофф (Claudia Imhoff), ведущий консультант по бизнес-аналитике и хранилищам данных, основатель фонда Boulder BI Brain Trust |
На июнь 2016 года Presto позволяет отправлять запросы в разные файловые системы, поддерживаемые платформой Hadoop, включая HDFS, Amazon S3, Cassandra, реляционные базы данных и даже корпоративные хранилища данных – и подходит для аналитиков данных, запросы которых требуют отклика в пределах секунд или минуты.
Объединение распределенной СУБД Presto, поддерживаемой Teradata, с несколькими инструментами бизнес-аналитики означает, что компании могут разрабатывать приложения и отчеты бизнес-аналитики на платформах, используя распределенную СУБД Presto, драйверы ODBC и JDBC для Presto от Teradata. Такая интеграция помогает обеспечить быструю разработку приложений и важнейшие данные по результатам анализа клиентом интенсивности событий, анализа оттока клиентов, анализа информации от датчиков для визуализации Интернета вещей и многое другое. В результате, компании могут быстрее создавать для себя новые возможности, эффективно используя имеющиеся инвестиционные ресурсы в основанные на SQL приложения для бизнес-аналитики и Hadoop.
Примечания
Подрядчики-лидеры по количеству проектов
SAP CIS (САП СНГ) (38)
Softline (Софтлайн) (35)
РДТЕХ (33)
BeringPro (БерингПойнт) ранее BearingPoint Russia (28)
ФОРС - Центр разработки (25)
Другие (746)
Сапиенс солюшнс (Sapiens solutions) (7)
Navicon (Навикон) (3)
BeringPro (БерингПойнт) ранее BearingPoint Russia (3)
IFellow (АйФэлл) (2)
Инфосистемы Джет (2)
Другие (35)
Синимекс (Cinimex) (1)
Nexign (Нэксайн) ранее Петер-Сервис (1)
Форсайт (1)
R-Style Softlab (Эр-Стайл Софтлаб) (1)
Эркер (1)
Другие (20)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Oracle (44, 179)
SAP SE (6, 178)
Microsoft (23, 142)
PostgreSQL Global Development Group (14, 130)
Постгрес профессиональный (ППГ, Postgres Professional) (6, 41)
Другие (266, 260)
Microsoft (3, 11)
SAP SE (3, 11)
PostgreSQL Global Development Group (3, 10)
Oracle (2, 4)
Постгрес профессиональный (ППГ, Postgres Professional) (2, 3)
Другие (10, 13)
PostgreSQL Global Development Group (4, 9)
Постгрес профессиональный (ППГ, Postgres Professional) (2, 6)
VK Tech (ранее VK Цифровые технологии, ВК Цифровые технологии и Mail.ru Цифровые технологии) (2, 3)
Arenadata (Аренадата Софтвер) (3, 2)
Oracle (2, 2)
Другие (9, 9)
PostgreSQL Global Development Group (3, 13)
Постгрес профессиональный (ППГ, Postgres Professional) (1, 6)
Arenadata (Аренадата Софтвер) (3, 5)
Apache Software Foundation (ASF) (3, 4)
Тантор Лабс (Tantor Labs) (2, 3)
Другие (8, 10)
PostgreSQL Global Development Group (4, 12)
Arenadata (Аренадата Софтвер) (3, 7)
VMware (2, 7)
Постгрес профессиональный (ППГ, Postgres Professional) (2, 6)
TData (ТДата) (2, 4)
Другие (7, 12)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
Oracle Database - 143 (106, 37)
Microsoft SQL Server - 135 (104, 31)
PostgreSQL СУБД - 130 (81, 49)
SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 103 (103, 0)
SAP HANA (High Performance Analytic Appliance) - 76 (72, 4)
Другие 79
Microsoft SQL Server - 10 (9, 1)
PostgreSQL СУБД - 10 (7, 3)
SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8 (8, 0)
Oracle Database - 3 (3, 0)
SAP HANA (High Performance Analytic Appliance) - 3 (3, 0)
Другие 6
PostgreSQL СУБД - 9 (2, 7)
Tarantool Платформа in‑memory вычислений - 3 (2, 1)
Oracle Database - 3 (2, 1)
VMware Tanzu Greenplum - 2 (0, 2)
SAP HANA (High Performance Analytic Appliance) - 1 (1, 0)
Другие -5
PostgreSQL СУБД - 13 (4, 9)
VMware Tanzu Greenplum - 3 (0, 3)
Firebird (database server) - 2 (0, 2)
Apache Hadoop - 2 (1, 1)
ClickHouse - система управления базами данных (СУБД) - 2 (2, 0)
Другие -9
PostgreSQL СУБД - 12 (5, 7)
VMware Tanzu Greenplum - 6 (0, 6)
RT.WideStore - 3 (3, 0)
RT.Warehouse СУБД - 3 (3, 0)
Diasoft Digital Q.Database - 3 (3, 0)
Другие -9