SAS In-Memory Statistics for Hadoop. SAS выпустила средство аналитики in-memory для Hadoop
 

SAS In-Memory Statistics for Hadoop

Продукт
Разработчики: SAS Institute Inc. (САС Институт)
Дата премьеры системы: 2014/04/24
Технологии: BI

SAS In-Memory Statistics for Hadoop - система для анализа "больших данных" с помощью технологии in-memory, имеющая широкий спектр аналитических алгоритмов для исследования и моделирования в распределенной среде Hadoop.

17 сентября 2014 года стало известно о выпуске компанией SAS нового продукта для анализ больших данных с помощью технологии in-memory - SAS In-Memory Statistics for Hadoop.

Решение работает по принципу интерактивного программирования и позволяет сразу нескольким пользователям совместно изучать и анализировать данные, создавать и сравнивать модели, оперативно работать с большими объемами информации на основе технологии Hadoop.

Для компаний ищущих варианты использования Hadoop важно иметь возможность использования самых разных методов анализа, включая углубленную аналитику, на огромных объемах данных, для которых потенциально предполагается использовать Hadoop. Новый продукт подходит для решения таких задач.

Пользователь SAS In-Memory Statistics for Hadoop получит доступ ко всем основным методам статистического анализа и машинного обучения в режиме интерактивного программирования. Среди них:

  • линейная и логистическая регрессии,
  • обобщенные линейные модели,
  • деревья решений и случайный лес,
  • прогнозирование временных рядов,
  • анализ текстовых данных,
  • кластеризация и др.

Существует возможность исполнения вспомогательных и основных задач:

  • готовить данные к анализу,
  • выделять значимые предикторы,
  • сравнивать модели,
  • формировать код применения моделей.

Продукт даёт возможность создания рекомендательных систем с использованием большого набора методов их разработки. Такие системы востребованы для решения широкого класса бизнес-задач, в том числе целевого маркетинга.

Технология Hadoop повышает надежность системы за счет использования кластера серверов, что обеспечивает сохранность данных при одновременном снижении стоимости аппаратного обеспечения, высокой степени масштабируемости, отсутствии жестких требований к формату данных и их предварительной обработки.