Представлен релиз проекта Apache Hive 0.6.0, в рамках которого разработана система для создания хранилищ, оптимизированных для выполнения аналитических запросов над большими массивами данных (Data Warehouse). В качестве основы Apache Hive использует платформу Apache Hadoop, предназначенную для организации распределенной обработки больших объемов данных (петабайты) с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера.
Кроме традиционной схемы формирования запросов в стиле map/reduce, Apache Hive предоставляет упрощенный механизм обработки данных через SQL-подобный язык запросов HiveQL. Инструкцию по быстрому развертыванию хранилища на базе Apache Hive можно прочитать здесь.
|