На прошедшей в Лондоне церемонии награждения MediaGuardian Innovation Awards, премия "Новатор года", ежегодно присуждаемая наиболее инновационным продуктам и технологиям, была вручена проекту Apache Hadoop. При вручении премии Apache Hadoop был отождествлен со швейцарским армейским ножом 21 века и назван проектом, обладающим потенциалом, способным полностью изменить лицо медиа-технологий по всему миру. Среди финалистов, уступивших пальму первенства, отмечены проекты WikiLeaks и iPad.
Hadoop является свободной платформой для организации распределенной обработки больших объемов данных (петабайты) с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. В состав Hadoop входит также реализация распределенной файловой системы Hadoop Distributed Filesystem (HDFS), автоматически обеспечивающей резервирование данных и оптимизированной для работы MapReduce-приложений. Для упрощения доступа к данным в Hadoop хранилище разработана БД HBase и SQL-подобный язык Pig, который является своего рода SQL для MapReduce, запросы которого могут быть распараллелены и обработаны несколькими Hadoop-платформами.
|