Компания Google официально делегировала развиваемым под эгидой Apache свободным проектам право по использованию технологий, фигурирующих в патенте 7650331 ("Системы и методы эффективной высокомасштабируемой обработки данных"). В патенте изложены принципы реализации метода MapReduce, который активно используется в таких проектах, как Apache Hadoop и Apache MapReduce.
По словам Ларри Росена (Larry Rosen), юридического консультанта организации Apache Software Foundation, "очень приятно успокоить сообщество Apache объявив о великодушном поступке Google, на деле демонстрирующем расположенность компании к Apache Software Foundation и другим открытым проектам."
Apache Hadoop является свободной платформой для организации распределенных вычислений с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. В состав Hadoop входит также реализация распределенной файловой системы Hadoop Distributed Filesystem (HDFS), автоматически обеспечивающей резервирование данных и оптимизированной для работы MapReduce-приложений. Для упрощения доступа к данным в Hadoop хранилище разработана БД HBase и SQL-подобный язык Pig, который является своего рода SQL для MapReduce, запросы которого могут быть распараллелены и обработаны несколькими Hadoop-платформами.
|