Компания Oracle анонсировала (http://www.oracle.com/us/corporate/press/512001) новую платформу для организации хранения больших объемов данных - Oracle Big Data Appliance (http://www.oracle.com/bigdata), позволяющую организовать надежное хранение и анализ петабайтов данных. Решение позволяет обеспечить горизонтальную масштабируемость (при необходимости увеличения хранилища в кластер добавляются новые узлы), высокую надежность хранения (данные дублируются на нескольких узлах) и отсутствие единой точки отказа (в синхронном состоянии поддерживаются несколько узлов репликации).
Платформа функционирует на базе Oracle Linux и построена на базе следующих открытых компонентов:- Для организации распределенного отказоустойчивого хранилища задействована платформа Apache Hadoop, базирующаяся на парадигме map/reduce;
- Для управления данными поверх кластера Hadoop запускается БД Oracle NoSQL Database (http://www.oracle.com/us/corporate/features/feature-oracle-n.......
URL: http://www.oracle.com/us/corporate/press/512001
Новость: http://www.opennet.me/opennews/art.shtml?num=31955
Эх, эта мода на NoSQL...
Да уж, причем называют этим термином всё подряд. Принципиально отличные друг от друга системы. =)
>Эх, эта мода на NoSQL...И это пройдет. (с)
> ...запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB...египетская сила...
R работает не c Hadoop, а с базой Oracle.
NoSQL DB тоже работает параллельно с Hadoop
Вообще похоже опенсорс по направлению NoSQL все корпорации "сделал" под чистую.
Их уже вовсю используют в огромных проектав, а оракл только проснулся.
Это вы проснулись :)
Berkeley DB - очень старый движок.
Офигеть. Дайте две.Вообще-то, для обработки большого массива экспериментальных данных реляционность и даром не нужно. Так что SQL -- лесом. Более того и сам SQL слишком тяжеловесен, так что лесом аж 2 раза.
Вот если бы можно было совместить семантику векторизации данных встроенную в сам язык (ну, как в R, например) с гибкой+долгоживущей индексацией (hash,B-tree,R-tree ...) и ACID-ностью, то цены б такому движку не было.
К сожалению (я сужу только по сообщению, сам я его в руках не держал), в данном проекте всё было б хорошо, но вот гибкая индексация провисает. BDB слишком примитивный движок, чтоб встроить в него R-index. Т.е. там как минимум должна быть индексация по двум и более ключам одновременно.
BerkeleyDB поддерживает несколько индексов на таблицу. В терминологии BerkeleyDB дополнительный индекс называется secondary database. Таблица в терминологии BerkeleyDB называется primary database. Чтобы BerkeleyDB сам обновлял дополнительный индекс при обновлении таблицы, при создании дополнительного индекса надо указать функцию экстракции ключа (key extractor) для дополнительного индекса. Таблица может иметь один тип организации (в терминологии BerkeleyDB - метод доступа), например RECNO, а дополнительный индекс может иметь другой тип организации, например, BTREE.