Французский интегратор Talend, разработавший такие открытые продукты, как Open Studio и Open Profiler, объявил об открытии исходных текстов ПО Talend Data Quality, предназначенного для чистки избыточной информации в базах данных.
Программа построена на базе инфраструктуры Eclipse и позволяет в наглядном режиме избавить базу, от неявно дублирующих друг друга записей (например, различные написания одних и тех же имен), развернуть сокращенные названия улиц, проверить валидность данных на основе внешнего справочника (например проверить email или почтовые адреса). Поставляемый SDK комплект позволяет разработчикам легко адаптировать продукт для задач своего предприятия.
На основании заданного в GUI интерфейсе метода нормализации, Talend Data Quality может генерировать Java или Perl скрипт для интеграции в инфраструктуру управления данными.
Публично исходные тексты продукта будут доступны в сентябре. Программу можно будет использовать как отдельное приложение, так и в составе ПО Talend Data Integration suite.
|