Франкфуртский университет имени Гёте представил (http://code.compeng.uni-frankfurt.de/news/6) релиз HPL-GPU 1.0 (http://code.compeng.uni-frankfurt.de/projects/hpl/wiki/Wiki), варианта библиотеки функций для решения линейных уравнений Linpack (http://www.netlib.org/linpack/), переписанного с целью задействования GPU видеокарт AMD для оптимизации вычислений внутри вычислительного кластера.
HPL-GPU и выступающая в качестве основы библиотека матричных преобразований CALDGEMM (http://code.compeng.uni-frankfurt.de/projects/caldgemm) (реализация DGEMM для AMD Cypress GPU) используется на 832-узловом университетском кластере LOEWE-CSC (http://www.top500.org/system/details/10591), который смог достигнуть производительности 285 Тфлопс и подняться на 22 место рейтинга 500 самых мощных суперкомпьютеров планеты. Интересно, что на карте ATI Radeon HD5870 удалось обеспечить 497 GFLOPS при умножении матриц с двойной точностью (DGEMM), в то время как более дорогие системы NVIDIA Tesla дотягивают только до 300 GFLOPS.URL: http://www.phoronix.com/scan.php?page=news_item&px=ODg5OA
Новость: http://www.opennet.me/opennews/art.shtml?num=28983
> Интересно, что на карте ATI Radeon HD5870 удалось обеспечить 497 GFLOPS при умножении матриц с двойной точностью (DGEMM), в то время как более дорогие системы NVIDIA Tesla дотягивают только до 300 GFLOPS.Вполне возможно, что сказалось наличие более детальной документации и, как следствие, лучших оптимизаций.
Здесь сказалась внутренняя архитектура.
А что, линуксовый каталист уже предоставляет OpenCL?
AMD Stream SDK предоставляет
А гыде? Нету библиотеки. У nVidia есть. У fglrx нет.
Нашёл. /usr/local/lib/libOpenCl.so
OpenCl давно уже
Не удивительно, уже не первый раз ATI обходит NVIDIA по производительности.
Все тут бросились хвалить АМД, но это всё фигня. Может я чего-то не замечаю, но там нет названия модели конкретно использованных плат нВидии!? Может они использовали позапрошлое поколение, и в чём тогда смысл сравнения? Давай-те сравним старый паровоз и новый скоростной электровоз и начнём открыто хвалить второй за техническое превосходство и несравнимое удобство эксплуатации по сравнению с первым...
Я к тому, что умные люди не начнут строить заключительные выводы имея "на руках" лишь очень поверхностную, неполную, информацию.
>Все тут бросились хвалить АМД, но это всё фигня.теперь резко вспоминаем про бревно
This is the code version that reached 285 Gflops!!!! on LOEWE-CSC, pushing the system to position 22 in this falls Top500 list.на офсайте хвастаются