URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 42106
[ Назад ]

Исходное сообщение
"OpenNews: Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"

Отправлено opennews , 01-Июн-08 07:55 
Исследователи из Антверпенского университета (Бельгия) создали (http://www.dvhardware.net/article27538.html) суперкомпьютер на базе четырех видеокарт NVIDIA GeForce 9800 GX2 (в сумме 8 GPU), по производительности равный кластеру из 300 ПК с Intel Core 2 Duo 2.4GHz.

Проект используется в лаборатории, занимающеяся расчетами связанными с томографией (http://ru.wikipedia.org/wiki/%D0%A2%D0%B... в частности разработкой
алгоритмов восстановления внутренней структуры объекта по проекционным данным. На классическом ПК на тестовые расчеты было затрачено несколько недель, в то время как кластер на базе 8 GPU произвел все необходимые вычисления за несколько часов.

URL: http://tech.slashdot.org/article.pl?sid=08/05/31/1633214&fro...
Новость: http://www.opennet.me/opennews/art.shtml?num=16228


Содержание

Сообщения в этом обсуждении
"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Michael , 01-Июн-08 07:55 
Это у интела FPU такое дерьмо или как?

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Юзер , 01-Июн-08 11:25 
А вы, таки не знали :-) ?
И никакие SSE4 уже давно не помогут.

Думаю, что GPU nVidia (а затем и др производителей) эволюционируют в MPU (media processor unit) - навороченный аналог DSP. Будут CPU и MPU. Первый всё может сам, но плохо считает, а второй отлично считает, но ничего сам не может. MPU, скорее всего, будет выделять свои ресурсы задачам для обработки видео, криптографии и звука. Возможно, что и для физики.

Это, конечно, моё личное мнение :-)


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено FSA , 01-Июн-08 13:56 
Просто графические чипы затачиваются под определённые виды расчётов. В данном случае это даёт огромный открыв от классических процессоров.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 02-Июн-08 17:35 
>  Это у интела FPU такое дерьмо или как?

Скорее, это GPU такие крутые ... в определенных видах рассчетов.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Alrond , 01-Июн-08 09:20 
нвидии уже пора выходить на процессорный рынок, вот интел то "возрадуется"

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено User , 01-Июн-08 11:11 
nVidia Tegra

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 09:30 
у intel fpu по производительности примерно такой же как и у amd (если читать TFA то там есть сравнение с amdшным кластером). а на gpu считать можно только если не нужен double precision и ieee 754.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Роман , 01-Июн-08 09:45 
Там еще можно винду заменить - еще быстрее выйдет, имхо! :)

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 14:15 
Вряд ли, сравнивал кодирование под fedora 8 x64  и под Win XP x64 SP2
(использовались ОС со всеми заплатками на тот момент, правда в винде еще
каспер работал), использовал lame и xvid/x264 (компилил gcc, intel c - на обоих платформах)
с mencoder. Под виндой процесс кодирования в среднем заканчивался на ~5-17 сек
быстрее, что, как я полагаю, находиться в пределах погрешности. Так что, по моим
замерам преимуществ у обоих  ОС друг перед другом нет - примерно одинаковые.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Logo , 01-Июн-08 15:34 
>"...на ~5-17 сек..."

А в процентах?
Приоритет процесса кодировщика под федорой был по умолчанию?


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 19:02 
Я специально вопрос полировки не затрагивал (приоритет...), чтобы уравнять шансы.
Запуск происходил на "коробочных" настройках.
Ведь и в винде можно было бы поднять приоритет - но это все филосовские темы которые
мало имеют общего с реалиями. Обычный юзер не будет себя заморачивать полировкой,
а в большинстве своем даже и не представляет что это такое и с чем это едят.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено вжюх , 01-Июн-08 19:12 
У винды с коробочными настройками активное окно получает +2 к базовому приоритету.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено alexxy , 01-Июн-08 20:52 
Нет такой архитектуры x64 это все бредни мелкософта и санкоф =)
Есть либо x86_64 что тоже не совсем верно более правильно ia32_64 то бишь это 64 бита амд и интелы типа коре2
либо ia64 что есть Itanium
Ну нет никаких архитектур x64 =)

ЗЫ а по теме: вычисления на GPU очень специализированы и требуют специальным образо написанный код. Да GPU быстрее чем обычный PC архитектуры типа ia32 или ia32_64 но GPU процессор векторный и специализированный. Он быстр тока в single-precision. при попытке считать на нем double все будет очень и очень медленно. Производительность упадет тогда где то на 1-2 порядка.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 22:48 
а ни кто и не говорил что x64 это архитектура.
Но дабы не вносить путаницу в стан читающих,
я указал конкретные редакции ОС.
А Windows XP Professional x86_64 и fedora ia32_64...
(в вашем написании) таких редакций не существует.
Так что Ваш коммент не по существу.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 10:15 
По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах. Значит один gpu чуть ли ни быстрее сотни нормальных ядер! Конечно, может быть у кластера узкое место - каналы передачи, но при чём тут вообще процессоры тогда.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено 3pleX , 01-Июн-08 10:50 
А что вы хотите - узкоспециализированный процессор _всегда_ будет быстрее универсального. Чудес тут не бывает. Та же самая ситуация - с криптоускорителями.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 11:06 
>По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах.
>Значит один gpu чуть ли ни быстрее сотни нормальных ядер!

На некоторых задачах таки быстрее. Потому что один gpu содержит внутри себя 128 ядер, вот и получается, что 1024 ядра быстрее 600.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Читатель , 01-Июн-08 10:50 
Например то что GPU имеют более высокую разрядность. Мне известны курсовые и дипломные работы по обсчету большых объемов данных сделаных на базе графических карт. И кстати взгляните на Tesla от NVidia довольно интересная вещь.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 12:41 
что, неужели шустрее чем Cell получается?

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 12:43 
Во-первых, вычисления специфичны - явно 3D, чего тут удивляться.
а Во-вторых, intel выходит наоборот - на рынок этого самого 3D - Larabee, слыхали? так что счет сравняется :)

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Новичок , 01-Июн-08 13:21 
Народ! А как я могу это использовать в трудовай жизни!
Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav + postfix + spamassasin + mysql + sams + lighttpd.



"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 01-Июн-08 14:00 
Производительность высока лишь на параллельных вычислениях.
Пишите себе кодеки на CUDA и возрадуетесь (однако, заюзаете вы в нем хоть один условный переход и скорость упадет стократно). Параллелизм, такой параллелизм..

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 14:01 
Никак! Да и вообще использование GPU в обычной жизни
весьма спорное: ну может видео/mp3 пожать, архиватор прикрутить -
больше пока перспектив не вижу. Я вот bzip2 (win32/x64) портировал
на CUDA 1.1 - толку мало (ну стал он жать 600Мб tar не за 43 секунды,
а за 36, и что? ). Все зависит от прикладного ПО/алгоритмов ну и
самое главное - рук.

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Кубик , 01-Июн-08 14:22 
Интересно! А как ты думаешь если воткнуть 4 мощных карты, можно жать например за 10 сек ?

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено const , 01-Июн-08 15:38 
> если воткнуть 4 мощных карты, можно жать например за 10 сек ?

Порвать файл на четыре и жать отдельно. Но тогда четырёхъядерный CPU будет жать, скажем, 11 секунд и опять разницу не разглядишь. ;)


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено pavlinux , 01-Июн-08 20:39 
У Вас случаем не Nvidia Tesla ?

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 22:56 
2 штуки Tesla C870 и 2 Quadro FX 4700 X2
Все стоит на nForce 790i Ultra SLI

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 23:05 
Кстати комментом выше автор alexxy упомянул
про single-precision  и он абсолютно прав.
По крайней мере в моей конфигурации.
Не факт, что у ATI дела обстоят так же
(с их аналогами не знаком).

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено pavlinux , 01-Июн-08 23:17 
>2 штуки Tesla C870 и 2 Quadro FX 4700 X2
>Все стоит на nForce 790i Ultra SLI

Во сколько Tesla обшлась?


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 01-Июн-08 23:25 
Рабочая станция обошлась в 16000 евро

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено pavlinux , 01-Июн-08 23:32 
>Рабочая станция обошлась в 16000 евро

2 Квадры и две Теслы?


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 02-Июн-08 07:25 
Да, именно так. Но я правда не сказал,
что корпус и периферия в промышленном
исполнении, класс защиты ip67

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено pavlinux , 02-Июн-08 03:51 
Видел?! -> http://cuda.ixbt.com/konkurs.shtml
Зашли им bzip2, может приз какой-нить выиграешь!


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено dRiZd , 02-Июн-08 07:31 
К сожалению вряд-ли, см. раздел "судейство" .
Сходу не пройду по пунктам "оригинальность" и "полезность"
Тем более, что не я автор bzip2

"трудовой, говорите? :)"
Отправлено Michael Shigorin , 01-Июн-08 17:44 
>Народ! А как я могу это использовать в трудовай жизни!
>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>+ postfix + spamassasin + mysql + sams + lighttpd.

Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными задачами (имея в резюме в т.ч. именно линуксовый экспириенс).  Тогда в трудовой, получается.

А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2, но пригодится разве что для убивства времени...


"трудовой, говорите? :)"
Отправлено pavlinux , 01-Июн-08 20:34 
> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2

PCI Express 2.0 нету для PIII чипсетов.


"трудовой, говорите? :)"
Отправлено Michael Shigorin , 01-Июн-08 22:27 
>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>PCI Express 2.0 нету для PIII чипсетов.

Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun": поставил коробку с NT на коробку с железкой.  Физически. :)

Поэтому "на" и "внутрь".


"трудовой, говорите? :)"
Отправлено pavlinux , 01-Июн-08 23:10 
>>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>>PCI Express 2.0 нету для PIII чипсетов.
>
>Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun":
>поставил коробку с NT на коробку с железкой.  Физически. :)
>
>
>Поэтому "на" и "внутрь".

Ну если это ускорит фильтрацию спама, рубилку вирусов, и squid - то флаг в руки.
Может как раз, этих 500 грамм и не хватает для большей  производительности...



"трудовой, говорите? :)"
Отправлено Phenom , 02-Июн-08 12:33 
Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16 000 Евро?

"трудовой, говорите? :)"
Отправлено pavlinux , 02-Июн-08 14:38 
>Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16
>000 Евро?

kernel glibc gcc и CUDA, ну хрень вская для моделирования и расчётов - бумажка и карандаш. :)


"трудовой, говорите? :)"
Отправлено Аноним , 02-Июн-08 10:49 
>[оверквотинг удален]
>>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>>+ postfix + spamassasin + mysql + sams + lighttpd.
>
>Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и
>неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными
>задачами (имея в резюме в т.ч. именно линуксовый экспириенс).  Тогда
>в трудовой, получается.
>
>А так -- можете поставить коробку с 9800 на коробку с PIII,
>внутрь GF2, но пригодится разве что для убивства времени...

Я не понял, причем тут ФриБСД к GPU?
И чем Фря хуже Линукса? Я раньше работал с ФриБСД, сейчас с Линуксом и лично на мой взгляд в большинстве случаев ФриБСД отлично подходит на роль роутера. Один из жирнейших плюсов - простота обновления (и возможность удалённого) и больший контроль над установленными приложениями с меньшими усилиями. Линукс, конечно, тоже неплох.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено crick , 02-Июн-08 12:09 
>Народ! А как я могу это использовать в трудовай жизни!
>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>+ postfix + spamassasin + mysql + sams + lighttpd.

А зачем? Разве Пень3 не справляется с таким объемом? Лично я делаю так. В нашей конторе периодически происходит обновление парка компьютерной техники. У меня в кабинете валяется куча стареньких, но рабочих пеньков (причем первых, а не третьих). Я просто разношу все в пространстве. Т.е. mysql на одной машине, squid на другой, postfix с обвесом (clamav, spamassasin и т.п.) на третьей и т.д. Если контора большая и жадная, то такой подход работает без проблем. А если контора маленькая, то непонятно почему Пень3 не справляется. Может на нем еще и Xorg крутится?


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено anonymous , 02-Июн-08 14:13 
непонятно почему эта техника не на балансе и все такое...

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено igorsia , 14-Окт-10 09:35 
> Народ! А как я могу это использовать в трудовай жизни!
> Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
> + postfix + spamassasin + mysql + sams + lighttpd.

если у тебя свой сайт или VPN с шифрованием можно возложить на GPU задачу сжатия и (или) шифрования данных.


"Ну, за массовый параллелизм!"
Отправлено Andrey Mitrofanov , 02-Июн-08 13:08 
>Исследователи из Антверпенского университета (Бельгия) создали

Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17

На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000 евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому купленный за 3.5 млн. евро...

---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"


"Ну, за массовый параллелизм!"
Отправлено pavlinux , 02-Июн-08 14:26 
>>Исследователи из Антверпенского университета (Бельгия) создали
>
>Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17
>
>На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000
>евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому
>купленный за 3.5 млн. евро...
>
>---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"
>

Разницу, 3500000-4000 конечно выплатили программистам в качестве премии.... :)


"Кстати!..."
Отправлено Andrey Mitrofanov , 04-Июн-08 14:14 
Знаете ли вы, что Столман не любит ATi, а Дональд Кнут -- НВидию? %-))
http://www.opennet.me/opennews/art.shtml?num=15763
http://www.opennet.me/opennews/art.shtml?num=15568

>---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"

...Каждому покупателю Quadro -- собственнический видео-драйвер, томограф(*) и свинцовый кастюм БЕСПЛАТНО(**)!

(*)предложениеограниченоантверпеном(тм)
(**)*ме-е-елким-мелким шрифтом внизу-сбоку неконтрастным цветом* Свинец может быть опасен для, молоко за вредность в [бесплатный] комплект собственнических видео-драйверов не входит.


"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено бедолага , 02-Июн-08 14:23 
Главное отличие Интеловского проча от НВидевкого то, что первый унифицированный процессор а второй векторный. То есть ни для кого не секрет, особенно для тех кто работает в области научного инженеринга что основная проблема там работа с матрицами, на интеловскоп процессоре возможно только линейные операции, то есть туже матрицу нужно преобразовать в линейный вид) для матриц размером меньше 5 большой проблемы нет а вот для больших требуется значительные усилия, в своё время графический процессор буть он Нвидиа или АТИ является векторным прочессором , что позволяет оперировать уже не линейным видом матрицы а а самой матрицой))) . Сам использовал данный метод для оптимизации расчетного модумя, но говорть о сравнениие тут неумесно)) .  Так как это имхо разные вещи !

"Суперкомьютер из 8 GPU заменил кластер из трехсот ПК"
Отправлено Аноним , 02-Июн-08 17:14 
Эх, вот если бы прикрутили что-то подобное к xine/mplayer и etc для декодирования НД-контента...

"OpenNews: Суперкомьютер из 8 GPU заменил кластер из трехсот ..."
Отправлено toivo , 03-Июн-08 13:57 
Ну, прям, дети....

Специализированные ускорители применялись достаточно давно. И на ПЦ и на МАКе.
К несчастью мы идем путем тяжелого наследия архитектуры 8080, а не путем кульного PDP-11/VAX.

Работа на рынок потребления развращает разработчиков -- можно отложить самоочевидную вещь на потом и _продать_ ее, как мегафичу. Что и наблюдаем -- 3Д ускоритель появились лет 15 назад, а то что это быстрый спецпроцессор дошло только сейчас.

Удачи.


"OpenNews: Суперкомьютер из 8 GPU заменил кластер из трехсот ..."
Отправлено dRiZd , 04-Июн-08 13:57 
Про доп. ресурсы народ уже давно думал, тока не было спецификаций и прикладного ПО.
Все же закрыто.
Я до этого допер когда у меня появился первый 3Dfx Voodoo.