>>ИМХО, оптимальный вариант - гибрид: пару крутых и быстрых ядер для непараллелящихся
>>задач + несколько десятков легковесных.
>
>Cell что-то типа того и есть, 1 крутое ядро и кучка потупее
>- числокрушилки с локальной памятью. Проблема такого дизайна? Для general purpose
>выполнения программ сосет. Ну и програмить неоднородную конструкцию - достаточно тяжело.
>Плюсы - на кучке SPE если распереться, можно выжать весьма и
>весьма много чего. Итого? Забавная но нишевая штука. Вопрос, как расширить такую архитектуру? Даже при правильном программировании натыкаешься на стену латентности данных. Cell, в принципе, решает ее, отбрасывая скрытый параллелизм и предлагая программисту трехуровневую схему доступности данных. Такое решение неплохо работает для десятка ядер. Но сколькими уровнями должен будет в будущем манипулировать программист для того, чтобы разбить задачу на 1000 ядер?
У Тилеры же латентность сведена к нулю максимально простыми средствами. Что-то мне подсказывает, что мы с вами еще услышим о ней в самом ближайшем будущем... См. http://arstechnica.com/hardware/news/2007/08/MIT-startup-rai...