http://bkase.github.io/CUDA-grep/finalreport.html Представлен вариант утилиты Grep и связанной с ним реализации регулярных выражений, отличающихся задействованием CUDA для распараллеливания операций и их выноса на плечи GPU. В зависимости от особенностей обрабатываемых данных CUDA grep демонстрирует в 2-10 раз более высокую производительность по сравнению с обычным grep. По сравнению с движком регулярных выражений Perl ускорение достигает 68 раз. Код утилиты и библиотеки регулярных выражений распространяется (https://github.com/bkase/CUDA-grep) под лицензией MIT.
URL: Пhttps://news.ycombinator.com/item?id=5803943
Новость: http://www.opennet.me/opennews/art.shtml?num=37076
Ага еще бы CUDA была под лицензией MIT и поддерживалась разными вендорами без отчислений или разрешений.
Пардон, те кто выбирает MIT/BSD/Apache очень любят стелиться под тех кто выбирает EULA.
а вот те, кто бред подобный пишут почему-то не любят лечиться
Почему бред? Выбор пермиссив лицензии часто аргументируют прагматичностью и дружественностью бизнесу.
> Почему бред? Выбор пермиссив лицензии часто аргументируют прагматичностью и дружественностью бизнесу.Дружественность к бизнесу - недружественность к пользователям, и наоборот.
Интересы пользователей и бизнеса конфликтуют, и разработчик имеет полное право выбрать, кому кого он помогает озалупить.
> дружественностью бизнесу.Дружественность к блобмэйкеру означает что те кто в это вляпывался - залетают на вендорлок. Такой пермиссивный весь из себя...
Если автор выкатывает лицензию, которая позволяет использовать его результаты в закрытых продуктах - с чего тут возникает вендорлок?
> Если автор выкатывает лицензию, которая позволяет использовать его результаты в закрытых
> продуктах - с чего тут возникает вендорлок?С проприетарного вендора, вестимо.
> а вот те, кто бред подобный пишут почему-то не любят лечитьсяТем не менее, факты - штука упрямая.
Хотеть!!!
Я хочу видяху с акселлерацией перла. Наконец-то появилась причина покупки новой видеокарты!
Наконец то появится отмазка для покупки крутой видеокарты
> Наконец то появится отмазка для покупки крутой видеокартыА что, биткоины не катят?
Нафиг биткоины, хочу ГРЕП!!!!! И много-много перла
Перл там только для сравнения, и, кстати, ничего не сказано о том, какой именно скрипт выполнялся при замере производительности, включают ли полученные 0.8 секунды время на компиляцию скрипта. Как-то странно читать, что перл в 30 раз медленнее простого грепа.
Кстати, да, ожидаем малолетних аналитеков, предрекающих скорый "перлукапец".
> Как-то странно читать, что перл в 30 раз медленнее простого грепа.Не то слово. Простейший тест
$ time grep -c '"[0-9]\+"' some.csv
20952real 0m0.764s
user 0m0.759s
sys 0m0.006stime perl -ne '$i++ if /"[0-9]+"/;END {print "$i\n"}' some.csv
20952real 0m0.085s
user 0m0.079s
sys 0m0.006sТак что не в 30, а в 10 и не медленнее, а быстрее.
Измерять нужно на намного больших временах. И вывод нужно перенаправить в /dev/stdout для чистоты эксперимента.Попробуйте some.csv увеличить раз в 100 для начала.
>Измерять нужно на намного больших временах
>Попробуйте some.csv увеличить раз в 100 для начала.Это просто сделает преимущество в скорости запуска grep по сравнению с perl еще более ничтожным. Хотя оно и так небольшое 0.002 против 0.003 на моей машине.
Я просто взял первый попавшийся под руку большой файл. Хотите провести более детальное исследование - флаг вам в руки, а мне это не интересно, так как результат заранее известен и быстрее perl в 10 или в 9 раз мне не особо важно. Особенно с учетом того, что perl предоставляет намного более удобные регексы и большие возможности.
Также подскажу, что если вам хочется получить нужные вам результаты, то лучше экспериментировать не с размерами файла, а с самими регексами.
>И вывод нужно перенаправить в /dev/stdout для чистоты эксперимента.Во-первых, stdout это и есть стандартный вывод. Если не знаете значения умных слов, то не надо ими пользоваться.
Во-вторых, вы предлагаете вместо скорости регексов измерять скорость вывода perl/grep и скорость отображения строк в эмуляторе терминала. Вы дурак или прикидываетесь им?
файл new.csv 2.5мбtime grep -c '"[0-9]\+"' new.csv
0real 0m0.764s
user 0m0.752s
sys 0m0.000stime grep -Pc '"[0-9]\+"' new.csv
0real 0m0.096s
user 0m0.092s
sys 0m0.000s
не хочу тебя огорчать, но в твоём примере перл "быстрее", потому что some.csv закешировался в памяти после первого обращения к нему грепом
> не хочу тебя огорчать, но в твоём примере перл "быстрее", потому что
> some.csv закешировался в памяти после первого обращения к нему грепомМожно запустить в обратном порядке - перл все равно будет быстрее. Это такое опережающее кэширование, да?
вообще да, поторопился я, извиняюсьrain87@rain87-laptop:/tmp/csv$ time grep -c '"[0-9]\+"' cbp11co.txt
2151507real 0m7.095s
user 0m7.052s
sys 0m0.036s
rain87@rain87-laptop:/tmp/csv$ time perl -ne '$i++ if /"[0-9]+"/;END {print "$i\n"}' cbp11co.txt
2151507real 0m1.183s
user 0m1.152s
sys 0m0.032s
rain87@rain87-laptop:/tmp/csv$ ls -lh cbp11co.txt
-rw-r--r-- 1 rain87 rain87 173M марта 11 15:12 cbp11co.txtперл всегда быстрее, в каком порядке ни запускай + фс в памяти, так что никакое кеширование не влияет
> Я хочу видяху с акселлерацией перла.
а вижуал-васик поддерживает? o_O
Пока просто васик, но проект очень быстро развивается.
> Пока просто васик, но проект очень быстро развивается.А как насчет паскаля?
не, сначала Lisp, наработки уже есть
Чернила для пятого класса, глобус Украины и видеокарту с ускорением Перла.
даёшь видяху с аппаратным ускорением пэхопэ!
Как перепаять слот для процессора в pci-e?
это кувалдой нужно
> это кувалдой нужноДа ладно, у интеля есть Xeon Phi или как там его. Как вы и хотели - добавочный проц в PCI-E. Правда сдается мне что цена/производительность там явно не как у ширпотребного GPU...
от 1400 usd
Следующим на очереди будет хардварный греп?
> Следующим на очереди будет хардварный греп?Ну а что, запилят FPGA версию и потом ASIC :)
Слудующим этапом, это когда в свойствай процессора будет mmx,mmx4,grep =)
> Слудующим этапом, это когда в свойствай процессора будет mmx,mmx4,grep =)Только не grep, а pcre.
>> Слудующим этапом, это когда в свойствай процессора будет mmx,mmx4,grep =)
> Только не grep, а pcre.Представил:
$ grep pcre /proc/cpuinfo-- и круг замкнулся...:)
> Следующим на очереди будет хардварный греп?ну, межделмаш же делала хардварный акселератор для парзинга xml. так что уже не новаторство.
> ну, межделмаш же делала хардварный акселератор для парзинга xml. так что уже
> не новаторство.Ну да, сначала можно усложнить себе задачу, выбрав идиoтский формат, а потом пытаться изобрести бритву для своего кактуса.
Вон OSMщики например возлюбили бинарные форматы. Потому что 250Гбайт XML - это жосска. Это требует адово время на парсинг, жрет уйму места на винте и почему-то никак не редактируется ширпотребными редакторами :)
> Вон OSMщики например возлюбили бинарные форматы. Потому что 250Гбайт XML - это
> жосска. Это требует адово время на парсинг, жрет уйму места на
> винте и почему-то никак не редактируется ширпотребными редакторами :)В бинарном формате нет ничего плохого, если к нему имеется достаточное кол-во отлаженных инструментов. В конце-концов, банальный .txt файл тоже на определенном уровне абсолютно бинарен, просто для его чтения и редактирования есть тысячи программ.
А к systemd'шникам претензия одна - они формат сделают, а потом его изменят, наплевав на окружающих. И пойдете вы с бинарными логами Солнцем палимый прямо на ЙУХ.
Хардварный grep (с)cmp rax, rbx
> Следующим на очереди будет хардварный греп?Учёные В Гугле лет десять тому сделали _параллельный grep, который быстрее _кеша_ любого _современного_ процессора.
Мечтайте дальше!
> Код утилиты и библиотеки регулярных выражений распространяется под лицензией MIT.что за такая мода -- делать скрипты под свободной лцензией, но при этом которые требуют несвободные инструменты (в данном случае CUDA)
>> Код утилиты и библиотеки регулярных выражений распространяется под лицензией MIT.
> что за такая мода -- делать скрипты под свободной лцензией, но при
> этом которые требуют несвободные инструменты (в данном случае CUDA)Скрипты - это кухня для софта! (Я)
> Скрипты - это кухня для софта! (Я)В смысле, скрипты используются для сборки нормального ПО?
Это в смысле берешь
50 гр. ls
25 гр. cat
40 гр. grep
100 гр. sed
100 гр. awk
заправляешь printf, column, sort и uniq по вкусу.
для эстетов можно приготовить с dialog или screen
У нас таким свинок кормят.А для человеческой пищи как-то больше идут функции из libc.
> У нас таким свинок кормят.
> А для человеческой пищи как-то больше идут функции из libc.Гурманы, ёптя. Вы под каждый случай перепиcываете свой софт на glibc?
Если думать перед тем, как писать - такой проблемы не будет.
Или думать - это тоже гурманство?
Не ошибается только тот, кто ничего не делает. Человеку свойственно ошибаться, абсолютный вы наш...
> Если думать перед тем, как писать - такой проблемы не будет.
> Или думать - это тоже гурманство?Сколько у Вас уйдет время на приготовление, например перла и, хотя бы 1% того, что есть на CPAN?
>> У нас таким свинок кормят.
>> А для человеческой пищи как-то больше идут функции из libc.
> Гурманы, ёптя. Вы под каждый случай перепиcываете свой софт на glibc?нет, он вообще никакой софт не пишет. потому что вантуз черепа.
> Это в смысле берешь
> 50 гр. ls
> 25 гр. cat
> 40 гр. grep
> 100 гр. sed
> 100 гр. awk
> заправляешь printf, column, sort и uniq по вкусу.
> для эстетов можно приготовить с dialog или screenИ получаешь более 300 гр какой-то буиты :)
это дает тебе возможность переписать скрипты под другие
инструменты, например, свободные. Почему нет, собственно?
а тем временем emerge =dev-util/nvidia-cuda-toolkit-5.5.11
"NVIDIA doesn't provide direct download links yet. If you're a"
"registered developer, then please download ${ARCHIVE} from"
"https://developer.nvidia.com/rdp/cuda-55-release-candidate-i...
> а тем временем emerge =dev-util/nvidia-cuda-toolkit-5.5.11
> "NVIDIA doesn't provide direct download links yet. If you're a"
> "registered developer, then please download ${ARCHIVE} from"
> "https://developer.nvidia.com/rdp/cuda-55-release-candidate-i...http://developer.download.nvidia.com/assets/cuda/secure/CUDA...
PCRE ./configure ... --with-jit
http://nginx.org/ru/docs/ngx_core_module.html#pcre_jit
Пока что это дорого и бессмысленно. Гонять данные в память видеокарты и обратно только для того, чтобы сравнить одно целое с другим целым, это есть немного смешно. С другой стороны, выбор CUDA как бы намекает, что жирафы в плане вычислений ни на что другое не годятся.
Наконец-то что-то полезное для повседневной жизни стали производить. Жаль, что не OpenCL. Главное, чтобы не нашлось редиски, которая занялась бы патентованием подобных алгоритмов.
Перенос таких вещей на матричные процессоры имеет только один смысл: когда надо одновременно посчитать сотни и тысячи таких грепов по разным блокам данных. В остальных случаях - баловство и мазохизм. Судя по "бенчам" - именно этим и занимаются.
Ну, в общем, СУБД заняты примерно подсчетом сотен и тысяч грепов как раз.
> Ну, в общем, СУБД заняты примерно подсчетом сотен и тысяч грепов как
> раз.СУБД заняты не грепом, а поиском в индексах. В основном. Это на видео передать можно, но эффект вряд ли будет большим, с учетом разнородности запросов. Хотя - СУБД СУБД рознь.
> Ну, в общем, СУБД заняты примерно подсчетом сотен и тысяч грепов как раз.Если СУБД занимается грепами - бить надо архитектора базы, жестоко и беспощадно.
grep/regexp - это костыль, заменяющий SQL в тех ситуациях, когда информация не структурирована (т.е. представлена не в виде таблиц с типизированными полями, а в виде текстовой каши). Как и положено костылю, он практически во всех отношениях проигрывает нормальному решению - и по скорости, и по надежности, и по гибкости, и по прозрачности. Но иногда выбора просто нет.
> Перенос таких вещей на матричные процессоры имеет только один смысл: когда надо
> одновременно посчитать сотни и тысячи таких грепов по разным блокам данных.
> В остальных случаях - баловство и мазохизм.Нет. В случае использования NFA для регулярного выражения,
распараллеливание может иметь смысл, особенно если
автомат вмещается во внутриблочную память, она маленькая,
но быстрая.
> Нет. В случае использования NFA для регулярного выражения,
> распараллеливание может иметь смысл, особенно если
> автомат вмещается во внутриблочную память, она маленькая,
> но быстрая.Повторюсь - баловство и мазохизм. Вариантов применения также вижу только один: считать простенький греп по десятку гигов данных. Но за это можно руки отрывать сразу, за кривую организацию системы.
Может пригодиться в массовом параллельном обсчете грепов, например, для реалтаймовой фильтрации контента (DPI) - но это относится к моему посту выше - когда надо посчитать параллельно тысячу грепов :)
>> Нет. В случае использования NFA для регулярного выражения,
>> распараллеливание может иметь смысл, особенно если
>> автомат вмещается во внутриблочную память, она маленькая,
>> но быстрая.
> Повторюсь - баловство и мазохизм. Вариантов применения также вижу только один: считать
> простенький греп по десятку гигов данных.
> Но за это можно руки
> отрывать сразу, за кривую организацию системы.Не надо этого фанатизма. Вполне типичная задача
для тех, кто занимается обработкой текста. С помощью банального
grep-like поиска можно найти то, что потом обрабатывается более детально.
Спроси у Яндекса, зачем они писали свой PIRE, у них другой пример.
> Спроси у Яндекса, зачем они писали свой PIRE, у них другой пример.А теперь подумай - яндексу надо обрабатывать один многогигабайтный блок, или огромную пачку небольших.
Объясните пожалуйста, как можно сравнивать скорость "cuda-grepa" и "обычного grepa", когда они выполняются на разных устройствах - CPU и GPU? Обычно ведь две сравниваемые программы выполняются на одном и том же устройстве.Тут, казалось бы, какую пару CPU/GPU возьмешь, так и будет.
>как можно сравнивать скорость "cuda-grepa" и "обычного grepa"Запускаешь "cuda-grep", засекаешь время.
Запускаешь "обычный grep", засекаешь время.
Сравниваешь.
>когда они выполняются на разных устройствахВы правы, это осложняет сравнение, но не означает, что оно вовсе не возможно.
И может быть любым, начиная от "круто, мои терабайтные логи парсятся всего за полгода!" и заканчивая какими-то более менее объективными показателями типа "цена устройства/компа"*"время работы".
> Запускаешь "cuda-grep", засекаешь время. Запускаешь "обычный grep", засекаешь время. Сравниваешь.А смысл такого сравнения? У кого-то ведь топовая NVidia, а у кого-то - 5-ти летней давности. В то же время, процессоры примерно одинаковы.
> В то же время, процессоры примерно одинаковы.у меня — пятилетней давности, например.
У меня тоже - T9500, его индекс производительности (Windows) - 6.2. В общем, не жалуюсь. :-)И я не думаю, что grep на нем гоняется сильно медленнее, чем на мобильном i3.
Ну как бы греп бывает нужен и для того чтобы спарсить 20 Гб логов. Правда, по нормальному такой лог лучше писать в индексированную базу, но...
> Ну как бы греп бывает нужен и для того чтобы спарсить 20
> Гб логов. Правда, по нормальному такой лог лучше писать в индексированную
> базу, но...Если у вас столько логов, то либо вы некоторое время ждете на машинке типа моей, либо у вас десктоп (это примерно 4 раза производительности по сравнению с моей машинкой). А переход с одного мобильного ЦП на другой мобильный столько не даст.
забавляют подобные "анализы": для рекламы выбирают подходящий тест и проводят его на разных устройствах, которые или несравнимы ни по стоимости, ни по теоретической мощи
> забавляют подобные "анализы": для рекламы выбирают подходящий тест и проводят его на
> разных устройствах, которые или несравнимы ни по стоимости, ни по теоретической
> мощиА потом публикуют его на форониксе.
Скоро так всё СПО переедет в видеокарту.
Будет работать там и показывать фигу микромягким.
:)
Да вы упоролись. Видеокарты НЕ предназначены для задач общего назначения (посмотрел бы, как бы вы писали в файл непосредственно с GPU). Поэтому на всём, что не может сильно параллелиться (тысячи потоков хотя бы) и не является вычислениями, они сливают процессорам по полной.
> Да вы упоролись. Видеокарты НЕ предназначены для задач общего назначения (посмотрел бы,
> как бы вы писали в файл непосредственно с GPU). Поэтому на
> всём, что не может сильно параллелиться (тысячи потоков хотя бы) и
> не является вычислениями, они сливают процессорам по полной.TESLA предназначена.
>> Да вы упоролись. Видеокарты НЕ предназначены для задач общего назначения
> TESLA предназначена.Нет.
> TESLA предназначена.о! ещё один альтернативно-мыслящий отметился
> TESLA предназначена.Ага, ЩАЗ. У видеркарт очень слабое управление flow control. Поэтому они хороши только для того что массово и более-менее линейно молотит впараллель большой поток данных. Ну то-есть похоже на обработку сцены в графическом пайплайне, для чего оно изначально создавалось. Это наследие вполне заметно до сих пор. Оно молотит большие объемы данных, но быстрый разворот в другую сторону там не предусмотрен. Так что как general purpose или управляющий процессор - видеокарта вообще ни о чем. Вот как скоростной акселератор дополняющий системный проц - это да.
Хотя интель вон сделал Xeon Phi, но это как бы и не видеокарта особо, а просто относительно параллелящийся акселератор, достаточно самодостаточный для того чтобы забутявить на себе отдельную копию пингвина.
Упоролись не мы, а те упыри, которые любят придавать оборудованию несвойственные ему функции. :)
Да ладно, процессоры общего назначения тоже не предназначены много для чего, но в них всё равно напихали всяких mmx, 3dnow, sse, sse2, sse3, sse4 и т.п. Потом героически сражаются с тем, как эти макроинструкции странслировать в микрокод, который будет обрабатывать RISC-ядро, по возможности задействуя все свои компоненты, могущие работать параллельно.Много однотипных и повторяющихся операций, даже если каждая из них на графической карте выполняется менее эффективно, чем на процессоре общего назначения, всё равно могут выигрывать просто за счёт количества параллельно обрабатываемых данных.
Обработка звука со всякими фильтрами и преобразованиями Фурье, какой-нибудь табличный процессор, греп по тексту, перебор паролей в поисках подходящего хэша, что-нибудь-ещё-придумайте-сами...
> все свои компоненты, могущие работать параллельно.Уточним, там скорее группа RISC-подобных выполняющих элементов, так что это чем-то смахивае на "VLIW + декодер". Собственно, амд не зря в новых видеокартах впихал перед VLIW-образным процом некий планировщик команд и прочая - так оно стало "немного более general purpose", амд даже и не скрывали этой цели.
И, кстати, для таких блоков выполнения SSE и тому подобные - как дом родной. Они скорее всего достаточно близки к нативному внутреннему представлению как раз. В отличие от традиционной для х86 модели регистров и команд, которые без транслятора и хаков с register renaming, особым кэшированием стека [который постоянно насилуют т.к. у x86 полтора регистра на все] и прочая - x86 команды сами по себе вообще на такую структуру блоков выполнения не заточены. Там как раз да, костылей втыкают немеряно, чтобы это хотя-бы неявно распихивалось на блоки выполнения. Первейший из костылей - декодер, маскирующий от програмера все это :)
Допустим в каких-то задачах multi-core-grep и имеет смысл, но на типичной машине админа локалхоста стоит один-два харда, скорость работы с которыми достаточна для однопоточного grep'а. Если распараллеливать греп, то и данные тоже нужно подавать на оба! И вот тут встаёт вопрос о диске - понравится ли ему прыгать головками туды-сюды?
Для таких вещей я бы использовал Сопроцессор от Intel под названием Xeon Phi (Knights Corner)http://www.intel.com/content/www/us/en/processors/xeon/xeon-...
> Для таких вещей я бы использовал Сопроцессор от IntelСдается мне, что видеокарты элементарно дешевле.
Вообще по дурацки все ето смотрится,
аппаратные ускорители отнюдь не новинка.Для универсальности нужно просто на материнки добавить fpga, а в ось софт для взаимодействия заливки прошивки итд...
Надо будет работать архиватором надо кодеком ну или grep
постепенно наберется архив прошивок и в софте появится поддержка...
> Для универсальности нужно просто на материнки добавить fpga, а в ось софт
> для взаимодействия заливки прошивки итд...Ну вот GPU чем-то таким и оказались - параллельная числокрушилка с возможностью вливать в нее код.
Всё логично: CPU, FPU, а теперь ещё и GPU (grep processor unit). Ждём SPU (для sed) и другие xPU.
Чем только люди не страдают, лишь бы нормально архитектуру не продумывать.
бред, регулярки ресурсоемкие
> бред, регулярки ресурсоемкиеПри правильной архитектуре регулярки не нужны. Максимум strcmp.
>> бред, регулярки ресурсоемкие
> При правильной архитектуре регулярки не нужны. Максимум strcmp.ты про if ?
Про реализацию логики работы с данными вообще.
Вот вот, но тут этого не понимают, тут любят гнобить systemd за бинарные логи.
> Вот вот, но тут этого не понимают, тут любят гнобить systemd за бинарные логи.Да что systemd! Даже обычные текстовые логи бинарной файловой системе, и без драйвера ФС их не достать (особенно с учетом того, что именно логи с их частой ротацией очень подвержены фрагментации).
Нужно срочно создать юниксвейную файловую систему, в которой все структуры данных описаны в виде текста - и таблица размещения файлов (более сложные структуры, типа деревьев, блоатварны и юникс-противны), и журнал транзакций. Вот тогда заживем!
> Нужно срочно создать юниксвейную файловую систему, в которой все структуры данных описаны
> в виде текста - и таблица размещения файлов (более сложные структуры,
> типа деревьев, блоатварны и юникс-противны), и журнал транзакций. Вот тогда заживем!Разумеется, драйвер такой ФС должен быть написан на bash, с использованием grep, sed и awk.
В результате получим максимальную прозрачность, и возможность отлаживать работу ФС без перекомпиляции ядра (которой не могут дать современные блобы).
Поздно, дотнет уже изобрели :)
Но юниксвейную ФС пока не создали. Так что еще не поздно.
> Но юниксвейную ФС пока не создали. Так что еще не поздно.man fuse
>> Но юниксвейную ФС пока не создали. Так что еще не поздно.
> man fuseВ юзерспейсе - не спортивно. Надо, чтобы в ядре. И само ядро на bash, разумеется. Только тогда получится настоящий юникс.
А не как сейчас - блоб на блобе сидит и блобом погоняет, прозрачности никакой.
Админы будут ссать кипятком от счастья!
А виндyзятники и прочие поттерингофилы - корчиться в муках!
> Вот вот, но тут этого не понимают, тут любят гнобить systemd за бинарные логи.Тогда надо и все основные СУБД запретить, за злостное надругательство над unix-way.
Нормальная юниксовая СУБД должна хранить все данные _только_ в текстовых файлах, и использовать regexpы вместо виндyзятнического SQL.
> бред, регулярки ресурсоемкиеа не надо бэктрекерные использовать.
О, так скоро и скриптовые языки ускорят :)
А вообще, пока на открытых драйверах работать не будет - вывод очевиден "Не нужно"
> О, так скоро и скриптовые языки ускорят :)На редкость бессмысленное занятие. Для скриптовых языков скорость не играет никакой роли.
> О, так скоро и скриптовые языки ускорят :)Не, конечно можно сначала создать себе проблемы а потом героически с ними воевать. Но это называется донкихотством...
> Не, конечно можно сначала создать себе проблемы а потом героически с ними
> воевать. Но это называется донкихотством...Это называется unix way.
Крайне показательный пример того факта, что узкозаточенные технологии, типа обработки на GPU сложно хоть как-то задействовать за пределами их основной области применения.Развитие IT уперлось в тупик кремниевой технологии. Для дальнейшего развития нужно либо менять технологию производства электроники, либо саму концепцию программирования.
> Развитие IT уперлось в тупик кремниевой технологии. Для дальнейшего развития нужно либо
> менять технологию производства электроники, либо саму концепцию программирования.http://ftp.linux.kiev.ua/pub/conference/peers/pereslavl/2013...
http://ftp.linux.kiev.ua/pub/conference/peers/pereslavl/2013... (с. 12--14)
>> Развитие IT уперлось в тупик кремниевой технологии. Для дальнейшего развития нужно либо
>> менять технологию производства электроники, либо саму концепцию программирования.
> http://ftp.linux.kiev.ua/pub/conference/peers/pereslavl/2013...
> http://ftp.linux.kiev.ua/pub/conference/peers/pereslavl/2013...
> (с. 12--14)Чудо которое они рекламируют в свободно доступе есть или можно переносить в раздел "спам" ?
> http://ftp.linux.kiev.ua/pub/conference/peers/pereslavl/2013... с. 12--14)бла-бла-бла
странно что не в 10 раз медленнее
> странно что не в 10 раз медленнеезадержка по идее должна расти, верю если много регулярок слать то быстрее
но не атомарно быстрее
Latency PCI
теперь греп без иксов работать не будет?
> теперь греп без иксов работать не будет?Без Wayland и systemd!!!
Ничего страшного, Марк защитит свободу пользователей, и выпустит версию grep, привязанную к истинно свободным Unity, Mir и Upstart, а не к насильственно пропихнутым редхатоподелкам!
Довольно тонко :)
> Довольно тонко :)Космонавт всегда был тонким ценителем свободы.