Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум Разговоры, обсуждение новостей | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Использование в FFmpeg инструкций AVX-512 позволило в 94 раза ускорить некоторые операции" | +/– | |
| Сообщение от opennews (?), 05-Ноя-24, 11:03 | ||
Разработчики проекта FFmpeg сообщили о реализации новых ассемблерных оптимизаций, в которых, благодаря применению инструкций AVX-512, удалось ускорить некоторые операции, применяемые при декодировании видео, в 94, 64, 43 и 4.24 раза по сравнению с кодом на языке Си. В оптимизациях на базе инструкций AVX-2 прирост по сравнению с Си-кодом составлял 67, 27, 55 и 4.38 раз, соответственно, а на основе инструкций SSSE3 - 40, 21, 29 и 2.49 раз. Изменения добавлены в состав библиотеки dav1d, предлагающей альтернативный декодировщик для формата кодирования видео AV1. Инструкции AVX-512 доступны в процессорах AMD на базе микроархитектур Zen 4 и 5, и в процессорах Intel на базе таких микроархитектур, как Skylake-X, Ice Lake, Tiger Lake и Rocket Lake... | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по ответам | RSS] |
| 1. Сообщение от Мохнонос (?), 05-Ноя-24, 11:03 | +48 +/– | |
Молодцы! Вот есть же разработчики, которые кроме обвеса плюшками и раскабанивания ПО ведут его непосредственную тщательную полировку | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #31 | ||
| 3. Сообщение от dim4k (ok), 05-Ноя-24, 11:04 | +11 +/– | |
Ассемблер стреляет тогда - когда этого никто не ждёт😏😏😏 | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #16, #19 | ||
| 4. Сообщение от Аноним (4), 05-Ноя-24, 11:06 | +2 +/– | |
Avx всё так же режет частоту процессора? Кто-нибудь уже составил сравнительную табличку того, чем придётся жертвовать при задействовании? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #7, #11, #22, #73, #152 | ||
| 7. Сообщение от dalco (ok), 05-Ноя-24, 11:13 | +/– | |
Вроде как, урезание частот при включенном AVX относилось только к ранним моделям "синих". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #10 | ||
| 8. Сообщение от _kp (ok), 05-Ноя-24, 11:14 | +5 +/– | |
Время перекодирования или только "некоторые операции"? ;) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #12, #14 | ||
| 10. Сообщение от Аноним (4), 05-Ноя-24, 11:17 | +2 +/– | |
Они там повторяли с каждым новым avx. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #7 | ||
| 11. Сообщение от Cykooz (ok), 05-Ноя-24, 11:25 | +8 +/– | |
В моих реализациях для AVX2, с использованием fixed-point арифметики, какой либо выигрыш перед наивной реализацией на float-ах, без AVX-а, полностью исчезает при выполнении задачи уже в 7-8 параллельных потоках. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #21, #47, #48, #50, #146 | ||
| 12. Сообщение от Андрей (??), 05-Ноя-24, 11:32 | +/– | |
Судя по скрину - некоторые операции... которые являются по сути базовыми для операций кодирования. Цельный результат оценить сложнее и скорее всего совокупный прирост небольшой, т.к. медленные операции того же чтения с диска быстрее не стали, да и в случае векторных расширений интересно на самом деле то, что там вообще кроме непосредственно одновременных вычислений есть куча расширений чисто для улучшения работы с кэшем, те же базовые load/store и вот тут предположу большую часть вклада внесли именно оптимизации работы кэша, а вычисления скорее довеском стали ибо будучи казалось бы более быстрыми они имеют высокие задержки и длятся дольше, ввиду чего задерживают конвеер не давая линейного прироста скорости. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #8 | ||
| 13. Сообщение от Big Robert TheTables (?), 05-Ноя-24, 11:50 | –1 +/– | |
Вроде бы удаляли эти инструкции, но вообще интересно, для каких именно разработчиков эти наборы инструкций добавляли. Ибо авторы ффмпег сейчас совсем как мы, сторонние программисты - мы зашли в магазин автозапчастей и увидели, что на прилавке есть двигатель, который подойдет на замену нашему. Но ведь изначально-то движок был для какой-то другой ракеты, был разработан, сбалансирован, проверен для иного использования. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #20 | ||
| 14. Сообщение от Аноним (14), 05-Ноя-24, 11:54 | +/– | |
> Время перекодирования или только "некоторые операции"? ;) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #8 | ||
| 16. Сообщение от КО (?), 05-Ноя-24, 12:09 | +1 +/– | |
Осталось только найти что конкретно сломали, лол | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 | ||
| 17. Сообщение от Аноним (17), 05-Ноя-24, 12:10 | +1 +/– | |
Чует моё сердце, что тут 100 пудово есть какой-нить "нюанс", типа всё делаем в однопотоке или ещё чего-нить подобное. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #37 | ||
| 19. Сообщение от Ник (??), 05-Ноя-24, 12:18 | +1 +/– | |
Нужно было писать на Java, там же волшебный jit который сам весь код оптимизирует! | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 Ответы: #99 | ||
| 20. Сообщение от Аноним (65), 05-Ноя-24, 12:22 | –1 +/– | |
> мы зашли в магазин автозапчастей и увидели, что на прилавке есть двигатель, который... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #13 Ответы: #33, #125 | ||
| 21. Сообщение от ryoken (ok), 05-Ноя-24, 12:31 | –3 +/– | |
>>наивной реализацией | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 Ответы: #27 | ||
| 22. Сообщение от Аноним (22), 05-Ноя-24, 12:33 | +/– | |
На нормальных материнских платах можно регулировать оффсет частоты при выполнении AVX-инструкций, в т.ч. и ставить его в 0. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 | ||
| 26. Сообщение от Аноним (26), 05-Ноя-24, 12:42 | +/– | |
Я надеюсь они пользовались GNU assembler с синтаксисом AT&T. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #30 | ||
| 27. Сообщение от Аноним (27), 05-Ноя-24, 12:42 | +3 +/– | |
Может быть, он даже не ошибся. Называют же, например, реализацию преобразования Фурье в лоб, как по формуле, наивной. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #21 Ответы: #60 | ||
| 29. Сообщение от Аноним (29), 05-Ноя-24, 12:50 | +/– | |
кхм. а скомпилировать из си с использование указанных инструкций? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #32 | ||
| 30. Сообщение от Аноним (27), 05-Ноя-24, 12:51 | +4 +/– | |
Надеюсь, с синтаксисом Intel. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #26 Ответы: #35, #79 | ||
| 31. Сообщение от Аноним (31), 05-Ноя-24, 13:24 | –22 +/– | |
AVX512 инструкции появились в 2016 году 8 лет назад внимание вопрос. Это так долго до разработчиков доходила весть что инструкции появились? Они так долго копили на проц с поддержкой данных инструкций? Они 8 лет разрабатывали алгоритм? Ответ на любой вопрос показывает что разрабы у ффмпег не очень скажем так. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 Ответы: #34, #39, #40, #45, #69, #89, #90, #92, #128 | ||
| 32. Сообщение от BeLord (ok), 05-Ноя-24, 13:26 | +1 +/– | |
А компилятор смогёт?-)) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #29 Ответы: #97 | ||
| 33. Сообщение от Аноним (31), 05-Ноя-24, 13:28 | +2 +/– | |
Поэтому компания Интел и находится на грани банкротства с убытками 16 миллиардов в квартал. В квартал, Карл! | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #20 Ответы: #42, #59, #62, #82, #100 | ||
| 34. Сообщение от Аноним (34), 05-Ноя-24, 13:29 | +24 +/– | |
когда тебе денег за работу не платят, то выбираешь сам когда и что делать по мере возможностей и желания. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 Ответы: #36 | ||
| 35. Сообщение от Аноним (31), 05-Ноя-24, 13:30 | +/– | |
Надеюсь на раст. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #30 Ответы: #44, #52 | ||
| 36. Сообщение от Аноним (31), 05-Ноя-24, 13:31 | +2 +/– | |
Справедливо Интел должна доплачивать чтобы кто-то юзал их лишние инструкции. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #34 Ответы: #41, #80 | ||
| 37. Сообщение от Rodegast (ok), 05-Ноя-24, 13:31 | +/– | |
Нюанс в том что не везде он теперь будет работать. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #17 | ||
| 39. Сообщение от Anony (?), 05-Ноя-24, 13:40 | +6 +/– | |
Ты думаешь что все пользователи и все сервера сразу же в 2016 году обновились на новые процессоры с поддержкой AVX-512? Серьезно? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 Ответы: #43, #56, #101 | ||
| 40. Сообщение от Аноним (40), 05-Ноя-24, 13:49 | +2 +/– | |
На 12400 попытались появиться, но интел быстренько резанули это дело. А проц 22-го года, если что. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 41. Сообщение от Юрий (??), 05-Ноя-24, 13:49 | +1 +/– | |
Так интел уже официально не поддерживает AVX-512. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #36 Ответы: #49, #95 | ||
| 42. Сообщение от Аноним (65), 05-Ноя-24, 14:18 | +/– | |
Не поэтому. С тем же успехом можно сказануть, что "у него хардварные кодеки лучше и энкодер AV1 в 15 поколении появился, за счёт них точно выкарабкается". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 | ||
| 43. Сообщение от Аноним (43), 05-Ноя-24, 14:23 | +1 +/– | |
Массовыми такие процессоры стали далеко не в 2016. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #39 | ||
| 44. Сообщение от Аноним (27), 05-Ноя-24, 14:23 | +1 +/– | |
На Rust надейся, а сам не плошай. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #35 | ||
| 45. Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:25 | +3 +/– | |
Не, чувак, тут вопросы к чипмейкерам. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 Ответы: #102, #142 | ||
| 46. Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:29 | +1 +/– | |
На AVX2 главное не сильно хуже получилось. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #75 | ||
| 47. Сообщение от НяшМяш (ok), 05-Ноя-24, 14:31 | +/– | |
Это из-за снижения частоты процессора с ростом потоков. У меня в однопотоке такой же процессор бустится почти до 5.2, а во многопотоке до 4.4-4.6. Но у меня хороший кулер на процессоре и я довольно много потратил времени в биосе настраивая лимиты, чтобы он так работал. В стоке эти цифры ещё меньше будут. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 Ответы: #53, #144, #145 | ||
| 48. Сообщение от Аноним (48), 05-Ноя-24, 14:34 | +/– | |
Лучше в 1 потоке в 8 раз быстрее считать, чем в 8 потоках с той же скоростью. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 Ответы: #66 | ||
| 49. Сообщение от Аноним (49), 05-Ноя-24, 14:43 | +1 +/– | |
А что так? Не взлетело? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #41 Ответы: #65 | ||
| 50. Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:45 | +/– | |
Таки ничего удивительного, учитывая что AVX позволяет более плотно загружать ИМЕЮЩИЕСЯ блоки, а у вас там гипертрединг ещё. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 | ||
| 51. Сообщение от Аноним (52), 05-Ноя-24, 14:47 | +/– | |
> 94, 44, 64 и 4.24 раза по сравнению базовой реализацией | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #55, #63 | ||
| 52. Сообщение от Аноним (52), 05-Ноя-24, 14:49 | +/– | |
Не надейтесь. Там ассемблер. Но и не расстраивайтесь. Для раста много ниш открывается. По замене питона, бейсика и т.п. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #35 Ответы: #58 | ||
| 53. Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:49 | +2 +/– | |
У него АМД, вряд ли просадка с 4 до 3,4 даст заметное проседание скорости, а ниже базовой АМД не сбрасывает, только тротлить может при перегреве. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #47 | ||
| 54. Сообщение от Аноним (55), 05-Ноя-24, 14:55 | +4 +/– | |
> в 94 раза ускорить | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #81 | ||
| 55. Сообщение от Аноним (55), 05-Ноя-24, 15:05 | +1 +/– | |
Рассуждать о качестве тут вообще не к месту. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #51 | ||
| 56. Сообщение от Вертел ваши спинеры (?), 05-Ноя-24, 15:07 | +8 +/– | |
Под сокет АМ5 завезли. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #39 | ||
| 58. Сообщение от Аноним (48), 05-Ноя-24, 15:21 | +/– | |
По факту это питон всех заменяет и вырвался на первое место по частоте использования. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #52 Ответы: #61 | ||
| 59. Сообщение от _kp (ok), 05-Ноя-24, 15:29 | +1 +/– | |
> Поэтому | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 Ответы: #86 | ||
| 60. Сообщение от Аноним (60), 05-Ноя-24, 15:35 | –1 +/– | |
> Может быть, он даже не ошибся. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #27 Ответы: #64 | ||
| 61. Сообщение от _kp (ok), 05-Ноя-24, 15:35 | –1 +/– | |
>> место по частоте использования. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #58 Ответы: #105 | ||
| 62. Сообщение от Аноним (60), 05-Ноя-24, 15:38 | –1 +/– | |
ссылку бы дать на квартальный финансовый отчет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 Ответы: #72 | ||
| 63. Сообщение от Ivan_83 (ok), 05-Ноя-24, 15:49 | +1 +/– | |
А что там представлять? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #51 Ответы: #67 | ||
| 64. Сообщение от Cykooz (ok), 05-Ноя-24, 15:54 | +2 +/– | |
Под "наивной" я имел ввиду без ассемблера и без вызова разных интринсиков. Исключительно на базовых возможностях языка программирования, наивно рассчитывая что компилятор сотворит волшебство и выдаст самый оптимальный код. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #60 Ответы: #68, #154 | ||
| 65. Сообщение от Аноним (65), 05-Ноя-24, 16:03 | +5 +/– | |
AVX-512 не реализовали в E-ядрах, поэтому интел инструкции отключил для всех потребительских процессоров (начиная с 2-й ревизии[1] 12 поколения). Разные наборы инструкций на разных ядрах то ли нельзя, то ли некрасиво. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #49 Ответы: #113 | ||
| 66. Сообщение от Cykooz (ok), 05-Ноя-24, 16:04 | +/– | |
Не совсем так, мультипоток даёт прирост скорости даже при использовании SIMD. Просто относительное ускорение за счёт муторной ручной эквилибристики с SIMD инструкциями пропадает при каком-то числе потоков. Т.е. при необходимости можно выбирать что важнее: скорость в однопотоке, или простота написания и читаемость кода в реализации для мультипотока. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #48 | ||
| 67. Сообщение от Аноним (55), 05-Ноя-24, 16:06 | +/– | |
> Просто обычно на С таким не занимаются, и сразу уходят в SIMD. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #63 Ответы: #70, #76 | ||
| 68. Сообщение от Аноним (60), 05-Ноя-24, 16:24 | +/– | |
> Под "наивной" я имел ввиду без ассемблера и без вызова разных интринсиков. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #64 | ||
| 69. Сообщение от laindono (ok), 05-Ноя-24, 16:43 | +1 +/– | |
8 лет в контексте x86 это буквально вчера. Жизненный цикл процессора может быть весьма долгим. Судя по стимовской статистике (первое, что пришло на ум), AVX512 это где-то 15-20%. Не очень много. Хотя предположу, что на серверах с этим несколько лучше. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 Ответы: #78 | ||
| 70. Сообщение от Аноним (60), 05-Ноя-24, 16:57 | +/– | |
Intrinsics are just C-style functions that do something with these vector data types, usually by simply calling the associated assembly instruction. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #67 | ||
| 71. Сообщение от Аноним (71), 05-Ноя-24, 16:59 | +/– | |
Базовые реализации у всех тестов кроме первого совсем медленные, может, вместо ускорения остальных реализаций были замедлены базовые, чтобы желтушники сообщили об огромном ускорении? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #129 | ||
| 72. Сообщение от Tita_M (ok), 05-Ноя-24, 17:02 | +/– | |
На 3dnews.ru были новости, но там Интел писала, что это в основном разовые убытки из-за реструктуризации. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #62 Ответы: #108, #110, #111 | ||
| 73. Сообщение от Аноним (73), 05-Ноя-24, 17:13 | +/– | |
Сам по себе AVX на частоту не влияет никак. Частота снижается по средствам сторонних алгоритмов контроля потребления/температуры. Частота снижается не сильно 50-150Mhz, а некоторый код ускоряется очень сильно. https://www.techpowerup.com/review/amd-ryzen-9-9950x/ | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 | ||
| 75. Сообщение от 12yoexpert (ok), 05-Ноя-24, 17:18 | +2 +/– | |
по логике avx512 должен быть в 256 раз быстрее avx2, но intel и тут облажались | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #46 Ответы: #77, #88 | ||
| 76. Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:20 | +1 +/– | |
Вы бы читать научились. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #67 Ответы: #126 | ||
| 77. Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:22 | +/– | |
У интела с неймингом традиционно плохо :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #75 | ||
| 78. Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:25 | +/– | |
У интела жизненный цикл проца 1-2 года, как и платформы. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #69 Ответы: #83, #98 | ||
| 79. Сообщение от Аноним (65), 05-Ноя-24, 17:31 | +/– | |
Фух, интеловский синтаксис, NASM. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #30 Ответы: #87, #114 | ||
| 80. Сообщение от Соль земли (?), 05-Ноя-24, 17:55 | –1 +/– | |
в прошлом майкрософт доплачивала, чтобы винду везде ставили... и вот результат | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #36 Ответы: #118 | ||
| 81. Сообщение от Соль земли (?), 05-Ноя-24, 18:01 | +/– | |
Скорее всего сравнивают то, что успели накодить для теста. Так то можно и Си заставить использовать любые инструкции. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #54 Ответы: #84 | ||
| 82. Сообщение от Бывалый Смузихлёб (ok), 05-Ноя-24, 18:02 | +/– | |
Квартал ни о чём не говорит. Один может быть сильно более убыточный, другой - сильно более прибыльный. По году смотреть надо. Тем более, что финансовый год в сша кончается осенью | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 | ||
| 83. Сообщение от laindono (ok), 05-Ноя-24, 18:03 | +1 +/– | |
Вопрос не в том, как часто обновы появляются, а как быстро старые уходят из употребления. Это же не смартфоны, где архитектура процев очень быстро обрастает добавками. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #78 Ответы: #85 | ||
| 84. Сообщение от Аноним (65), 05-Ноя-24, 18:12 | +/– | |
Не, всё написано, последнее изменение полгода назад, почти сплошной асм отдельными файлами. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #81 | ||
| 85. Сообщение от Ivan_83 (ok), 05-Ноя-24, 18:13 | +/– | |
Смартфоны часто оборачиваются не из за процов а просто потому что экран или батарея или утопили. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #83 | ||
| 86. Сообщение от Аноним (14), 05-Ноя-24, 19:05 | +/– | |
Проблемы у Intel начались задолго до фиаско с 13/14 поколением. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #59 | ||
| 87. Сообщение от Аноним (14), 05-Ноя-24, 19:08 | +1 +/– | |
> Фух, интеловский синтаксис, NASM. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #79 Ответы: #91, #96 | ||
| 88. Сообщение от Аноним (14), 05-Ноя-24, 19:09 | +/– | |
> в 256 раз быстрее | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #75 | ||
| 89. Сообщение от mr. cake (?), 05-Ноя-24, 19:19 | +/– | |
Инструкции-то были, но были только в интелах где от них включался тротлинг по частоте, т. е. смысла из использовать было ноль | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 90. Сообщение от Кирилл (??), 05-Ноя-24, 19:58 | +1 +/– | |
Инструкции то появились... ну где то. А когда они появились на твоём столе? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 91. Сообщение от Аноним (65), 05-Ноя-24, 20:31 | +/– | |
Зачем бы я тогда искал? От факта использования интеловского синтаксиса есть некое удовлетворение. Не всё потеряно в этом мире. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #87 | ||
| 92. Сообщение от Аноним (92), 05-Ноя-24, 20:46 | –1 +/– | |
AV1 был впервые опубликован 28 марта 2018, то есть 6,5 лет назад. Это все-таки меньше, чем 8. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 93. Сообщение от Аноним (92), 05-Ноя-24, 20:51 | +/– | |
Еще бы найти где-то видео в формате AV1. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #94 | ||
| 94. Сообщение от Аноним (94), 05-Ноя-24, 21:35 | +2 +/– | |
Уже давно YouTube и русские сервера с видео поставляют его. Смотрите техническую информацию в видео при воспроизведении | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 Ответы: #106 | ||
| 95. Сообщение от Фняк (?), 05-Ноя-24, 21:41 | +/– | |
А про официально не поддерживает можно подробнее? Ну там ссылку на заявление Интел или что-то в этом духе | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #41 Ответы: #109 | ||
| 96. Сообщение от 1001й глаз (?), 05-Ноя-24, 22:18 | +/– | |
Не всё равно. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #87 | ||
| 97. Сообщение от Аноним (97), 05-Ноя-24, 22:51 | +/– | |
А в чём проблема? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #32 Ответы: #116 | ||
| 98. Сообщение от Аноним (-), 05-Ноя-24, 23:02 | +/– | |
> У интела жизненный цикл проца 1-2 года, как и платформы. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #78 | ||
| 99. Сообщение от Аноним (-), 05-Ноя-24, 23:03 | +1 +/– | |
Он и оптимизирует волшебный жор проца и оперативы. Станет жрать RAM и CPU в разы лучше. А вы разве сомневались? :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #19 | ||
| 100. Сообщение от Аноним (4), 05-Ноя-24, 23:06 | +/– | |
> Поэтому компания Интел и находится на грани банкротства с убытками 16 миллиардов | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 Ответы: #104 | ||
| 101. Сообщение от Аноним (31), 05-Ноя-24, 23:50 | +1 +/– | |
Не находишь орным что сабж реализовали после деприкейта avx512? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #39 Ответы: #134 | ||
| 102. Сообщение от Аноним (31), 05-Ноя-24, 23:53 | +/– | |
Даже спрашивать страшно где ты там на своей фряхе используешь avx. А я даже и спрашивать не буду. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #45 | ||
| 104. Сообщение от Аноним (31), 05-Ноя-24, 23:59 | +/– | |
И получишь очередные Жигули. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #100 | ||
| 105. Сообщение от Аноним (31), 06-Ноя-24, 00:01 | +2 +/– | |
В Германии БМВ сильно больше. Сказать то чего хотел? Что в нормальных странах выбирают нормальные автомобили? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #61 Ответы: #119 | ||
| 106. Сообщение от Аноним (31), 06-Ноя-24, 00:02 | –1 +/– | |
Не надо так. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #94 | ||
| 108. Сообщение от Аноним (60), 06-Ноя-24, 01:22 | +1 +/– | |
интел писала на 3dnews.ru? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #72 | ||
| 109. Сообщение от Аноним (65), 06-Ноя-24, 02:24 | +/– | |
В серверных процессорах очевидно, что они есть и будут (и войдут в AVX10.1/512). | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #95 | ||
| 110. Сообщение от Аноним (60), 06-Ноя-24, 02:41 | +/– | |
Вот если интересно, аноним выше непонимает разницы между расходом (ускоренной амортизацией) и убытком. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #72 Ответы: #120 | ||
| 111. Сообщение от Аноним (60), 06-Ноя-24, 03:15 | +/– | |
помесячный график | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #72 Ответы: #121 | ||
| 113. Сообщение от Аноним (113), 06-Ноя-24, 03:24 | +1 +/– | |
Неужели не смогли с M$ договориться, чтобы помечать процессы, требующие avx512 и соответственно им автоматически проставлять аффинити на P ядра. Казалось бы, тривиальная вещь. Очень похоже на какой-то патент нарвались тут. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #65 Ответы: #117, #140 | ||
| 114. Сообщение от Аноним (-), 06-Ноя-24, 06:41 | +/– | |
Ага, каталог blob у проекта, которое не относится к проекту ffmpeg. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #79 Ответы: #137 | ||
| 115. Сообщение от Ilya Indigo (ok), 06-Ноя-24, 07:22 | +/– | |
Мне больше интересно насколько с AVX512 производительнее чем с AVX256 и стоит ли оно того? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #124 | ||
| 116. Сообщение от n00by (ok), 06-Ноя-24, 10:32 | +/– | |
В неумении эксперта задать ключ -S транслятору? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #97 | ||
| 117. Сообщение от Аноним (117), 06-Ноя-24, 10:44 | +3 +/– | |
Скорей похоже на залочку маркетингово. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #113 | ||
| 118. Сообщение от Аноним (117), 06-Ноя-24, 10:46 | +1 +/– | |
Думаю и Intel и прочие, просто у первой раз в 1000 денег больше даже чем у AMD, не говоря про других. Достаточно оглянуться на то сколько всего неадекватно-тормозного... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #80 | ||
| 119. Сообщение от _kp (ok), 06-Ноя-24, 11:20 | +/– | |
"частота использования" может указывать и на г0вно. И не только про авто вне Германии, вне системного программирования тоже пользуются тем что осилили, а не тем что лучше. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #105 | ||
| 120. Сообщение от Аноним (31), 06-Ноя-24, 11:21 | +/– | |
Ускоренная амортизация это такой же бред как отрицательный рост? Забавно это слышать от юзера который сам не мог найти ссылку. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #110 Ответы: #122 | ||
| 121. Сообщение от Аноним (31), 06-Ноя-24, 11:21 | +/– | |
Типа ты не верил в убытки или сам себе пытаешься доказать что у Интел все хорошо? ( у Интел все плохо ). | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #111 Ответы: #123 | ||
| 122. Сообщение от Аноним (60), 06-Ноя-24, 13:51 | +/– | |
> это такой же бред | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #120 Ответы: #158 | ||
| 123. Сообщение от Аноним (60), 06-Ноя-24, 13:54 | +/– | |
> Типа ты не верил | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #121 Ответы: #159 | ||
| 124. Сообщение от anon111 (?), 06-Ноя-24, 14:16 | +/– | |
См. тему про тестирование cpu в ffmpeg на форуме ixbt. Если коротко, бывает даёт +5-10% скорости кодирования. Это было до новой версии ffmpeg. Посмотрим, что изменится с новинкой. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #115 | ||
| 125. Сообщение от Big Robert TheTables (?), 06-Ноя-24, 15:15 | –1 +/– | |
К сожалению, тут не котят в дверцы надо просунуть, но данные а) подготовить, б) выполнить инструкцию в) забрать. Если бы проблема была только в размерности, то данные оптимизации выполнялись бы сходу, при компиляции. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #20 Ответы: #133, #141 | ||
| 126. Сообщение от Аноним (55), 06-Ноя-24, 16:22 | +/– | |
> ОБЫЧНО на С не используют такие штуки | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #76 Ответы: #127, #136 | ||
| 127. Сообщение от Аноним (60), 06-Ноя-24, 17:48 | +/– | |
> то пишут на Си с интринсиками, а не на ассемблере. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #126 Ответы: #130 | ||
| 128. Сообщение от 1 (??), 06-Ноя-24, 18:04 | +/– | |
Тебе никто не обязан этого делать. Ребята сделали, почёт им. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 129. Сообщение от Аноним (129), 06-Ноя-24, 18:10 | +/– | |
Очень похоже на то: https://news.ycombinator.com/item?id=42042706 | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #71 | ||
| 130. Сообщение от Аноним (55), 06-Ноя-24, 18:14 | +/– | |
Разница в чём? В производительности будет одно и то же. Если вы не мега-эксперт по ассемблеру, вроде сотрудника Intel, что знает все тайминги и особенности современных x86 процессоров. Если же плохо знать ассемблер, то компилятор векторные команды может расположить более оптимально. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #127 Ответы: #131 | ||
| 131. Сообщение от Аноним (60), 06-Ноя-24, 18:31 | +/– | |
> К тому же ассемблерный код придётся писать для 32 и 64 версий архитектуры. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #130 Ответы: #135 | ||
| 132. Сообщение от Bottle (?), 06-Ноя-24, 19:18 | +/– | |
А потом говорят, что Сишка быстрая. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #147 | ||
| 133. Сообщение от Аноним (65), 06-Ноя-24, 19:24 | +/– | |
> В реальности все немного сложнее. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #125 | ||
| 134. Сообщение от Аноним (134), 06-Ноя-24, 19:28 | +1 +/– | |
То, что его депрекетнул идущий ко дну Интел - исключительно его проблемы. AMD пока AVX512 не депрекейтит. Интересно, еще существуют люди в здравом уме, кто покупает интел в 2024? Mindfactory отчитался, что среди их покупателей таких почти не осталось. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #101 Ответы: #139 | ||
| 135. Сообщение от Аноним (55), 06-Ноя-24, 19:48 | +/– | |
> то есть я пишу на С и пихаю асм вставки векторных инструкций | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #131 Ответы: #138 | ||
| 136. Сообщение от Ivan_83 (ok), 06-Ноя-24, 20:43 | +/– | |
Чтобы оптимизировать код не обязательно опускатся на низкий уровень и писать инстриктами/SIMD код, это обычно самое последнее что делают. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #126 | ||
| 137. Сообщение от Аноним (65), 06-Ноя-24, 21:27 | +/– | |
Угу, умные комментарии на опеннете. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #114 | ||
| 138. Сообщение от Аноним (60), 06-Ноя-24, 21:27 | +/– | |
> Где в процитированный для виду википедии написано что интринсики это асм вставки? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #135 | ||
| 139. Сообщение от Аноним (65), 06-Ноя-24, 21:54 | +/– | |
Arrow Lake от следующих слов лучше, конечно, не станет, но Mindfactory - это вообще-то партнёр AMD, ему положено рекламировать AMD (что он и делает) и выгодные предложения делать тоже, наверное (правильная статистика продаж - хорошая реклама). | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #134 | ||
| 140. Сообщение от Аноним (65), 06-Ноя-24, 22:12 | +/– | |
Механизм может периодически ошибаться с вылетами приложений. Покупатели могут слишком много думать о пользе AVX-512 на больших ядрах (читай - о бесполезности малых ядер). Если покупателям не дать пистолет, они не выстрелят себе в ногу (и в репутацию Intel). | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #113 | ||
| 141. Сообщение от Аноним (65), 06-Ноя-24, 22:36 | +/– | |
> тоже всё ясно с вами | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #125 Ответы: #149 | ||
| 142. Сообщение от Аноним (-), 07-Ноя-24, 10:18 | +/– | |
Intel Core 2 Duo - это и SSE4.1. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #45 Ответы: #148 | ||
| 144. Сообщение от Аноним (-), 07-Ноя-24, 11:35 | +/– | |
Поправку надо сделать. Я не внимательно посмотрел, не один процессор 128 ядер, а два процессора по 64 ядра, в сумме 128 ядер и в сумме 256 потоков. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #47 | ||
| 145. Сообщение от Аноним (-), 07-Ноя-24, 11:35 Скрыто ботом-модератором | +/– | |
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #47 | ||
| 146. Сообщение от Аноним (-), 07-Ноя-24, 11:39 | +/– | |
Поправку надо сделать. Я не внимательно посмотрел, не один процессор 128 ядер, а два процессора по 64 ядра, в сумме 128 ядер и в сумме 256 потоков. перепутал. Я на это отвеча: "задачи уже в 7-8 параллельных потоках" | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 | ||
| 147. Сообщение от Аноним (147), 07-Ноя-24, 12:57 | +/– | |
Сишка не исполняется | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #132 | ||
| 148. Сообщение от Аноним (148), 07-Ноя-24, 13:41 | +/– | |
Не все. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #142 | ||
| 149. Сообщение от Big Robert TheTables (?), 07-Ноя-24, 13:41 | +/– | |
>> тоже всё ясно с вами | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #141 | ||
| 152. Сообщение от Аноним (152), 08-Ноя-24, 05:02 | –1 +/– | |
Я когда читал ваш тред, у меня рука от лица не отлипала. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #156 | ||
| 153. Сообщение от Аноним (152), 08-Ноя-24, 05:08 | +/– | |
Работают ли эти оптимизации на aarch64? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #155 | ||
154.
Сообщение от Аноним (154), 08-Ноя-24, 08:30
| +/– | |
Можно ли объединить подходы с использованием fixed-point и расширений SSE2? Возможно, такой подход позволит достичь производительности, сопоставимой с AVX-512, и, вероятно будет более энергоэффективным. Не говоря уже о совместимости. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #64 Ответы: #157 | ||
| 155. Сообщение от Аноним (155), 08-Ноя-24, 13:05 | +/– | |
Нет кончено, это не для армов. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #153 | ||
| 156. Сообщение от Аноним (134), 08-Ноя-24, 14:01 | +/– | |
Так это придумали еще 20 лет назад, до появления троттлинга процессоры просто сгорали при превышении температуры. Зато да, частота была стабильная. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #152 | ||
| 157. Сообщение от Cykooz (ok), 08-Ноя-24, 17:04 | +/– | |
> Можно ли объединить подходы с использованием fixed-point и расширений SSE2? Возможно, такой | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #154 | ||
| 158. Сообщение от Аноним (134), 08-Ноя-24, 17:21 | +/– | |
> ссылку на подачу заявления о банкростве не нашел | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #122 | ||
| 159. Сообщение от Аноним (134), 08-Ноя-24, 17:26 | +/– | |
Убыток — отрицательная разница между полученными доходами и произведенными расходами. Интел в пресс-релизе у себя написала, что в третьем квартале у нее убыток $16,64 млрд, или $3,88 на акцию. Ты готов поспорить с юристами/аудиторами самой Intel? Серьезно? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #123 | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
|
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |