The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

/ Для администратора / Система / Оптимизация, тюнинг
·15.05.2025 В кодовую базу Ruby принят новый JIT-компилятор ZJIT (40 +8)
  В кодовую базу эталонной реализации языка Ruby добавлен новый JIT-компилятор ZJIT, позиционируемый как следующее поколение Ruby JIT. ZJIT войдёт в состав следующего значительного выпуска Ruby 3.5, в котором будет доступен в качестве опции параллельно с JIT-компилятором YJIT, а в версии Ruby 3.6 возможно заменит его. Как и YJIT новый JIT-компилятор написан на языке Rust. Оба JIT-компилятора созданы командой разработчиков из компании Shopify в рамках инициативы по увеличению производительности Ruby-программ, использующих фреймворк Rails и вызывающих очень много методов...
·02.05.2025 Intel открыл iaprof, инструментарий для профилирования производительности GPU (28 +10)
  Брендан Грег (Brendan Gregg), один из разработчиков системы динамической отладки DTrace, ныне работающий в Intel и развивающий средства для анализа производительности на базе eBPF в ядре Linux, объявил об открытии исходного кода инструментария iaprof (AI Flame Graphs). Инструментарий предназначен для анализа информации о производительности GPU Intel и её наглядной визуализации. Код написан на языке Си и открыт под лицензией Apache 2.0...
·29.04.2025 Проект PyXL развивает процессор для выполнения байт-кода Python (195 +23)
  Представлен специализированный процессор PyXL, предназначенный для ускорения выполнения кода на языке Python. Байт-код Python напрямую выполняться чипом без JIT, интерпретации и виртуальных машин. Файлы на языке Python вначале транслируются в байт-код CPython, после чего байт-код преобразуется в специализированный набор инструкций PySM, выполняемых чипом. Инструментарий для подготовки кода к выполнению написан на Python и работает в стандартном окружении на базе немодицифированного CPython. Реализация процессора разработана с нуля и оформлена на языке описания и моделирования электронных систем Verilog. Рабочий прототип процессора тестируется на платах с FPGA Zynq-7000...
·01.04.2025 В ядро Linux 6.15 приняты значительные оптимизации сетевой подсистемы и exFAT (236 +63)
  В состав кодовой базы ядра Linux, на основе которой формируется выпуск 6.15, принят набор изменений с оптимизациями, в ряде ситуаций значительно повышающих производительность сетевых операций:...
·19.03.2025 Производительность Ubuntu-пакета jq удалось увеличить в 1.9 раза путём пересборки (158 +44)
  Опубликованы результаты оценки влияния на производительность пересборки пакетов для Ubuntu с различными опциями и реализациями функций выделения памяти. Экспериментатору удалось на 90% (в 1.9 раза) повысить производительность пакета jq с инструментарием для обработки данных в формате JSON, путём обычной пересборки из того же пакета с исходным кодом, без внесения изменений в сам код. Производительность оценивалась через измерение времени выполнения типового фильтрующего запроса над данными GeoJSON, размером 500МБ...
·30.01.2025 Яндекс открыл Perforator, инструментарий для профилирования приложений (124 +18)
  Компания Яндекс объявила об открытии исходного кода инструментария Perforator, предназначенного для непрерывного сбора детальных метрик с информацией о работе приложений и рассчитанного на использование в крупных кластерах и датацентрах. Инструментарий позволяет анализировать работу приложений в реальном времени, оценивать распределение ресурсов на Linux-серверах и выявлять наиболее ресурсоёмкие приложения. Код написан на языке С++ и распространяется под лицензией MIT (eBPF-программы под GPLv2)...
·11.01.2025 В Fedora 42 планируют поставлять оптимизированные варианты исполняемых файлов (189 +22)
  В выпуске Fedora 42, намеченном на конец апреля, предложено разрешить сопровождающим включать в пакеты дополнительные варианты исполняемых файлов, собранные с включением оптимизаций для микроархитектур x86-64-v2, x86-64-v3 и x86-64-v4. Отмечается, что Fedora продолжает собирать пакеты для архитектуры x86-64-v1, в то время как CentOS использует при сборке архитектуру x86-64-v2, а RHEL 10 - x86-64-v3. В большинстве случаев прирост производительности при сборке для подобных архитектур не превышает 10%, но в отдельных ситуациях приводит к заметному повышению производительности (до 120%). Предложение пока не утверждено комитетом FESCo (Fedora Engineering Steering Committee), отвечающим за техническую часть разработки дистрибутива Fedora...
·16.12.2024 KVM: регрессии производительности и обсуждение поддержки 32-разрядных систем (155 +20)
  В состав ядра Linux 6.13-rc3 принято изменение, устраняющее регрессию производительности в гипервизоре KVM, связанную с медленной обработкой вызовов CPUID на новых CPU, например, на CPU Intel Emerald Rapids операции c CPUID выполняются в 3-4 раза медленнее, чем на CPU Intel Skylake. Подобная особенность привела к снижению производительности гипервизора KVM, который использует CPUID в процессе сохранения и восстановления состояния процессора при каждой передаче управления виртуальной машине, в случае использования вложенной виртуализации. Для решения проблемы в ветку ядра 6.13 принят сокращённый патч, позволивший до 40% сократить время операции даже CPU семейства SkyLake, благодаря кэшированию CPUID. В ядре 6.14 будет представлена полная версия патча, дополнительно улучшающая производительность...
·16.12.2024 Для Btrfs представлены патчи с балансировкой чтения RAID1 по алгоритму Round-robin (196 +18)
  В репозиторий, развивающий изменения в Btrfs для будущих веток ядра Linux, принят набор...
·20.11.2024 Разработчики Ubuntu проанализировали эффективность включения оптимизации PGO (67 +18)
  Компания Canonical опубликовала результат оценки влияния на производительность оптимизации на основе результатов профилирования кода (PGO - Profile-guided optimization), позволяющей генерировать более оптимальный код на основе анализа особенностей выполнения программы. В итоге был сделан вывод, что использование PGO позволило на 5-7% снизить нагрузку на CPU и сократить время сборки...
·06.11.2024 Архитектура набора команд BPF получила статус предложенного стандарта (100 +9)
  Комитет IETF (Internet Engineering Task Force), занимающийся развитием протоколов и архитектуры интернета, завершил формирование RFC для архитектуры набора команд BPF и опубликовал связанную с ним спецификацию под идентификатором RFC 9669. RFC получил статус "Предложенного стандарта", после чего начнётся работа по приданию RFC статуса чернового стандарта (Draft Standard), фактически означающего полную стабилизацию и учёт всех высказанных замечаний...
·05.11.2024 Использование в FFmpeg инструкций AVX-512 позволило в 94 раза ускорить некоторые операции (140 +47)
  Разработчики проекта FFmpeg сообщили о реализации новых ассемблерных оптимизаций, в которых, благодаря применению набора инструкций AVX-512, удалось ускорить некоторые операции, применяемые при декодировании видео. Прирост производительности ассемблерного кода с инструкциями AVX-512 составил 94, 44, 64 и 4.24 раза по сравнению базовой реализацией, написанной на языке Си без использования SIMD-инструкций. В ассемблерном коде с оптимизациями на базе инструкций AVX-2 прирост составлял 67, 27, 55 и 4.38 раз, соответственно, а на основе инструкций SSSE3 - 40, 21, 29 и 2.49 раз. Изменения добавлены в состав библиотеки dav1d, предлагающей альтернативный декодировщик для формата кодирования видео AV1. Инструкции AVX-512 доступны в процессорах AMD на базе микроархитектур Zen 4 и 5, и в процессорах Intel на базе таких микроархитектур, как Skylake-X, Ice Lake, Tiger Lake и Rocket Lake...
·31.10.2024 В ядро Linux принят 21-строчный патч, ускоряющий прохождение теста per_thread_ops на 2.6% (117 +26)
  Джош Пуамбёф (Josh Poimboeuf) из компании Red Hat опубликовал патч для ядра Linux, ускоряющий на 2.6% прохождение теста "per_thread_ops", оценивающего число операций, которые могут быть выполнены в одном потоке. В патче используется маскирование указателей для снижения числа медленных вызовов barrier_nospec() в 64-битной функции copy_from_user(), применяемой для копирования данных в ядро из пространства пользователя. Линус Торвальдс внёс исправление в предложенный патч и перенёс оптимизированный код в состав ветки ядра 6.12...
·28.10.2024 В ядре Linux оптимизирована реализация алгоритма CRC32C (150 +46)
  Для включения в состав будущей ветки ядра Linux 6.13 предложен патч с переработанной реализацией алгоритма нахождения контрольной суммы CRC32C. Код реализации CRC32C уменьшен примерно в 10 раз (с 4546 до 418 байт). При выключенной защите retpoline от атак класса Spectre прирост производительности при использовании новой реализации достигает 11.8% на процессорах AMD Zen 2, 6.4% - Intel Emerald Rapids и 4.8% Intel Haswell. При включении retpoline прирост производительности более заметен и достигает 66.8% на системах с процессорами Intel Emerald Rapids, 35.0% - Intel Haswell и 29.5% - AMD Zen 2...
·05.07.2024 Разработчик WireGuard серьёзно ускорил вызов getrandom() в Linux (122 +59)
  Джейсон Доненфилд (Jason A. Donenfeld), автор VPN WireGuard, представил патчи, значительно ускоряющие получение случайных чисел от системы через функцию getrandom(), реализованную через соответствующий системный вызов Linux. Преимуществом такого решения по сравнению с использованием /dev/random или /dev/urandom является неподверженность атакам на исчерпание файловых дескрипторов, которые могут привести к неинициализированным и неслучайным криптографическим ключам...
Следующая страница (раньше) >>



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру