> 1) Проц автоматически сохраняет несколько регистров.Какая разница, если каждая запись в RAM все равно машинный цикл, даже если он один такт? Тот же STM32 25 слов (при наличии FP) хреначит в стек и столько же потом вытаскивает. А это, простите, уже 50 тактов.
> 2) Проц гарвард на уровне физики и поэтому фетчит код из флеша в то же время пока идет запись в SRAM.
Во-первых, по разному бывает. На том же STM32 порой нужно выполнять код из RAM. Во-вторых, ко времени выполнения обработчика прерываний это имеет очень косвенное отношение.
> 3) Кто сказал что их ВСЕ надо сохранять?
Если просто в вызываемой функции, то только в соответствии с ABI. Но в обработчике прерываний, уж простите, как минимум все регистры, которые будут в этом обработчике использованы. Вне зависимости от ABI.
> 4) скипнув восстановление и пересохранение
По сравнению с программно доступными регистрами - копейки. Причем речь уже о частном случае. Векторов прерываний у МК не так уж много. Даже в STM32 - по одному вектору на 8 GPIO.
> Если надо совсем жестко
Мы же про время выполнения обработчика прерываний говорим. А так да, сам бывало на критические задачи STM8 или ATTINY ставил в таком монопольном режиме. До Paduk так до сих пор и не добрался, хотя подобные задачи - уж точно для них. При цене то в 2-3 цента за корпус.
> Как бы сейчас стало модно встраивать 1-2 ОУ
Это редкость. У ST только в STM32G4/L4. Да и для вышеописанной задачи два ОУ ничем не помогут. Даже самые простенькие лабораторные прототипы АФАР требовали сотню-другую ОУ. А уж серийные - свыше тысячи.