Subj : по цифровому представлению звуковых сигналов
Frequently Asked Questions (Часто Задаваемые Вопросы)
по цифровому представлению звуковых сигналов
Создан: 21.11.98
Последняя модификация: 16.04.99
Автор: Евгений Музыченко (Eugene Muzychenko)
2:5000/14@FidoNet, [email protected]
Copyright (C) 1998-99, Eugene V. Muzychenko
Все права в отношении данного текста принадлежат автору. При воспроиз-
ведении текста или его части сохранение Copyright обязательно. Коммер-
ческое использование допускается только с письменного разрешения авто-
ра.
При наличии изменений с момента последней публикации они отмечаются
знаком ">-".
----------------------------------------------------------------------
- Чем цифровое представление сигналов отличается от аналогового?
Традиционное аналоговое представление сигналов основано на подобии
(аналогичности) электрических сигналов (изменений тока и напряжения)
представленным ими исходным сигналам (звуковому давлению, температуре,
скорости и т.п.), а также подобии форм электрических сигналов в раз-
личных точках усилительного или передающего тракта. Форма электричес-
кой кривой, описывающей (также говорят - переносящей) исходный сигнал,
максимально приближена к форме кривой этого сигнала.
Такое представление наиболее точно, однако малейшее искажение формы
несущего электрического сигнала неизбежно повлечет за собой такое же
искажение формы и сигнала переносимого. В терминах теории информации,
количество информации в несущем сигнале в точности равно количеству
информации в сигнале исходном, и электрическое представление не содер-
жит избыточности, которая могла бы защитить переносимый сигнал от ис-
кажений при хранении, передаче и усилении.
Цифровое представление электрических сигналов призвано внести в них
избыточность, предохраняющую от воздействия паразитных помех. Для это-
го на несущий электрический сигнал накладываются серьезные ограничения
- его амплитуда может принимать только два предельных значения - 0 и
1. Вся зона возможных амплитуд в этом случае делится на три зоны: ниж-
няя представляет нулевые значения, верхняя - единичные, а промежуточ-
ная является запрещенной - внутрь нее могут попадать только помехи.
Таким образом, любая помеха, амплитуда которой меньше половины ампли-
туды несущего сигнала, не оказывает влияния на правильность передачи
значений 0 и 1. Помехи с большей амплитудой также не оказывают вли-
яния, если длительность импульса помехи ощутимо меньше длительности
информационного импульса, а на входе приемника установлен фильтр им-
пульсных помех.
Сформированный таким образом цифровой сигнал может переносить любую
полезную информацию, которая закодирована в виде последовательности
битов - нулей и единиц; частным случаем такой информации являются
электрические и звуковые сигналы. Здесь количество информации в несу-
щем цифровом сигнале значительно больше, нежели в кодированном исход-
ном, так что несущий сигнал имеет определенную избыточность относи-
тельно исходного, и любые искажения формы кривой несущего сигнала, при
которых еще сохраняется способность приемника правильно различать нули
и единицы, не влияют на достоверность передаваемой этим сигналом ин-
формации. Однако в случае воздействия значительных помех форма сигнала
может искажаться настолько, что точная передача переносимой информации
становится невозможной - в ней появляются ошибки, которые при простом
способе кодирования приемник не сможет не только исправить, но и обна-
ружить.
Для еще большего повышения стойкости цифрового сигнала к помехам и ис-
кажениям применяется цифровое избыточное кодирование двух типов: про-
верочные (EDC - Error Detection Code, обнаруживающий ошибку код) и
корректирующие (ECC - Error Correction Code, исправляющий ошибку код)
коды. Цифровое кодирование состоит в простом добавлении к исходной ин-
формации дополнительных битов и/или преобразовании исходной битовой
цепочки в цепочку большей длины и другой структуры. EDC позволяет
просто обнаружить факт ошибки - искажение или выпадение полезной либо
появление ложной цифры, однако переносимая информация в этом случае
также искажается; ECC позволяет сразу же исправлять обнаруженные ошиб-
ки, сохраняя переносимую информацию неизменной. Для удобства и надеж-
ности передаваемую информацию разбивают на блоки (кадры), каждый из
которых снабжается собственным набором этих кодов.
Каждый вид EDC/ECC имеет свой предел способности обнаруживать и ис-
правлять ошибки, за которым опять начинаются необнаруженные ошибки и
искажения переносимой информации. Увеличение объема EDC/ECC относи-
тельно объема исходной информации в общем случае повышает обнаружива-
ющую и корректирующую способность этих кодов.
В качестве EDC популярен циклический избыточный код CRC (Cyclic
Redundancy Check), суть которого состоит в сложном перемешивании ис-
ходной информации в блоке и формированию коротких двоичных слов, раз-
ряды которых находятся в сильной перекрестной зависимости от каждого
бита блока. Изменение даже одного бита в блоке вызывает значительное
изменение вычисленного по нему CRC, и вероятность такого искажения би-
тов, при котором CRC не изменится, исчезающе мала даже при коротких
(единицы процентов от длины блока) словах CRC. В качестве ECC исполь-
зуются коды Хэмминга (Hamming) и Рида-Соломона (Reed-Solomon), которые
также включают в себя и функции EDC.
Информационная избыточность несущего цифрового сигнала приводит к зна-
чительному (на порядок и более) расширению полосы частот, требуемой
для его успешной передачи, по сравнению с передачей исходного сигнала
в аналоговой форме. Кроме собственно информационной избыточности, к
расширению полосы приводит необходимость сохранения достаточно крутых
фронтов цифровых импульсов.
Кроме целей помехозащиты, информация в цифровом сигнале может быть
подвергнута также линейному или канальному кодированию, задача которо-
го - оптимизировать электрические параметры сигнала (полосу частот,
постоянную составляющую, минимальное и максимальное количество нуле-
вых/единичных импульсов в серии и т.п.) под характеристики реального
канала передачи или записи сигнала.
Полученный несущий сигнал, в свою очередь, также является обычным
электрическим сигналом, и к нему применимы любые операции с такими
сигналами - передача по кабелю, усиление, фильтрование, модуляция, за-
пись на магнитный, оптический или другой носитель и т.п. Единственным
ограничением является сохранение информационного содержимого - так,
чтобы при последующем анализе можно было однозначно выделить и декоди-
ровать переносимую информацию, а из нее - исходный сигнал.
----------------------------------------------------------------------
- Как звук представляется в цифровом виде?
Исходная форма звукового сигнала - непрерывное изменение амплитуды во
времени - представляется в цифровой форме с помощью "перекрестной дис-
кретизации" - по времени и по уровню.
Строго говоря, любой аналоговый сигнал в конечном счете тоже дискретен
как по времени, так и по величине - например, звуковой сигнал является
результатом взаимодействия конечного числа атомов или молекул газов и
твердых тел, электрический сигнал - результатом перемещения конечного
числа элементарных зарядов (электронов) и т.п. Поэтому, говоря о дис-
кретизации аналогового сигнала, имеют в виду значительно большую сте-
пень дискретности, которая поддается измерению приборами средней точ-
ности.
Согласно теореме Котельникова, любой непрерывный процесс с ограничен-
ным спектром может быть полностью описан дискретной последователь-
ностью его мгновенных значений, следующих с частотой, как минимум
вдвое превышающей частоту наивысшей гармоники процесса; частота Fd вы-
борки мгновенных значений (отсчетов) называется частотой дискретиза-
ции.
Из теоремы следует, что сигнал с частотой Fa может быть успешно дис-
кретизирован по времени на частоте 2Fa только в том случае, если он
является чистой синусоидой, ибо любое отклонение от синусоидальной
формы приводит к выходу спектра за пределы частоты Fa. Таким образом,
для временнОй дискретизации произвольного звукового сигнала (обычно
имеющего, как известно, плавно спадающий спектр), необходим либо выбор
частоты дискретизации с запасом, либо принудительное ограничение спек-
тра входного сигнала ниже половины частоты дискретизации.
Одновременно с временнОй дискретизацией выполняется амплитудная - из-
мерение мгновенных значений амплитуды и их представление в виде число-
вых величин с определенной точностью (квантование). Точность измерения
(двоичная разрядность N получаемого дискретного значения) определяет
уровень шума, вносимого квантованием, и динамический диапазон цифрово-
го сигнала (теоретически, для цифрового сигнала в чистом виде, это
взаимно-обратные величины, однако любой реальный тракт имеет также и
собственный уровень шумов и помех).
Полученный поток чисел (серий двоичных цифр), описывающий звуковой
сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code
Modulation, PCM), так как каждый импульс дискретизованного по времени
сигнала представляется собственным цифровым кодом.
Чаще всего применяют линейное квантование, когда числовое значение от-
счета пропорционально амплитуде сигнала. Из-за логарифмической природы
слуха более целесообразным было бы логарифмическое квантование, когда
числовое значение пропорционально величине сигнала в децибелах, однако
это сопряжено с трудностями чисто технического характера.
ВременнАя дискретизация и амплитудное квантование сигнала неизбежно
вносят в сигнал шумовые искажения, уровень которых принято оценивать
по формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варь-
ируется для разных типов сигналов: для чистой синусоиды это 1.7 дБ,
для звуковых сигналов - от -15 до 2 дБ. Отсюда видно, что к снижению
шумов в рабочей полосе частот 0..Fмакс приводит не только увеличение
разрядности отсчета, но и повышение частоты дискретизации относительно
2Fмакс, поскольку шумы квантования "размазываются" по всей полосе
вплоть до частоты дискретизации, а звуковая информация занимает только
нижнюю часть этой полосы.
В большинстве современных цифровых звуковых систем используются стан-
дартные частоты дискретизации 44.1 и 48 кГц, однако частотный диапазон
сигнала обычно ограничивается возле 20 кГц для оставления запаса по
отношению к теоретическому пределу. Также наиболее распространено
16-разрядное квантование по уровню, что дает предельное соотношение
сигнал/шум около 98 дБ. В студийной аппаратуре используются более вы-
сокие разрешения - 18-, 20- и 24-разрядное квантование при частотах
дискретизации 56, 96 и 192 кГц. Это делается для того, чтобы сохранить
высшие гармоники звукового сигнала, которые непосредственно не воспри-
нимаются слухом, но влияют на формирование общей звуковой картины.
Для оцифровки более узкополосных и менее качественных сигналов частота
и разрядность дискретизации могут снижаться; например, в телефонных
линиях применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц.
Представление аналогового сигнала в цифровом виде называется также им-
пульсно-кодовой модуляцией (ИКМ, PCM - Pulse Code Modulation), так как
сигнал представляется в виде серии импульсов постоянной частоты (вре-
меннАя дискретизация), амплитуда которых передается цифровым кодом
(амплитудная дискретизация). PCM-поток может быть как параллельным,
когда все биты каждого отсчета передаются одновременно по нескольким
линиям с частотой дискретизации, так и последовательным, когда биты
передаются друг за другом с более высокой частотой по одной линии.
Сам цифровой звук и относящиеся к нему вещи принято обозначать общим
термином Digital Audio; аналоговая и цифровая части звуковой системы
обозначаются терминами Analog Domain и Digital Domain.
----------------------------------------------------------------------
- Что такое АЦП и ЦАП?
Аналогово-цифровой и цифро-аналоговый преобразователи. Первый преобра-
зует аналоговый сигнал в цифровое значение амплитуды, второй выполняет
обратное преобразование. В англоязычной литературе применяются термины
ADC и DAC, а совмещенный преобразователь называют codec
(coder-decoder).
Принцип работы АЦП состоит в измерении уровня входного сигнала и выда-
че результата в цифровой форме. В результате работы АЦП непрерывный
аналоговый сигнал превращается в импульсный, с одновременным измерени-
ем амплитуды каждого импульса. ЦАП получает на входе цифровое значение
амплитуды и выдает на выходе импульсы напряжения или тока нужной вели-
чины, которые расположенный за ним интегратор (аналоговый фильтр)
превращает в непрерывный аналоговый сигнал.
Для правильной работы АЦП входной сигнал не должен изменяться в тече-
ние времени преобразования, для чего на его входе обычно помещается
схема выборки-хранения, фиксирующая мгновенный уровень сигнала и сох-
раняющая его в течение всего времени преобразования. На выходе ЦАП
также может устанавливаться подобная схема, подавляющая влияние пере-
ходных процессов внутри ЦАП на параметры выходного сигнала.
При временнОй дискретизации спектр полученного импульсного сигнала в
своей нижней части 0..Fa повторяет спектр исходного сигнала, а выше
содержит ряд отражений (aliases, зеркальных спектров), которые распо-
ложены вокруг частоты дискретизации Fd и ее гармоник (боковые полосы).
При этом первое отражение спектра от частоты Fd в случае Fd = 2Fa рас-
полагается непосредственно за полосой исходного сигнала, и требует для
его подавления аналогового фильтра (anti-alias filter) с высокой кру-
тизной среза. В АЦП этот фильтр устанавливается на входе, чтобы исклю-
чить перекрытие спектров и их интерференцию, а в ЦАП - на выходе, что-
бы подавить в выходном сигнале надтональные помехи, внесенные времен-
нОй дискретизацией.
----------------------------------------------------------------------
- Что такое передискретизация (oversampling)?
Это дискретизация сигнала с частотой, превышающей основную частоту
дискретизации. Передискретизации может быть аналоговой, когда с повы-
шенной частотой делаются выборки исходного сигнала, или цифровой, ког-
да между уже существующими цифровыми отсчетами вставляются дополни-
тельные, рассчитанные путем интерполяции. Другой способ получения зна-
чений промежуточных отсчетов состоит во вставке нулей, после чего вся
последовательность подвергается цифровой фильтрации. В АЦП использует-
ся аналоговая передискретизация, в ЦАП - цифровая.
Передискретизация используется для упрощения конструкций АЦП и ЦАП. По
условиям задачи на входе АЦП и выходе ЦАП должен быть установлен ана-
логовый фильтр с АЧХ, линейной в рабочем диапазоне и круто спадающей
за его пределами. Реализация такого аналогового фильтра весьма сложна;
в то же время при повышении частоты дискретизации вносимые ею отраже-
ния спектра пропорционально отодвигаются от основного сигнала, и ана-
логовый фильтр может иметь гораздо меньшую крутизну среза.
Другое преимущество передискретизации состоит в том, что ошибки ампли-
тудного квантования (шум дробления), распределенные по всему спектру
квантуемого сигнала, при повышении частоты дискретизации распределяют-
ся по более широкой полосе частот, так что на долю основного звукового
сигнала приходится меньшее количество шума. Каждое удвоение частоты
снижает уровень шума квантования на 3 дБ; поскольку один двоичный раз-
ряд эквивалентен 6 дБ шума, каждое учетверение частоты позволяет
уменьшить разрядность преобразователя на единицу.
Передискретизация вместе с увеличением разрядности отсчета, интерполя-
цией отсчетов с повышенной точностью и выводом их на ЦАП надлежащей
разрядности позволяет несколько улучшить качество восстановления зву-
кового сигнала. По этой причине даже в 16-разрядных системах нередко
применяются 18- и 20-разрядные ЦАП с передискретизацией.
АЦП и ЦАП с передискретизацией за счет значительного уменьшения време-
ни преобразования могут обходиться без схемы выборки-хранения.
----------------------------------------------------------------------
- Каковы достоинства и недостатки цифрового звука?
Цифровое представление звука ценно прежде всего возможностью бесконеч-
ного хранения и тиражирования без потери качества, однако преобразова-
ние из аналоговой формы в цифровую и обратно все же неизбежно приводит
к частичной его потере. Наиболее неприятные на слух искажения, вноси-
мые на этапе оцифровки - гранулярный шум, возникающий при квантовании
сигнала по уровню из-за округления амплитуды до ближайшего дискретного
значения. Гранулярный шум сильно коррелирован с сигналом (зависит от
него), и представляет собой гармоники сигнала, искажения от которых
наиболее заметны в верхней части спектра. Проявления гранулярного шума
и его связь сигналом легко заметить, прослушав синусоидальный сигнал с
частотой около 0.1..5 Гц - гранулярный шум в этом случае проявляется в
виде изменяющегося по высоте паразитного тона, частота которого зави-
сит от частоты, формы и максимальной амплитуды полезного сигнала.
Мощность гранулярного шума обратно пропорциональна количеству ступеней
квантования, однако из-за логарифмической характеристики слуха при ли-
нейном квантовании (постоянная величина ступени) на тихие звуки прихо-
дится меньше ступеней квантования, чем на громкие, и в результате ос-
новная плотность нелинейных искажений приходится на область тихих зву-
ков. Это приводит к ограничению динамического диапазона, который в
идеале (без учета гармонических искажений) был бы равен соотношению
сигнал/шум, однако необходимость ограничения этих искажений снижает
динамический диапазон для 16-разрядного кодирования до 50-60 дБ.
При восстановлении звука из цифровой формы в аналоговую возникает
проблема сглаживания ступенчатой формы сигнала и подавления гармоник,
вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров мо-
жет происходить либо недостаточное подавление этих помех, либо избы-
точное ослабление полезных высокочастотных составляющих. Плохо подав-
ленные гармоники частоты дискретизации искажают форму аналогового сиг-
нала (особенно в области высоких частот), что создает впечатление "ше-
роховатого", "грязного" звука.
----------------------------------------------------------------------
- Что такое Dithering и Noise Shaping?
Это в некотором роде искусственные методы обработки цифрового звуково-
го сигнала, направленные на улучшение субъективного качества звучания
ценой очевидного ухудшения его объективных характеристик (прежде всего
- коэффициента нелинейных искажений и соотношения сигнал/шум).
Dithering (сглаживание) заключается в добавлении к сигналу небольшого
количества шума (псевдослучайного цифрового сигнала) разного спектра
(белый, розовый и т.п.). При этом заметно ослабляется корреляция оши-
бок квантования с полезным сигналом ("рассеиваются" ошибки округления)
и, несмотря на некоторое увеличение шума, субъективное качество звуча-
ния заметно повышается. Уровень добавляемого шума выбирается в зависи-
мости от задачи и колеблется от половины младшего разряда отсчета до
нескольких разрядов.
Noise Shaping (формовка шума) заключается в преобразовании сильно за-
шумленного полезного сигнала с целью вытеснения чисто шумовых компо-
нент в надтональную область с выделением в нижней части спектра основ-
ной энергии полезного сигнала. По существу, Noise Shaping является од-
ним из видом PWM (Pulse Width Modulation - широтно-импульсная модуля-
ция, ШИМ) с дискретной шириной импульса. Сигнал, обработанный этим ме-
тодом, требует обязательной фильтрации с подавлением высоких частот -
это выполняется либо цифровым, либо аналоговым способом.
Основное применение Noise Shaping находит в области представления циф-
ровых сигналов отсчетами меньшей разрядности с повышенной частотой
следования. В delta-sigma ЦАП для повышения частоты следования отсче-
тов увеличивается в десятки раз частота дискретизации, на которой из
исходных многоразрядных отсчетов формируются серии отсчетов разряд-
ностью 1..3. Низкочастотная часть спектра потока этих отсчетов с высо-
кой точностью повторяет спектр исходного сигнала, а высокочастотная
содержит в основном чистый шум.
В случае преобразования цифрового сигнала к отсчетам более низкой раз-
рядности на той же частоте дискретизации Noise Shaping выполняется
вместе с операцией Dithering'а. Поскольку в этом случае повышение час-
тоты дискретизации невозможно, вместо этого спектр добавляемого шума
формируется таким образом, чтобы его низко- и среднечастотная часть
максимально точно повторяла слабую часть сигнала, заключенную в отсе-
каемых младших разрядах отсчетов. Благодаря этому основная энергия шу-
ма вытесняется в верхнюю часть рабочего диапазона частот, а в наиболее
слышимой области остаются вполне разборчивые следы слабого сигнала,
который иначе оказался бы полностью уничтоженным. Несмотря на то, что
объективные искажения сохраненного таким образом слабого сигнала очень
велики, его субъективное восприятие остается вполне приемлемым, позво-
ляя воспринимать на слух компоненты, уровень которых меньше младшего
разряда отсчета.
По существу, Dithering и Noise Shaping являются частными случаями од-
ной технологии - с той разницей, что в первом случае используется бе-
лый шум с равномерным спектром, а во втором - шум со спектром, специ-
ально сформированным под конкретный сигнал. Данная технология приводит
к "нестандартному" использованию цифрового формата, основанному на
особенностях человеческого слуха.
----------------------------------------------------------------------
- Как устроены и работают АЦП и ЦАП?
В основном применяется три конструкции АЦП:
- параллельные - входной сигнал одновременно сравнивается с эталонными
уровнями набором схем сравнения (компараторов), которые формируют на
выходе двоичное значение. В таком АЦП количество компараторов равно (2
в степени N) - 1, где N - разрядность цифрового кода (для восьмираз-
рядного - 255), что не позволяет наращивать разрядность свыше 10-12.
- последовательного приближения - преобразователь при помощи вспомога-
тельного ЦАП генерирует эталонный сигнал, сравниваемый со входным.
Эталонный сигнал последовательно изменяется по принципу половинного
деления (дихотомии), который используется во многих методах сходящего-
ся поиска прикладной математики. Это позволяет завершить преобразова-
ние за количество тактов, равное разрядности слова, независимо от ве-
личины входного сигнала.
- с измерением временнЫх интервалов - широкая группа АЦП, использующая
для измерения входного сигнала различные принципы преобразования уров-
ней в пропорциональные временнЫе интервалы, длительность которых изме-
ряется при помощи тактового генератора высокой частоты. Иногда называ-
ются также считающими АЦП.
Среди АЦП с измерением временнЫх интервалов преобладают следующие три
типа:
- последовательного счета, или однократного интегрирования
(single-slope) - в каждом такте преобразования запускается генератор
линейно возрастающего напряжения, которое сравнивается со входным.
Обычно такое напряжение получают на вспомогательном ЦАП, подобно АЦП
последовательного приближения.
- двойного интегрирования (dual-slope) - в каждом такте преобразования
входной сигнал заряжает конденсатор, который затем разряжается на ис-
точник опорного напряжения с измерением длительности разряда.
- следящие - вариант АЦП последовательного счета, при котором генера-
тор эталонного напряжения не перезапускается в каждом такте, а изменя-
ет его от предыдущего значения до текущего.
Наиболее популярным вариантом следящего АЦП является Sigma-Delta, ра-
ботающий на частоте Fs, значительно (в 64 и более раз) превышающей
частоту дискретизации Fd выходного цифрового сигнала. Компаратор тако-
го АЦП выдает значения пониженной разрядности (обычно однобитовые -
0/1), сумма которых на интервале дискретизации Fd пропорциональна ве-
личине отсчета. Последовательность малоразрядных значений подвергается
цифровой фильтрации и понижению частоты следования (decimation), в ре-
зультате чего получается серия отсчетов с заданной разрядностью и час-
тотой дискретизации Fd.
Для улучшения соотношения сигнал/шум и снижения влияния ошибок кванто-
вания, которое в случае однобитового преобразователя получается до-
вольно высоким, применяется метод формовки шума (Noise Shaping) через
схемы обратной связи по ошибке и цифрового фильтрования. В результате
применения этого метода форма спектра шума меняется так, что основная
шумовая энергия вытесняется в область выше половины частоты Fs, незна-
чительная часть остается в нижней половине, и практически весь шум
удаляется из полосы исходного аналогового сигнала.
ЦАП в основном строятся по двум принципам:
- взвешивающие - с суммированием взвешенных токов или напряжений, ког-
да каждый разряд входного слова вносит соответствующий своему двоично-
му весу вклад в общую величину получаемого аналогового сигнала; такие
ЦАП называют также параллельными или многоразрядными (multibit).
- Sigma-Delta, по принципу действия обратные АЦП этого же типа. Вход-
ной цифровой сигнал подвергается значительной (64x и более) передис-
кретизации и подается на модулятор, формирующий малоразрядные (обычно
однобитовые) значения, обрабатываемые методом Noise Shaping (обычно
реализуемым посредством цифрового фильтра и обратной связи по ошибке).
Полученные в результате малоразрядные отсчеты управляют схемой выдачи
эталонных зарядов, которые со столь же высокой частотой добавляются к
выходному сигналу.
Типы ЦАП, выдающих истинно одноразрядный поток, называют bitstream
(поток битов) или PDM (Pulse Density Modulation - модуляция плотностью
импульсов). Несколько другой тип представляют ЦАП с широтно-импульсной
модуляцией (ШИМ, Pulse Width Modulation, PWM), когда на схему выбор-
ки-хранения аналогового сигнала выдаются импульсы постоянной амплитуды
и переменной длительности, управляя дозированием выдаваемого на выход
заряда. На этом принципе работают преобразователи MASH (Multi-stAge
noise SHaping - многостадийная формовка шума) фирмы Matsushita. В них
сигнал обратной связи по ошибке получают сразу несколько схем формовки
шума, управляющих шириной выходного импульса.
Различие ЦАП типа PDM и PWM в основном состоит в том, что максимальная
ширина импульса в PWM не равна степени двойки (например, для MASH она
равна 11).
ЦАП с передискретизацией и малым числом реальных разрядов обладают
значительно лучшей линейностью, нежели параллельные ЦАП той же эффек-
тивной разрядности. Форма выходного сигнала таких ЦАП представляет со-
бой полезный сигнал, обрамленный значительным количеством высокочас-
тотного шума, основная энергия которого достаточно далеко отстоит от
верхней частоты полезного сигнала и потому эффективно подавляется даже
простейшим аналоговым фильтром.
Эффективная разрядность Delta-Sigma ЦАП обычно определяется из пара-
метров выходного сигнала - уровня шума и коэффициента нелинейных иска-
жений, характерных для параллельного ЦАП определенной разрядности. При
этом эффективная разрядность Delta-Sigma ЦАП может значительно превы-
шать разрядность его входного сигнала - например, ЦАП для 16-разрядно-
го цифрового сигнала может иметь эффективную разрядность 18, 20 и бо-
лее, сглаживая исходный сигнал, уменьшая в нем влияние ошибок кванто-
вания и тем самым делая его более комфортным для слухового восприятия.
ЦАП являются "прямыми" устройствами, в которых преобразование выполня-
ется проще и быстрее, чем в АЦП, которые в большинстве своем - после-
довательные и более медленные устройства.
----------------------------------------------------------------------
- Какие интерфейсы используются для передачи цифрового звука?
S/PDIF (Sony/Philiрs Digital Interface Format - формат цифрового ин-
терфейса фирм Sony и Philiрs) - цифровой интерфейс для бытовой радио-
аппаратуры.
AES/EBU (Audio Engineers Society / European Broadcast Union - общество
звукоинженеров / европейское вещательное объединение) - цифровой ин-
терфейс для студийной радиоаппаратуры.
Оба интерфейса являются последовательными и используют одинаковый фор-
мат сигнала и систему кодирования - самосинхронизирующийся код BMC
(Biphase-Mark Code - код с представлением единицы двойным изменением
фазы), и могут передавать сигналы в формате PCM разрядностью до 24 бит
на частотах дискретизации до 48 кГц.
Каждый отсчет сигнала передается 32-разрядным словом (кадром), в кото-
ром 20 разрядов используются для передачи отсчета, а 12 - для формиро-
вания синхронизирующей преамбулы, передачи дополнительной информации и
бита четности. 4 разряда из служебной группы могут использоваться для
расширения формата отсчетов до 24 разрядов.
192 последовательных кадра образуют блок, начало которого отмечается
специальным кодом преамбулы первого кадра.
Помимо бита четности, служебная часть слова содержит бит достоверности
(Validity), который должен быть нулевым для каждого достоверного от-
счета. В случае приема слова с единичным битом Validity либо с наруше-
нием четности в слове приемник трактует весь отсчет как ошибочный и
может на выбор либо заменить его предыдущим значением, либо интерполи-
ровать на основе нескольких соседних достоверных отсчетов. Отсчеты,
помеченные как недостоверные, могут передавать CD-проигрыватели,
DAT-магнитофоны и другие устройства, если при считывании информации с
носителя не удалось скорректировать возникшие в процессе чтения ошиб-
ки.
В служебную часть слова входят также биты C (Channel Status - состо-
яние канала) и U (User Bit - бит пользователя). Последовательная це-
почка каждого из этих битов, взятых по одному из каждого кадра блока,
образует 192-разрядное слово служебных битов блока, где передается ин-
формация о названии произведения, номере дорожки, идентификаторе пере-
дающего устройства, субкодах компакт-диска и т.п. В S/PDIF передаются
параметры защиты от копирования (SCMS).
Стандартно формат кодирования предназначен для передачи одно- и двух-
канального сигнала, однако при использовании служебных разрядов для
кодирования номера канала возможна передача многоканального сигнала.
С электрической стороны S/PDIF предусматривает соединение коаксиальным
кабелем с волновым сопротивлением 75 Ом и разъемами типа RCA ("тюль-
пан"), амплитуда сигнала - 0.5 В. AES/EBU предусматривает соединение
симметричным экранированным двухпроводным кабелем с трансформаторной
развязкой по интерфейсу RS-422 с амплитудой сигнала 3-10 В, разъемы -
трехконтактные типа Cannon XLR. Существуют также оптические варианты
приемопередатчиков - TosLink (пластмассовое оптоволокно) и AT&T Link
(стеклянное оптоволокно).
----------------------------------------------------------------------
- Какие методы используются для эффективного сжатия цифрового звука?
В настоящее время наиболее известны Audio MPEG, PASC и ATRAC. Все они
используют так называемое "кодирование воспринимаемого" (perceptual
coding) при котором из звукового сигнала удаляется информация, малоза-
метная для слуха. В результате, несмотря на изменение формы и спектра
сигнала, его слуховое восприятие практически не меняется, а степень
сжатия оправдывает незначительное уменьшение качества. Такое кодирова-
ние относится к методам сжатия с потерями (lossy compression), когда
из сжатого сигнала уже невозможно точно восстановить исходную волновую
форму.
Приемы удаления части информации базируются на особенности человечес-
кого слуха, называемой маскированием: при наличии в спектре звука вы-
раженных пиков (преобладающих гармоник) более слабые частотные состав-
ляющие в непосредственной близости от них слухом практически не вос-
принимаются (маскируются). При кодировании весь звуковой поток разби-
вается на мелкие кадры, каждый из которых преобразуется в спектральное
представление и делится на ряд частотных полос. Внутри полос происхо-
дит определение и удаление маскируемых звуков, после чего каждый кадр
подвергается адаптивному кодированию прямо в спектральной форме. Все
эти операции позволяют значительно (в несколько раз) уменьшить объем
данных при сохранении качества, приемлемого для большинства слушате-
лей.
Каждый из описанных методов кодирования характеризуется скоростью би-
тового потока (bitrate), с которой сжатая информация должна поступать
в декодер при восстановлении звукового сигнала. Декодер преобразует
серию сжатых мгновенных спектров сигнала в обычную цифровую волновую
форму.
Audio MPEG - группа методов сжатия звука, стандартизованная MPEG
(Moving Pictures Experts Group - экспертной группой по обработке дви-
жущихся изображений). Методы Audio MPEG существуют в виде нескольких
типов - MPEG-1, MPEG-2 и т.д.; в настоящее время наиболее распростра-
нен тип MPEG-1.
Существует три уровня (layers) Audio MPEG-1 для сжатия стереофоничес-
ких сигналов:
1 - коэффициент сжатия 1:4 при потоке данных 384 кбит/с;
2 - 1:6..1:8 при 256..192 кбит/с;
3 - 1:10..1:12 при 128..112 кбит/с.
Минимальная скорость потока данных в каждом уровне определяется в 32
кбит/с; указанные скорости потока позволяют сохранить качество сигнала
примерно на уровне компакт-диска.
Все три уровня используют входное спектральное преобразование с разби-
ением кадра на 32 частотные полосы. Наиболее оптимальным в отношении
объема данных и качества звука признан уровень 3 со скоростью потока
128 кбит/с и плотностью данных около 1 Мб/мин. При сжатии с более низ-
кими скоростями начинается принудительное ограничение полосы частот до
15-16 кГц, а также возникают фазовые искажения каналов (эффект типа
фэйзера или фленжера).
Audio MPEG используется в компьютерных звуковых системах, CD-i/DVD,
"звуковых" дисках CD-ROM, цифровом радио/телевидении и других системах
массовой передачи звука.
PASC (Precision Adaptive Sub-band Coding - точное адаптивное внутрипо-
лосное кодирование) - частный случай Audio MPEG-1 Layer 1 со скоростью
потока 384 кбит/с (сжатие 1:4). Применяется в системе DCC.
ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование
адаптивным преобразованием) базируется на стереофоническом звуковом
формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц.
При сжатии каждый кадр делится на 52 частотные полосы, результирующая
скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе
MiniDisk.
----------------------------------------------------------------------
- Какие форматы используются для представления цифрового звука?
Понятие формата используется в двух различных смыслах. При использова-
нии специализированного носителя или способа записи и специальных ус-
тройств чтения/записи в понятие формата входят как физические характе-
ристики носителя звука - размеры кассеты с магнитной лентой или дис-
ком, самой ленты или диска, способ записи, параметры сигнала, принципы
кодирования и защиты от ошибок и т.п. При использовании универсального
информационного носителя широкого применения - например, компьютерного
гибкого или жесткого диска - под форматом понимают только способ коди-
рования цифрового сигнала, особенности расположения битов и слов и
структуру служебной информации; вся "низкоуровневая" часть, относяща-
яся непосредственно к работе с носителем, в этом случае остается в ве-
дении компьютера и его операционной системы.
Из специализированных форматов и носителей цифрового звука в настоящее
время наиболее известны следующие:
- CD (Compact Disk - компакт-диск) - односторонний пластмассовый диск
с оптической лазерной записью и считыванием, диаметром 120 или 90 мм,
вмещающий максимум 74 минуты стереозвучания с частотой дискретизации
44.1 кГц и 16-разрядным линейным квантованием. Система предложена фир-
мами Sony и Philips и носит название CD-DA (Compact Disk - Digital
Audio). Для защиты от ошибок используется двойной код Рида-Соломона с
перекрестным перемежением (Cross Interleaved Reed-Solomon Code, CIRC)
и модуляция кодом Хэмминга 8-14 (Eight-to-Fourteen Modulation, EFM).
Различаются штампованные (CD) однократно записываемые (CD-R) и многок-
ратно перезаписываемые (CD-RW) компакт-диски.
- ИКМ-приставка (PCM deck) - система для преобразования цифрового зву-
кового сигнала в псевдовидеосигнал, совместимый с популярными виде-
оформатами (NTSC, PAL/SECAM), и обратно. ИКМ-приставки применяются в
сочетании с бытовыми (VHS) или студийными (S-VHS, Beta, U-Matic) виде-
омагнитофонами, используя их в качестве устройств чтения/записи. Ус-
тройства работают с 16-разрядным линейным квантованием на частотах
дискретизации 44.056 кГц (NTSC) и 44.1 кГц (PAL/SECAM), и позволяют
записывать двух- или четырехканальную цифровую сигналограмму. По сути,
такая приставка представляет собой модем (модулятор-демодулятор) для
видеосигнала.
- S-DAT (Stationary head Digital Audio Tape - цифровая звуковая лента
с неподвижной головкой) - система наподобие обычного кассетного магни-
тофона, запись и чтение в которой ведутся блоком неподвижных тонкопле-
ночных головок на ленте шириной 3.81 мм в двухсторонней кассете разме-
ром 86 x 55.5 x 9.5 мм. Реализует 16-разрядную запись двух или четырех
каналов на частотах 32, 44.1 и 48 кГц.
- R-DAT (Rotary head Digital Audio Tape - цифровая звуковая лента с
вращающейся головкой) - система наподобие видеомагнитофона с попереч-
но-наклонной записью вращающимися головками. Наиболее популярный фор-
мат ленточной цифровой записи, системы R-DAT часто обозначаются просто
DAT. В R-DAT используется кассета размером 73 x 54 x 10.5 мм, с лентой
шириной 3.81 мм, а сама система кассеты и магнитофона очень похожа на
типовой видеомагнитофон. Базовая скорость движения ленты - 8.15 мм/с,
скорость вращения блока головок - 2000 об/мин. R-DAT работает с двух-
канальным (в ряде моделей - четырехканальным) сигналом на частотах
дискретизации 44.1 и 48 кГц с 16-разрядном линейным квантованием, и 32
кГц - с 12-разрядным нелинейным. Для защиты от ошибок используется
двойной код Рида-Соломона и модуляция кодом 8-10. Емкость кассеты -
80..240 минут в зависимости от скорости и длины ленты. Бытовые
DAT-магнитофоны обычно оснащены системой защиты от незаконного копиро-
вания фонограмм, не допускающей записи с аналогового входа на частоте
44.1 кГц, а также прямого цифрового копирования при наличии запреща-
ющих кодов SCMS (Serial Code Managenent System). Студийные магнитофоны
таких ограничений не имеют.
- DASH (Digital Audio Stationary Head) - система с записью на магнит-
ную ленту шириной 6.3 и 12.7 мм в продольном направлении неподвижными
головками. Скорость движения ленты - 19.05, 38.1, 76.2 см/с. Реализует
16-разрядную запись с частотами дискретизации 44.056, 44.1 и 48 кГц от
2 до 48 каналов.
- ADAT (Alesis DAT) - собственная (proprietary) система восьмиканаль-
ной записи звука на видеокассету типа S-VHS, разработанная фирмой
Alesis. Использует 16-разрядное линейное квантование на частоте 48
кГц, емкость кассеты составляет до 60 минут на каждый канал. Магнито-
фоны ADAT допускают каскадное соединение, в результате чего может быть
собрана система 128-канальной синхронной записи. Для ADAT выпускается
множество различных интерфейсных блоков для сопряжения с DAT, CD, MIDI
и т.п. Модель Meridian (ADAT Type II) использует 20-разрядное кванто-
вание на частотах 44.1 и 48 кГц.
- DCC (Digital Compact Cassette - цифровая компакт-кассета) - бытовая
система записи в продольном направлении на стандартную компакт-кассе-
ту, разработанная Philips. Скорость движения ленты - 4.76 см/с, макси-
мальное время звучания такое же, как при аналоговой записи. Частоты
дискретизации - 32, 44.1, 48 кГц, разрешение - 16/18 разрядов (метод
сжатия PASC). На DCC-магнитофонах могут воспроизводиться (но не запи-
сываться) обычные аналоговые компакт-кассеты. В настоящее время систе-
ма DCC признана неперспективной.
- MD (MiniDisk) - бытовая и концертная система записи на магнитоопти-
ческий диск, разработанная Sony. Диск диаметром 64 мм, помещенный в
пластмассовый футляр размером 70 x 67.5 x 5 мм, вмещает 74 минуты (60
в ранних версиях) стереофонического звучания. При обмене со внешними
устройствами используется формат 16-разрядных отсчетов на частоте 44.1
кГц, однако на сам диск сигнал записывается после сжатия методом
ATRAC.
Из универсальных компьютерных форматов наиболее популярны следующие:
- Microsoft RIFF/WAVE (Resource Interchange File Format/Wave - формат
файлов передачи ресурсов/волновая форма) - стандартный формат звуковых
файлов в компьютерах IBM PC. Файл этого формата содержит заголовок,
описывающий общие параметры файла, и один или более фрагментов
(chunks), каждый из которых представляет собой волновую форму или
вспомогательную информацию - режимы и порядок воспроизведения, помет-
ки, названия и координаты участков волны и т.п. Файлы этого формата
имеют расширение .WAV.
- Apple AIFF (Audio Interchange File Format - формат файла обмена зву-
ком) - стандартный тип звукового файла в системах Apple Macintosh. По-
хож на RIFF и также позволяет размещать вместе со звуковой волной до-
полнительную информацию, в частности - самплы WaveTable-инструментов
вместе с параметрами синтезатора.
- Формат "чистой оцифровки" RAW, не содержащий заголовка и представля-
ющий собой только последовательность отсчетов звуковой волны. Обычно
оцифровка хранится в 16-разрядном знаковом (signed) формате, когда
первыми в каждой паре идут отсчеты левого канала, хотя могут быть и
исключения.
----------------------------------------------------------------------
- Как выполняется обработка цифрового звука?
Цифровой звук обрабатывается посредством математических операций, при-
меняемых к отдельным отсчетам сигнала, либо к группам отсчетов различ-
ной длины. Выполняемые математические операции могут либо имитировать
работу традиционных аналоговых средств обработки (микширование двух
сигналов - сложение, усиление/ослабление сигнала - умножение на кон-
станту, модуляция - умножение на функцию и т.п.), либо использовать
альтернативные методы - например, разложение сигнала в спектр (ряд
Фурье), коррекция отдельных частотных составляющих, затем обратная
"сборка" сигнала из спектра.
Обработка цифровых сигналов подразделяется на линейную (в реальном
времени, над "живым" сигналом) и нелинейную - над предварительно запи-
санным сигналом. Линейная обработка требует достаточного быстродей-
ствия вычислительной системы (процессора); в ряде случаев невозможно
совмещение требуемого быстродействия и качества, и тогда используется
упрощенная обработка с пониженным качеством. Нелинейная обработка ни-
как не ограничена во времени, поэтому для нее могут быть использованы
вычислительные средства любой мощности, а время обработки, особенно с
высоким качеством, может достигать нескольких минут и даже часов.
Для обработки применяются как универсальные процессоры общего назначе-
ния - Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC - так и специали-
зированные цифровые сигнальные процессоры (Digital Signal Processor,
DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog Devices
ADSP-xxxx и др.
Разница между универсальным процессором и DSP состоит в том, что пер-
вый ориентирован на широкий класс задач - научных, экономических, ло-
гических, игровых и т.п., и содержит большой набор команд общего наз-
начения, в котором преобладают обычные математические и логические
операции. DSP специально ориентированы на обработку сигналов и содер-
жат наборы специфический операций - сложение с ограничением, перемно-
жение векторов, вычисление математического ряда и т.п. Реализация даже
несложной обработки звука на универсальном процессоре требует значи-
тельного быстродействия и далеко не всегда возможна в реальном време-
ни, в то время как даже простые DSP нередко справляются в реальном
времени с относительно сложной обработкой, а мощные DSP способны вы-
полнять качественную спектральную обработку сразу нескольких сигналов.
В силу своей специализации DSP редко применяются самостоятельно - чаще
всего устройство обработки имеет универсальный процессор средней мощ-
ности для управления всем устройством, приема/передачи информации,
взаимодействия с пользователем, и один или несколько DSP - собственно
для обработки звукового сигнала. Например, для реализации надежной и
быстрой обработки сигналов в компьютерных системах применяют специали-
зированные платы с DSP, через которые пропускается обрабатываемый сиг-
нал, в то время как центральному процессору компьютера остаются лишь
функции управления и передачи.
----------------------------------------------------------------------
- Что представляет собой цифровая звуковая рабочая станция?
Digital Audio Workstation (DAW) представляет собой специализированную
или универсальную компьютерную систему, способную выполнять запись,
хранение, воспроизведение и обработку цифрового звука. Специализиро-
ванные системы ориентированы исключительно на работу с цифровым звуком
и выпускаются в законченном исполнении, допускающем лишь ограниченное
расширение, либо нерасширяемые вообще. Универсальные системы представ-
ляют собой обычный персональный компьютер, снабженный средствами для
ввода/вывода звука (ЦАП/АЦП и/или цифровые интерфейсы) и набором прог-
рамм для его записи, воспроизведения и обработки. Кроме этого, станция
может содержать и другие компоненты - например, аппаратные модули циф-
ровой обработки, музыкальные синтезаторы, записывающие CD-приводы и
т.п.
Поскольку любая компьютерная система является сильным источником высо-
кочастотных помех, возникают определенные проблемы в достижении про-
фессионального качества звука при использовании встроенных АЦП/ЦАП. В
таких случаях предпочтительно использование внешних модулей АЦП/ЦАП,
выдающих и получающих цифровую информацию в реальном времени через
универсальные или собственные цифровые интерфейсы.
----------------------------------------------------------------------
- Какие жесткие диски используются в рабочих станциях?
Большинство специализированных рабочих станций используют для хранения
звука жесткие диски с интерфейсом SCSI (Small Computer System
Interface - интерфейс малых компьютерных систем), ставшие универсаль-
ным стандартом - любая популярная компьютерная система имеет возмож-
ность подключения этих дисков. Достоинствами SCSI является универсаль-
ность среди всех компьютерных систем, возможность подключения до семи
устройств (любых, не только дисковых) к одному контроллеру, хороший
арбитраж при конкуренции устройств, интеллектуальность каждого устрой-
ства, более высокое общее качество исполнения, возможность использова-
ния интерфейса для прямой связи между двумя станциями. К недостаткам
SCSI следует отнести высокую стоимость интерфейсов и дисков и ограни-
ченный спектр выпускаемых моделей.
В компьютерах типа IBM PC более популярны жесткие диски с интерфейсом
IDE (Integrated Drive Electronics - электроника, встроенная в накопи-
тель), не получившие распространения в других системах. Достоинства
IDE-дисков - простота, хорошая производительность, не уступающая боль-
шинству SCSI-дисков, а в ряде случаев - превосходящая их, низкая сто-
имость, массовый выпуск, широкий спектр моделей. Недостатки - низкая
производительность и надежность моделей низших классов, возможность
подключения только двух накопителей к одному контроллеру, невозмож-
ность прямого соединения двух станций, часто худшая поддержка драйве-
рами операционных систем.
----------------------------------------------------------------------
- Есть ли преимущества у SCSI перед IDE при цифровой записи?
Среди пользователей звуковых рабочих станций - как домашних, так и
студийных - бытует мнение, что только диски SCSI способны обеспечить
нужное быстродействие. Однако, несмотря на ряд очевидных преимуществ
SCSI, большинство даже профессиональных рабочих станций на IBM PC
вполне может обходиться дисками IDE. Скорость чтения/записи типовых
моделей IDE-дисков сегодня (конец 1998 г.) находится на уровне 6-10
Мб/с при времени поиска около 8-10 мс, что равнозначно таким же типо-
вым (не High End) моделям SCSI.
Такой жесткий диск свободно справляется с одновременным чтением
16-разрядных звуковых данных по 20-30 звуковым каналам на частоте дис-
кретизации 48 кГц, и несколько меньшим объемом данных в случае записи.
Другое дело, что в случае SCSI его внутренняя оптимизация (сортировка
запросов для минимизации перемещения головок в SCSI-2) часто маскирует
неоптимальную работу ОС и звуковой программы, а для достижения такого
уровня на IDE может потребоваться хороший драйвер ОС и аккуратно сде-
ланная программа (например, DDClip).
Причины нелюбви многих пользователей к IDE-дискам происходят оттого,
что с этими дисками они обычно сталкиваются в дешевых, некачественно
собранных и протестированных компьютерах средней мощности, состоящих
из разномастных компонент, нередко плохо совместимых друг с другом. И
напротив - SCSI-диски чаще всего ставятся в более мощные и дорогие мо-
дели, содержащие компоненты "уважаемых" производителей, более тщатель-
но собранные и проверенные. Замена во втором варианте диска SCSI на
IDE примерно равной производительности и сборка/настройка системы с
учетом особенностей IDE во многих случаях не окажет заметного влияния
на ее производительность.
----------------------------------------------------------------------
- Зачем в цифровой записи применяются жесткие диски класса AV?
Класс AV (Audio/Video) у жестких дисков означает их способность пре-
дельно равномерно, без пауз, записывать и считывать потоки данных. Та-
кие диски снабжаются внутренним буфером большего размера и не прерыва-
ют процесса чтения/записи термокалибровкой системы позиционирования.
Для систем цифровой записи, имеющих недостаточное быстродействие и
объемы ОЗУ, чтобы сгладить возможные неравномерности в работе обычных
дисков, диски класса AV являются единственным возможным выходом.
Следует иметь в виду, что наличие аббревиатуры AV в обозначении диска
еще не означает его принадлежности к классу Audio/Video - об этом дол-
жно быть явно упомянуто в паспорте диска.
Однако указанная особенность в общем случае необходима только при ра-
боте с качественной видеоинформацией, скорость поступления которой
составляет порядка 10 мегабайт в секунду на канал. В случае же звуко-
вых систем скорость одноканального 16-разрядного потока с частотой
дискретизации 48 кГц на два порядка меньше и составляет всего 94 кило-
байта в секунду. В то же время почти никакая рабочая станция не в сос-
тоянии обеспечить одновременную работу с сотней каналов, как и жесткий
диск не в состоянии параллельно обрабатывать такое количество данных,
расположенных в разных его участках. В реальных применениях многока-
нальной записи на одном диске основная часть накладных расходов диско-
вой подсистемы ложится на перемещение головок между участками записи,
а отнюдь не на саму передачу данных. Низкая же скорость звуковых пото-
ков делает более удобной и надежной их буферизацию в ОЗУ компьютера,
компенсирующую термокалибровку диска в течение 0.5 - 1 с, нежели ис-
пользование дорогих и редких дисков AV-класса. К тому же далеко не на
всех обычных дисках термокалибровка оказывает заметное влияние на рав-
номерность потока данных.
"Рваная" передача данных может также возникать при использовании "неп-
равильной" операционной системы (DOS, Windows без 32-разрядного драй-
вера диска и т.п.), недостаточном количестве и размере файловых буфе-
ров ОС и записывающей программы, применении дисков низкого класса со
скоростью передачи порядка 1-2 мегабайт в секунду и ниже, неправильном
подключении диска и т.п. В любом случае, такие ситуации чаще всего го-
ворят о неправильной конфигурации и настройке аппаратной и программной
части системы.
----------------------------------------------------------------------
- Искажается ли цифровой сигнал при передаче и хранении?
Поскольку любой цифровой сигнал представляется реальной электрической
кривой напряжения или тока - его форма так или иначе искажается при
любой передаче, а "замороженный" для хранения сигнал (сигналограмма)
подвержен деградации в силу обычных физических причин. Все эти воздей-
ствия на форму несущего сигнала являются помехами, которые до опреде-
ленной величины не изменяют информационного содержания сигнала, как
отдельные искажения и выпадения букв в словах обычно не мешают пра-
вильному пониманию этих слов, причем избыточность информации, как и
увеличение длины слов, повышает вероятность успешного распознавания.
Другими словами, сам несущий сигнал может искажаться, однако переноси-
мая им информация - закодированный звуковой сигнал - в абсолютном
большинстве случаев остается неизменной.
Для того, чтобы качество несущего сигнала не ухудшалось, любая переда-
ча полезной звуковой информации - копирование, запись на носитель и
считывание с него - обязательно должна включать операцию восстановле-
ния формы несущего сигнала, а в идеале - и первичного цифрового вида
сигнала информационного, и лишь после этого заново сформированный не-
сущий сигнал может быть передан следующему потребителю. В случае пря-
мого копирования без восстановления (например, обычным переписыванием
видеокассеты с цифровым сигналом, полученным при помощи ИКМ-приставки,
на обычных видеомагнитофонах) качество цифрового сигнала ухудшается,
хотя он по-прежнему полностью содержит всю переносимую им информацию.
Однако после многократного последовательного копирования или длитель-
ного хранения качество ухудшается настолько, что начинают возникать
неисправимые ошибки, необратимо искажающие переносимую сигналом инфор-
мацию. Поэтому копирование и передачу цифровых сигналов необходимо
вести только в цифровых устройствах, а при хранении на носителях -
своевременно "освежать" не дожидаясь необратимой деградации (для маг-
нитных носителей этот срок оценивается в несколько лет). Правильно пе-
реданная или обновленная цифровая сигналограмма качества не теряет и
может копироваться и существовать вечно в абсолютно неизменном виде.
Тем не менее, не следует забывать, что корректирующая способность лю-
бого кода конечна, а реальные носители далеки от идеальных, поэтому
возникновение неисправимых ошибок - на такая уж редкая вещь, особенно
при неаккуратном обращении с носителем. При чтении с новых и правильно
хранимых DAT-кассет или компакт-дисков в качественных и надежных аппа-
ратах таких ошибок практически не возникает, однако при старении, заг-
рязнении и повреждении носителей и считывающих систем их становится
больше. Одиночная неисправленная ошибка почти всегда незаметна на слух
благодаря интерполяции, однако она приводит к искажению формы исходно-
го звукового сигнала, а накопление таких ошибок со временем начинает
ощущаться и на слух.
Отдельную проблему составляет сложность регистрации неисправленных
ошибок, а также проверки идентичности оригинала и копии. Чаще всего
конструкторы цифровых звуковых устройств, работающих в реальном време-
ни, не озабочены вопросом точной проверки достоверности передачи, счи-
тая вполне достаточными меры, принятые для коррекции ошибок. Невозмож-
ность в общем случае повторной передачи ошибочного отсчета или блока
приводит к тому, что интерполяция происходит скрытно и после копирова-
ния нельзя с уверенностью сказать, точно ли скопирован исходный сиг-
нал. Индикаторы ошибки, имеющиеся в ряде устройств, обычно включаются
только в момент ее возникновения, и в случае одиночных ошибок их сра-
батывание легко может остаться незамеченным. Даже в системах на основе
персональных компьютеров чаще всего нет возможности контролировать
правильность приема по цифровому интерфейсу или прямого считывания CD;
выходом является только многократное повторение операции и сравнение
результатов.
И наконец, в принципе возможны ситуации, когда даже незначительные
ошибки способны необратимо исказить передаваемую информацию, оставшись
при этом незамеченными системой передачи. Другое дело, что вероятность
возникновения подобных ошибок исчезающе мала (порядка одной на нес-
колько лет непрерывной передачи сигнала), поэтому такую возможность
практически нигде не принимают в расчет.
----------------------------------------------------------------------
- Страдает ли качество сигнала при цифровой обработке?
Прежде всего, необходимо различать "искажающие" и "неискажающие" виды
обработки. К первым относятся операции, изменяющие форму и структуру
сигнала - смешивание, усиление, фильтрация, модуляция и т.п., ко вторым -
операции монтажа (вырезка, вклейка, наложение) и переноса (копирования).
Качество сигнала может страдать только при "искажающей" обработке,
причем любой - и аналоговой, и цифровой. В первом случае это происхо-
дит в результате внесения шумов, гармонических, интермодуляционных и
других искажений в узлах аналогового тракта, во втором - благодаря ко-
нечной точности квантования сигнала и математических вычислений. Все
цифровые вычисления выполняются в некоторой разрядной сетке фиксиро-
ванной длины - 16, 20, 24, 32, 64, 80 и более бит; увеличение разряд-
ности сетки повышает точность вычислений и уменьшает ошибки округле-
ния, однако в общем случае не может исключить их полностью. Конечная
точность квантования первичного аналогового сигнала приводит к тому,
что даже при абсолютно точной обработке полученного цифрового сигнала
квантованное значение каждого отсчета все равно отличается от своего
идеального значения. Для минимизации искажений при обработке в студиях
предпочитают обрабатывать и хранить сигналограммы на мастер-носителях
с повышенным разрешением (20, 24 или 32 разряда), даже если результат
будет тиражироваться на носителе с меньшим разрешением.
Кроме собственно ошибок вычислений и округления, на точность сильно
влияет выбор представления числовых отсчетов сигнала при обработке.
Традиционное представление PCM с так называемой фиксированной точкой
(fixed point), когда отсчеты представляются целыми числами, наиболее
удобно и влечет минимум накладных расходов, однако точность вычислений
зависит от масштаба операций - например, при умножении образуются чис-
ла вдвое большей разрядности, которые потом приходится приводить об-
ратно к разрядности исходных отсчетов, а это может привести к перепол-
нению разрядной сетки. Компромиссным вариантом служит промежуточное
увеличение разрядности отсчетов (например, 16->32), что снижает веро-
ятность переполнения, однако требует большей вычислительной мощности,
объема памяти и вносит дополнительные искажения при обратном понижении
разрядности. Кроме того, снижению погрешности способствует правильный
выбор последовательности коммутативных (допускающих перестановку) опе-
раций, группировка дистрибутивных операций, учет особенностей работы
конкретного процессора и т.п.
Другим способом увеличения точности является преобразование отсчетов в
форму с плавающей точкой (floating point) с разделением на значащую
часть - мантиссу и показатель величины - порядок. В этой форме все
операции сохраняют разрядность значащей части, и умножение не приводит
к переполнению разрядной сетки. Однако, как само преобразование между
формами с фиксированной и плавающей точкой, так и вычисления в этой
форме требуют на порядки большего быстродействия процессора, что силь-
но затрудняет их использование в реальном времени.
Несмотря на то, что качество сигнала (относительно исходного аналого-
вого) неизбежно, хоть и незначительно, ухудшается при любой "искажа-
ющей" цифровой обработке, некоторые операции при определенных условиях
являются полностью и однозначно обратимыми. Например, усиление сигнала
по амплитуде в три раза заключается в умножении каждого отсчета на
три; если эта операция выполнялась с фиксированной точкой и при этом
не возникло переполнения, с помощью деления на три потом можно будет
вернуть все отсчеты в исходное состояние, тем самым полностью восста-
новив первоначальное состояние сигнала.
Сказанное выше демонстрирует, что ухудшение качества при "искажающей"
цифровой обработке совсем не обязательно накапливается со временем,
хотя в большинстве реальных применений происходит именно так. Кроме
того, это не означает, что любая операция цифрового усиления всегда
будет однозначно обратимой - это зависит от многих особенностей приме-
нения операции.
При сравнении аккуратности аналоговой и цифровой обработки нужно иметь
в виду, что оба вида вносят в сигнал некоторое количество погрешнос-
тей, которые можно рассматривать как шум, однако каждый вид обработки
имеет свои особенности. Любой элемент аналогового тракта вносит шум
всегда, однако его величина колеблется в зависимости от качества трак-
та и вида обработки. При цифровой обработке "первичный" шум всегда
вносится самим фактом квантования, а внутри цифрового тракта его могут
вносить только операции с ограниченной точностью (например, описанное
умножение на три шума не добавляет - оно лишь усиливает ранее внесен-
ные шумы, и шум квантования в том числе).
Из этого следует, что точные операции не изменяют соотношения сиг-
нал/шум цифрового сигнала, однако могут увеличивать ошибки первичного
квантования. Таким образом, увеличение точности цифровой обработки са-
мо по себе не гарантирует хорошего качества сигнала - необходимо еще и
достаточно точное квантование. Например, 20-разрядное квантование в
сочетании с 24-разрядной обработкой уже может успешно соперничать со
многими аналоговыми устройствами, в то время как такая же обработка
при 16-разрядном квантовании существенно им уступает.
Грамотно и качественно реализованная цифровая обработка может давать
существенно меньший уровень искажений, чем такая же аналоговая, разве
что это будут искажения разных видов.
----------------------------------------------------------------------
- Страдает ли качество сигнала при преобразованиях форматов?
Только в том случае, когда в процессе преобразования применяются "ис-
кажающие" операции - изменение разрядности отсчета, частоты дискрети-
зации, фильтрование, сжатие с потерями и т.п. Простое увеличение раз-
рядности отсчета с сохранением частоты дискретизации будет неискажа-
ющим, однако такое же увеличение, сопряженное с применением сглажива-
ющей функции - уже нет. Уменьшение разрядности отсчета всегда является
искажающей операцией, кроме случая, когда преобразуемые отсчеты были
получены таким же простым увеличением разрядности - равной или мень-
шей.
Многие форматы отличаются друг от друга только порядком битов в слове,
отсчетов левого и правого каналов в потоке и служебной информацией -
заголовками, контрольными суммами, помехозащитными кодами и т.п. Точ-
ный способ проверки неискажаемости сигнала заключается в преобразова-
нии нескольких различных потоков (файлов) формата F1 в формат F2, а
затем обратно в F1. Если информационная часть каждого потока (файла)
при этом будет идентична исходной - данный вид преобразования можно
считать неискажающим.
Под информационной частью потока (файла) понимается собственно набор
данных, описывающих звуковой сигнал; остальная часть считается служеб-
ной и на форму сигнала в общем случае не влияет. Например, если в слу-
жебной части файла или потока предусмотрено поле для времени его соз-
дания (передачи), то даже в случае полного совпадения информационных
частей двух разных файлов или потоков их служебные части окажутся раз-
личными, и это будет зафиксировано логическим анализатором в случае
потока или программой побайтного сравнения - в случае файла. Кроме
этого, временной сдвиг одного сигнала относительно другого, возника-
ющий при выравнивании цифрового потока по границам слов или блоков и
состоящий в добавлении нулевых отсчетов в начало и/или конец файла или
потока, также приводит к их кажущемуся цифровому несовпадению. В таких
ситуациях для проверки идентичности цифровых сигналов необходимо поль-
зоваться специальной аппаратурой или программой.
----------------------------------------------------------------------
- Как преобразовать цифровой звук из одного формата в другой?
Для "перегонки" звука между специализированными системами, имеющими
совместимые цифровые интерфейсы, достаточно соединить их цифровым ка-
белем и переписать звук с одной системы на другую; в ряде сочетаний
устройств при этом возможно ухудшение качества сигнала из-за уменьше-
ния разрядности отсчета, передискретизации или сжатия звука. Например,
при копировании звука между одинаковыми системами MiniDisk через ин-
терфейс S/PDIF сжатый звуковой поток на передающей стороне подвергает-
ся восстановлению, а на приемной - повторному сжатию. Вследствие не-
симметричности алгоритма ATRAC в звук при повторном сжатии будут вне-
сены добавочные искажения.
Для преобразования компьютерного файла в другой формат используются
программы-конверторы: WAV2AIFF/AIFF2WAV, Convert, AWave и другие - на
IBM PC, SoundExtractor, SampleEditor, BST - на Apple Macintosh.
Обмен звуковой информацией между компьютерной и специализированной
системой нередко возможен несколькими способами:
- Прямой перенос по цифровому интерфейсу, если у обоих систем имеются
совместимые цифровые интерфейсы. При этом на компьютерной системе ис-
пользуется программа записи/воспроизведения, формирующая или воспроиз-
водящая стандартный для данной системы звуковой файл.
- Чтение/запись на специализированных системах стандартных компьютер-
ных носителей. Например, ряд музыкальных рабочих станций использует
гибкие диски в форматах стандартных файловых систем IBM PC или
Macintosh, либо позволяет прочитать или создать такой диск.
- Чтение и запись на компьютерной системе специализированных носителей
и их специальных форматов, если это позволяет аппаратура и программное
обеспечение. Таким образом читаются и пишутся дискеты от Ensoniq,
AKAI, Emulator, компакт-диски ряда "чужих" систем, а также читаются и
пишутся обычные звуковые компакт-диски.
----------------------------------------------------------------------
- Какие компьютерные программы используются для обработки звука?
На IBM PC наиболее популярны редакторы Cool Edit Pro (Syntrillium)
Sound Forge (Sonic Foundry), WaveLab (Steinberg) и системы многодоро-
жечной записи SAW Plus, Samplitude, N-Track и DDClip. На Apple
Macintosh используются программ Alchemy, Deck II, DigiTracks,
HyperPrism.
----------------------------------------------------------------------
- Какие платы применяются для работы с цифровым звуком на IBM PC?
Для любительской работы со звуком, не требующей высокого качества, в
принципе достаточно любой звуковой карты, качество которой удовлетво-
ряет ее владельца. Самые дешевые карты типа Edison, Sky Rocket, Media
Vision, Sound Blaster Vibra и т.п. обладают достаточно низким качес-
твом преобразования звука. Более хорошим звучанием из простых карт об-
ладают некоторые модели Sound Blaster AWE32, Gravis Ultrasound, Turtle
Beach Tropez и некоторые другие. Все эти карты ориентированы на шину
ISA и работают с 16-разрядным звуком.
Минимальным уровнем карт, пригодных для более-менее серьезной работы
со звуком, принято считать снятую с производства Turtle Beach Tahiti
(16 разрядов, 18-разрядный ЦАП) и ее выпускаемый ныне улучшенный вари-
ант Fiji (20 разрядов). Эти карты также сделаны под ISA. Для Fiji су-
ществует отдельная дочерняя плата электрического интерфейса S/PDIF.
Представляет интерес 20-разрядная карта Terratec EWS64XL, АЦП и ЦАП
которой обеспечивают 16- и 18-разрядную точность, а электрический и
оптический интерфейс S/PDIF - 20-разрядную.
Более высокий класс ISA-карт представлен серией 24-разрядных карт AdB
Multi!Wav с цифровыми интерфейсами S/PDIF и AES/EBU и синхронизацией
Word Clock: Digital Pro18 (18-разрядный мониторный ЦАП), Digital Pro24
(24-разрядный мониторный ЦАП), Analog Pro24 (24-разрядные ЦАП и АЦП,
без цифровых интерфейсов). 20-разрядная карта Zefiro Acoustics ZA-2
имеет электрические и оптические интерфейсы S/PDIF и AES/EBU, 24-раз-
рядный DSP и мониторный ЦАП.
Спектр карт для шины PCI открывает давно известная, хоть и устаревшая,
AudioMedia III (24 разряда, четыре 18-разрядных АЦП/ЦАП, вход/выход
S/PDIF, 24-разрядная обработка в DSP). В последнее время популярны три
24-разрядные карты Event Electonics с 20-разрядными ЦАП/АЦП и 24-раз-
рядным DSP: Darla (2 АЦП, 8 ЦАП), Gina (2 АЦП, 8 ЦАП, S/PDIF) и Layla
(8 АЦП и 10 ЦАП в выносном модуле, S/PDIF, MIDI, Word Clock).
----------------------------------------------------------------------
- Связана ли разрядность отсчета с разрядностью канала передачи?
Никоим образом. В сущности, почти все современные АЦП и ЦАП - и 16-, и
20-, и 24-разрядные - работают с последовательными потоками однобито-
вых данных, точно так же передается информация в большинстве цифровых
интерфейсов и хранится на цифровых носителях. При этом частота следо-
вания отдельных битов, составляющих отсчет, повышается настолько, что-
бы обеспечить передачу нужного количества битов в течение интервала
дискретизации, что полностью эквивалентно параллельной передаче отсче-
тов непосредственно с частотой дискретизации.
Также в ряде систем используется последовательно-параллельная переда-
ча, когда отсчеты передаются группами битов меньшей длины (обычно бай-
тами). Например, большинство 16-разрядных компьютерных звуковых карт
использует для передачи отсчетов 8-разрядные каналы прямого доступа к
памяти (DMA), где каждый 16-разрядный отсчет передается последователь-
ностью из двух байтов. Пропускной способности DMA достаточно для од-
новременной передачи более десяти стереофонических 16-разрядных звуко-
вых потоков с частотой дискретизации 44.1 кГц, так что такие карты ни-
чуть не уступают моделям, использующим 16-разрядные каналы, а разница
в качестве звука обусловлена сугубо параметрами АЦП и ЦАП.
----------------------------------------------------------------------
- Что такое джиттер?
Jitter - дрожание (быстрые колебания) фазы синхросигналов в цифровых
системах, приводящее к неравномерности во времени моментов срабатыва-
ния тактируемых этими сигналами цифровых устройств. Сами по себе циф-
ровые устройства нечувствительны к таким колебаниям, пока они не дос-
тигают значительной величины по сравнению с общей длительностью им-
пульсов, однако в "пограничных" устройствах, находящихся на стыке циф-
ровой и аналоговой частей схемы - АЦП и ЦАП - джиттер приводит к не-
равномерности моментов срабатывания компараторов АЦП или ключей ЦАП,
приводящей к нарушению соответствия форм аналогового и цифрового сиг-
налов. Ошибки, возникающие из-за джиттера, сродни ошибкам округления
при квантовании, однако степень их корреляции с сигналом зависит от
построения схемы. В первом приближении можно считать, что джиттер по-
рождает дополнительный шум и паразитные частотные составляющие, иска-
жая исходные составляющие, особенно в высокочастотной области.
Джиттер может возникать из-за любой нестабильности напряжений и токов
в области ЦАП/АЦП. Например, колебания питающих напряжений изменяют
частоту опорного генератора, наводки на провода и печатные дорожки ис-
кажают форму цифровых сигналов. Даже если эти искажения не изменяют
информационного содержимого сигнала - заключенной в нем битовой после-
довательности, они могут нарушить равномерность опроса входного звуко-
вого сигнала в АЦП или выдачу выходного сигнала с ЦАП и привести к ис-
кажениям формы, особенно заметной в области высоких частот.
Величина джиттера обозначает максимальное абсолютное отклонение момен-
та перехода тактового сигнала из одного состояния в другое от расчет-
ного значения, и измеряется в секундах. Величина джиттера, достаточная
для искажения звука, аналогичного изменению младшего разряда отсчета,
может быть оценена по формуле:
t = arcsin ( 1 / 2**N ) / ( 2 * pi * f ),
где t - отклонение в секундах, N - разрядность отсчета, f - максималь-
ная частота звукового сигнала. "**" обозначает возведение в степень.
Для 16-разрядного отсчета и частоты 20 кГц получается величина порядка
120 пс.
Указанная формула справедлива только для предельного случая, когда
временные отклонения приходятся на моменты наиболее быстрого изменения
звукового сигнала. В среднем же искажения несколько меньше, а допусти-
мая величина джиттера - больше и примерно оценивается по формуле:
t = sqrt (3) / ( 2**N * 2 * pi * f ),
что для тех же параметров сигнала дает около 210 пс (sqrt обозначает
квадратный корень). Для 20-разрядного отсчета эта величина составляет
около 13 пс.
Для борьбы с джиттером используется тактирование АЦП и ЦАП высокоста-
бильными генераторами, а для подавления неравномерности цифрового по-
тока, поступающего на ЦАП - промежуточными буферами типа FIFO (оче-
редь). Для уменьшения влияния помех применяются обычные методы - экра-
нирование, развязки, исключение "земляных петель", раздельные источни-
ки питания, питание критичных схем от аккумулятора и т.п. Хорошие ре-
зультаты дают внешние модули ЦАП, в которых реализованы описанные ме-
тоды - например, Audio Alchemy DAC-in-the-Box и другие.
Необходимо различать "пограничный" джиттер, действующий на границах
аналоговой и цифровой части схемы - в области АЦП или ЦАП, и "внутрен-
ний", возникающий в любых других участках чисто цифровой схемы. Вли-
яние на звуковой сигнал имеет только "пограничный" джиттер, ибо только
он непосредственно связан с преобразованием аналогового звукового сиг-
нала. Весь "внутренний" джиттер при грамотном построении схемы должен
полностью подавляться в интерфейсных цепях, однако некорректная реали-
зация может пропускать его и непосредственно на ЦАП/АЦП.
----------------------------------------------------------------------
- Может ли джиттер передаваться при копировании?
Возникающий в цепях формирования, обработки, передачи, записи и чтения
цифровых сигналов "внутренний" джиттер вполне может распространяться
по системе, выходить за ее пределы и переноситься между системами че-
рез цифровые интерфейсы передачи или цифровые же носители информации.
При этом величина джиттера может как ослабляться, так и усиливаться.
При использовании интерфейсов передачи со "встроенным" (embedded) син-
хросигналом, а также при чтении с любого носителя, приемная сторона
вынуждена синхронизироваться с передатчиком путем использования систем
фазовой автоподстройки частоты (ФАПЧ, Phase Locked Loop - PLL), кото-
рая вносит дополнительные дрожания, будучи не в состоянии мгновенно
отслеживать изменения фазы и частоты принимаемого сигнала.
Один из возможных способов ослабления джиттера при передаче - исполь-
зование синхронных интерфейсов с отдельным тактовым сигналом (Word
Clock), а еще лучше - асинхронных двунаправленных с возможностью сог-
ласования темпа передачи, наподобие RS-232. В этом случае стороны мо-
гут не опасаться возможного опустения или переполнения буфера на при-
емном конце, передача может выполняться блоками с более высокой ско-
ростью, чем идет вывод звука, а приемная сторона может использовать
полностью независимый стабильный генератор для извлечения отсчетов из
буфера. Однако все это имеет смысл только в том случае, когда приемник
работает непосредственно на ЦАП - при записи на носитель неравномер-
ности такой величины влияния на качество звука не оказывают.
Таким образом, в корректно реализованной системе все виды джиттера,
возникающие в чисто цифровых блоках и между ними, являются "внутренни-
ми" и должны быть подавлены до передачи цифрового сигнала на ЦАП для
оконечного преобразования. Это может быть сделано при помощи промежу-
точного буфера, схемы ФАПЧ с плавным изменением частоты генератора
(медленное изменение в небольших пределах, в отличие от дрожания,
практически не ощущается на слух), или каким-либо другим методом.
----------------------------------------------------------------------
- Может ли один и тот же цифровой сигнал звучать по-разному?
Для слуховой оценки звукового сигнала его необходимо воспроизвести ли-
бо одновременно на двух разных системах, либо последовательно - на од-
ной. Даже если в обоих случаях сам цифровой сигнал будет одинаковым,
набор сопутствующих условий - аппарат, носитель, его микроструктура,
первичные сигналы при считывании информации, особенности работы деко-
деров, спектр аналоговых шумов и помех - почти всегда будет различен.
Все эти побочные процессы могут создавать паразитные наводки, искажа-
ющие форму цифрового сигнала, порождающие джиттер, воздействующие на
цепи питания и прочие аналоговые компоненты системы. В правильно скон-
струированных и тщательно выполненных аппаратах все эти влияния должны
быть подавлены до уровня, недоступного восприятию, однако для большин-
ства бытовых и особенно бюджетных аппаратов это не так.
Могут быть и более прозаичные причины для возникновения разницы - та-
кие, как неустойчивое считывание цифрового носителя, при котором деко-
дер не в состоянии однозначно восстановить закодированный звуковой
сигнал и вынужден прибегать к его интерполяции, ухудшающей качество
звучания. Такая же интерполяция или гашение отсчетов происходит в слу-
чае ошибочного их приема по цифровым межсистемным интерфейсам, что мо-
жет быть вызвано плохим качеством или чрезмерной длиной кабеля, воз-
действием на него сильных помех, неисправностью приемника или передат-
чика, плохой их совместимостью и т.п. Поэтому вопрос о сравнении зву-
чания должен рассматриваться только после того, как доказана идентич-
ность цифровых потоков, поступающих на оконечный ЦАП. Под ЦАП здесь
должен пониматься именно неделимый, "самый последний" преобразователь,
а не произвольное сложное устройство, получающее на входе цифровой
сигнал и выдающее на выходе аналоговый.
----------------------------------------------------------------------
- Как проверить идентичность двух цифровых звуковых сигналов?
Наиболее универсальным и удобным является сложение в противофазе, ког-
да один сигнал складывается с другим, предварительно инвертированным.
Для синхронных одинаковых сигналов такая операция даст абсолютную ти-
шину. В случае различных сигналов результат будет различаться от эф-
фекта гребенчатого фильтра (небольшой постоянный временной сдвиг между
одинаковыми сигналами, на слух напоминает перекос головки в магнитофо-
не) до обычного смешивания (совершенно различные сигналы или временной
сдвиг более нескольких десятков микросекунд).
Для получения этим методом корректного результата необходимо, чтобы
оба сигнала были синхронны - начинались в один и тот же момент времени
и имели одинаковую длину. Для двух сигналов, записанных с реального
источника через АЦП, этого достичь принципиально невозможно, поэтому
имеет смысл подвергать сравнению исходный сигнал (полученный любым
способом) и его цифровую копию - сделанную внутри рабочей станции,
пропущенную через цифровой интерфейс, записанную на цифровой носитель
и т.п. В этом случае сравнение покажет правильность копирования и пе-
редачи цифровых сигналов.
Синхронность сигнала и копии обеспечивается удалением из них участка
начальной тишины (серии нулевых отсчетов) - такая операция имеется во
многих цифровых станциях. В противном случае тишину можно убрать вруч-
ную, удалив начальный участок до первого ненулевого отсчета. Одинако-
вой длины сигналов добиваться не обязательно - это повлияет лишь на
слышимость концевого участка результата, соответствующего более длин-
ному из сигналов.
----------------------------------------------------------------------
- Где найти информацию по цифровому звуку и методам работы с ним?
www.digido.com - Digital Domain
members.tripod.com/~FAQ_Home/Audio.html - Audio FAQ's
www.moscomag.orc.ru/~insys/articls/sigmadlt/sigma01.htm - хорошее опи-
сание технологии Sigma-Delta ЦАП и АЦП.
www.ktk.ru/~avb - Домашняя аудиостудия
----------------------------------------------------------------------
Большое спасибо всем приславшим ответы, рекомендации, замечания и со-
веты для этого FAQ.
Текст FAQ в альтернативной кодировке доступен для FReq на
2:5000/14@FidoNet по имени DGAUDFAQ, FAQ по компьютерным звуковым тех-
нологиям - SOUNDFAQ, по звуковым картам - SNDHWFAQ. Полный пакет FAQ и
описаний доступен на ftp://spider.nrcde.ru/pub/text/tech/emtcfaqs.zip
и через страницу FAQ на http://spider.nrcde.ru. Пакет распространяется
также по FIDO fileecho XHRDDOCS.