12 лет назад 5 октября 2006 в 11:09 275

Посмотрим, действительно ли невозможно создать качественный домашний кинотеатр на базе PC.

Помимо этого материала в этом году состоятся четыре крупных открытых (совместно с читателями) тестирования, а также два российских соревнования “Мультимедиа-Звук”, организованных Лигой Автозвуковых Соревнований и лабораторией FLab при участии Upgrade. И, естественно, в “Новом железе” по-прежнему будут периодически появляться обзоры наиболее качественных мультимедийных систем.

Читатели, интересующиеся мультимедийным звуком, частенько присылают нам письма с просьбой расшифровать те или иные характеристики и термины, встречающиеся в статьях о мультимедиа. Поэтому теперь в каждой статье будем публиковать врезки-памятки, а для начала, чтобы весь год с терминами заминок не было, мы опубликуем два материала с расшифровкой самых часто встречающихся терминов. Собственно, первая часть статьи, посвященная объективным характеристикам звукового тракта, сейчас перед вами.

Особенно сильно углубляться в материал мы не будем и постараемся ограничиться только самой необходимой информацией. Да не обидятся на нас наиболее любознательные читатели, но да учтут они, что объем материалов по этой теме очень велик. Талмудом, состоящим только из распечаток статей отечественной метрессы Ирины Алдошиной, можно легко контузить незадачливого аудиофила. Впрочем, те, кого такой объем не пугает, могут найти дополнительную информацию в интернет-архивах.

Приступим.
Структура сигнала

Предположим, что у нас есть некая музыкальная запись. Многие современные записи сделаны с использованием инструментов и семплов. Сигнал инструмента состоит из основного тона, частота которого определяет ноту, и гармоник (aka обертонов), по структуре которых мы определяем его неповторимый характер звучания (основной тон также является гармоникой, первого порядка). Структура, в свою очередь, определяется соотношением уровней гармоник (грубо говоря, соотношением их громкостей) и фазовыми (временнЫми) отношениями. Кроме того, гармоники имеют определенную динамику, которая определяется скоростью их нарастания и убывания (этот фактор также формирует характер звучания инструмента).

Структура семплов, как правило, еще сложнее, поскольку она может состоять из нескольких простых звуков с собственными тембрами. Кроме того, во всех фонограммах обязательно присутствует реверберация, вносимая реальным или смоделированным звукорежиссером помещением. Реверберация складывается из ранних отражений от стен и потолков и многократных переотражений на определенных частотах (зависит от свойств помещения). Другие эффекты, применяемые при создании фонограмм, также вносят дополнительную информацию в сигнал.

Тем не менее, критичные моменты для всей фонограммы те же, что и для одного инструмента. Значит, для того чтобы правильно воспроизвести запись, аппаратура должна правильно передать все перечисленные выше особенности сигналов. То есть, сохранить неизменным соотношение уровней гармоник и основных тонов всех звуков, фазовые соотношения между ними, а также динамику. Всего-то ничего.

Искажения сигнала и характеристики, их описывающие

Однако у аудиоаппаратуры есть богатый набор проблем, благодаря которому она благополучно с описанными задачами не справляется. Конструктивных особенностей, из-за которых происходят искажения сигнала, мы постараемся лишний раз не касаться, поскольку полагаем, что большая часть из вас в ближайшее время не будет заниматься разработкой аудиоаппаратуры. Мы рассмотрим только то, что интересует нас как конечных пользователей, – виды искажений, возникающих во всех устройствах мультимедийного аудиотракта, их влияние на восприятие сигнала и характеристики, по которым эти искажения можно оценить.

Все вносимые аппаратурой в сигнал искажения подразделяют на линейные и нелинейные. Первые искажают существующую структуру фонограммы, не добавляя в нее ничего нового. Вторые, нелинейные, вносят в нее примеси, которых изначально в структуре сигнала не содержалось.

Кроме них, существует еще одно пакостящее звук явление под названием шумы. Это суть дополнительные примеси, которых в изначальном сигнале не было. Но, в отличие от искажений, они имеют сложный спектр, который по форме не зависит от вида и уровня сигнала.

Линейные искажения

Очевидно, что для правильной передачи соотношения уровней основных тонов и гармоник различных инструментов аппаратура должна воспроизводить весь частотный диапазон с одинаковой громкостью. И аппаратура с этой задачей более или менее успешно справляется. Звуковые карты и усилители – скорее более успешно, чем менее. А акустические системы aka колонки, как правило, справляются скорее менее успешно, чем более: перепады громкости лучших аппаратов класса hi-fi и high end составляют ±2 дБ, а многие мультимедийные системы воспроизводят спектр частот с неравномерностью ±5 дБ (перепады АЧХ у отдельных китайских конструкций достигают 24 дБ).

Характеристика, описывающая отношение амплитуды сигнала и частоты, называется амплитудно-частотной (АЧХ). Как правило, для описания характеристики приводится график, иллюстрирующий эту зависимость. В идеале, для правильной передачи тембра записи график должен быть горизонтальной прямой.

Что происходит с фонограммой при искажении АЧХ, догадаться несложно. Меняется соотношение уровней, соответственно, тембр инструментов или звуков становится другим. Отдельные инструменты и звуки будут звучать громче, чем другие, какие-то фрагменты фонограммы станут незаметными. Как именно будет система влиять на звук и насколько сильно влияние будет заметно, зависит от особенностей конкретного аудиотракта.

Наиболее заметны будут перепады, которые находятся в диапазоне от 1000 до 4500 Гц – в этой области сосредоточена наибольшая часть звуковой информации, и к тому же в этой области наш слух наиболее восприимчив. Наименее заметны перепады АЧХ в области ниже 100 Гц и выше 10 кГц. Самыми неприятными моментами являются резкие подъемы АЧХ в районе 2-3 кГц, которые делают звук неприятно резким, и в районе 7 кГц, из-за которых звучание приобретает “металлический” окрас.

Наиболее неприятно, когда подъемы выражены резкими пиками, а вот узкие провалы частотной характеристики, как правило, сильного неприятного эффекта на звук не оказывают (провалы уже трети октавы вообще неким “среднестатистическим человеческим ухом” не воспринимаются). Если подъемы и провалы становятся продолжительными, их влияние оказывается довольно заметным, но (если их “края” плавные) не таким неприятным. Если же диапазон приподнят “по обоим краям”, это обычно сказывается на звуке хорошо, во всяком случае применительно к мультимедиа, когда прослушивание происходит при громкости ниже 92 дБ.

Существует еще одна родственная АЧХ характеристика. Это угловая диаграмма направленности, которая иллюстрирует, насколько сильно меняется АЧХ системы при смещении слушателя относительно центральной оси акустической системы (если при смещении измерительного микрофона на 30 градусов АЧХ в верхней части спектра “обваливается” на 3 дБ, это очень хороший результат). Таким образом, по этой характеристике можно оценить, насколько широкую область прослушивания может обеспечить акустическая система.

В принципе, по АЧХ системы можно определить многие особенности звучания систем, но мы, пожалуй, на этом остановимся. Нам нужно разобраться с еще большим количеством искажений и описывающих их параметров.
Другой тип линейных искажений – фазочастотные. Они возникают из-за того, что система воспроизводит отдельные частоты с задержкой относительно других. В результате нарушаются временные соотношения между обертонами инструментов и между звучанием разных инструментов и семплов в фонограмме. Фазочастотные искажения описывает фазочастотная характеристика. Как правило, для описания этой характеристики приводится график, напоминающий график АЧХ, только вместо амплитуды сигнала по горизонтальной оси откладывается фаза сигнала.

График ФЧХ иллюстрирует смещения фазы относительно нуля. Как и в случае с амплитудно-частотными искажениями, искажения фазы в разных частях спектра воспринимаются по-разному. Наиболее заметны перепады фазы в районе средних частот и нижней середины спектра, их влияние на звук становится заметным, если фаза отклоняется больше чем на 15 градусов. Эти искажения меняют тембр инструментов и могут давать ощущение неразборчивости звука.
Опять же, как и в случае с АЧХ, наиболее заметны и неприятны резкие всплески характеристики. Если плавный перепад фазы градусов на 20 вполне можно проигнорировать, то резкая ФЧХ приведет к появлению заметных неприятных слуховых ощущений.

Для описания крутизны этих перепадов также используется такая характеристика, как групповое время задерживания (ГВЗ). Однако мы ее не приводим, поскольку необходимую информацию о крутизне перепадов (поворотов) фазы можно получить из обычного графика ФЧХ или из графика Rz. Для их интерпретации, кроме вышесказанного, достаточно знать, что фазовые перепады наиболее неприятны и заметны в районе 2 кГц, наименее заметны на частотах ниже 500 Гц и существенно заметны в остальном диапазоне (выше 5-6 кГц).

Наконец, третий и последний вид линейных искажений – переходные. Это изменения динамики сигнала, то есть скорости его нарастания и убывания. Естественно, изменения всегда происходят в сторону падения скорости нарастания и затухания.

Переходные характеристики аппаратуры очень значимы для формирования звуковой картины. Оценить их влияние на звук достаточно просто, для этого надо только добраться до хорошей пары акустических мониторов ценовой категории до $1000-1500 за пару. В такую акустику обычно ставят динамики с хорошими частотными характеристиками, а также устанавливают сложные блоки коррекции АЧХ и ФЧХ. Во встроенных усилителях используют специализированные и качественные дискретные элементы и микросхемы, поэтому уровни гармонических и интермодуляционных искажений оказываются на грани восприятия.

И вроде хорошо тембр такая система передает, и не утомляет при прослушивании. Но звук такой, как будто перед динамиками стоят ватные подушки. Нечеткий и неразборчивый. А многие детали, которые отчетливо прослушиваются на динамиках с хорошими импульсными характеристиками, отсутствуют в принципе.
В чем проблема? Всего лишь в том, что система плохо передает нарастание сигнала. Дело в том, что именно в этот момент нарастания сигнала мы воспринимаем около восьмидесяти процентов информации, которая затем в нашей голове преобразуется в фонограмму. Поэтому звук и получается таким “затуманенным” – не хватает слишком большого количества деталей.

Изменения динамики сигнала происходят из-за того, что аппаратура не может передать сигнал с достаточной скоростью. В звуковых картах и усилителях препятствием является малый ток нарастания сигнала. К сожалению, этот параметр можно приблизительно оценить только по “даташитам” микросхем, поскольку у нас нет аппаратуры, которая могла бы его измерять. Да и, насколько нам известно, такая аппаратура есть далеко не у всех специализированных аудиоизданий.

Акустика также вносит свою лепту в ухудшение нарастания сигнала. Однако здесь препятствием является масса диффузора и характеристика подвесов динамиков. Способность динамиков реагировать на импульс, а также время колебаний после его прохождения описывает импульсная характеристика. Для ее описания обычно приводят графики откликов динамиков на единичный импульс или, что информативнее, кумулятивный спектр затухания – трехмерный график, иллюстрирующий время нарастания и затухания сигнала в зависимости от частоты сигнала. Мы это, увы, не практикуем за отсутствием дорогостоящей аппаратуры.

Импульсную характеристику динамиков можно косвенно оценить только по массе материала диффузора динамика. Самым лучшим материалом с точки зрения передачи импульсов является шелк, поскольку он самый легкий. Пищалки (общепринятый синоним словосочетания “высокочастотные динамики”) с мембраной из синтетических материалов им значительно уступают.

Для среднечастотных и низкочастотных динамиков лучшим с точки зрения передачи импульсов материалом, как и десятки лет назад, является качественная целлюлоза. Синтентические кевларовые диффузоры, как и прочая синтетика, обладают значительно большей массой и передают импульс хуже.

Нелинейные искажения

Помимо изменения структуры сигнала аппаратура также вносит в сигнал примеси собственного производства. Существуют два основных вида нелинейных искажений – гармонические и интермодуляционные. Гармонические искажения представляют собой обертона, возникающие при прохождении сигнала через звуковой тракт. То есть, у каждой из гармоник могут появляться новые обертона, вызванные резонансами аппаратуры. В зависимости от свойств конкретного устройства, распределение паразитных гармоник по спектру может быть разным.

Интермодуляционные искажения представляют собой паразитные импульсы, которые появляются на частотах, являющихся суммой или разностью двух других. То есть при прохождении сигнала с тестовыми импульсами на частотах 19 кГц и 20 кГц мы можем получить примесь на частоте 1 кГц (выделено синим).

Причем новоиспеченные примеси также могут послужить пищей для новых интермодуляций (чаще всего так и бывает; на рис. 1 продукт тестового сигнала и интермодуляционного искажения выделен красным цветом).

рис. 1

Как правило, современные звуковые карты обеспечивают достаточно низкий уровень нелинейных искажений. Основными источниками этих примесей являются усилители и динамики мультимедийных акустических систем.

Субъективно наличие нелинейных искажений воспринимается как “грязь” и влияет на общий характер звучания, делая его неприятным. Впрочем, есть и исключение. Если среди нелинейных искажений преобладают четные гармоники второго (рис. 2, выделена синим) и четвертого порядков, окрас получается приятным для слуха, “теплым”, как его нередко характеризуют в аудиоизданиях.

рис. 2

Во всех остальных случаях самовольная “покраска” музыки аппаратурой ни к чему хорошему не приводит. Если в звуке преобладают (то есть выше других по уровню) нечетные гармоники, третья (рис. 2, выделена красным) и пятая, звучание системы получается режущим слух и быстро утомляющим. Если преобладают гармоники высших порядков, то есть пятого и выше, звучание системы получается похожим на дребезжание (на рис. 2 выделена белым высшая гармоника шестого порядка). Самые сверхомерзительные дребезгообразные призвуки дают те высшие гармоники, которые начинаются с восьмой.

Слух очень чувствителен к гармоническим искажениям, особенно если они появляются в диапазоне от одного до двух килогерц. Особенно хорошо заметны нечетные гармоники, которые мы замечаем примерно вдвое лучше четных, и высшие обертона, которые заметнее четных в шесть-десять раз. (Есть мнение, что это явление объясняется преобладанием нечетных и высших гармоник в криках грудных детей, которые, как известно, умеют очень жестко давить на психику. Особенности видовой прошивки мозга, так сказать.) При определенном расположении и распределении гармонических искажений в сигнале мы можем различать даже те паразитные обертона, которые находятся на 105-110 дБ ниже уровня полезного сигнала.

Продукты интермодуляционных искажений заметны на слух еще сильнее гармонических. Как правило, их наличие воспринимается как диссонанс в фонограмме (инструменты не настроены). Наиболее восприимчив слух, как и в случае с гармоническими искажениями, к тем интермодуляциям, которые появляются в районе одного-двух килогерц.

Помимо обычных графиков, на которых мы видим непосредственно тестовый сигнал (или сигналы) и примеси, количество нелинейных искажений можно определить по графику Rz (актуально для мультимедийных систем, для звуковых карт – нет). График Rz отражает зависимость напряжения в системе (а значит, и ее сопротивления) от частоты. Перепады характеристики отражают не только вращения фазы сигнала, но и нагрузку на усилитель. А перепады нагрузки, в свою очередь, вызывают всплески нелинейных искажений.

От Rz системы зависит многое. Чтобы оценить ее влияние, можно привести один пример. Почти во всех современных мультимедийных системах есть сильные перепады импеданса в области от 1 кГц и выше. В результате мы имеем быстро утомляющий, неприятный и нечеткий окрас звука из-за нелинейных искажений и дефектов ФЧХ.

Единственные мультимедийные системы на сегодня с корректной характеристикой Rz – Mercury 40A и 50A (нет ни одного резкого всплеска выше 500 Гц, вращение фазы не превышает двадцати градусов). В остальном это обычные мультимедийные системы с недорогими динамиками. АЧХ этих систем не уникальна, импульсные характеристики тоже не блещут. Но звук значительно чище и приятнее, чем у любой другой компьютерной стереосистемы. Практически на порядок. А отличие – всего лишь в Rz.

Шумы

Шумы, как мы писали выше, являются примесями, которых в изначальном сигнале не было. Но, в отличие от нелинейных искажений, они плотно забивают собой спектр сигнала (или его часть) и, таким образом, маскируют (поглощают) все детали фонограммы, которые расположены ниже их уровня (на рис. 1 белой рамкой выделены шумы тракта звуковой карты). Получаем, что уровень шумов определяет нижнюю границу слышимости.

Шумы влияют на один из самых важных параметров аппаратуры – динамический диапазон. Динамический диапазон записи представляет собой разницу между уровнями самого громкого звука и самой тихой детали (гармоники) в составе какого-либо звука. Динамический диапазон аппаратуры, соответственно, представляет собой разницу между самым громким и самым тихим звуком, который она в состоянии воспроизвести.

Вообще говоря, динамический диапазон аудиотракта – сложная характеристика, которая определяется тремя параметрами. Снизу ее ограничивает уровень шумов, сверху – перегрузочная способность усилителей карты и акустической системы, которые при повышении мощности выше определенного уровня начинают добавлять в звук большое количество искажений, а также максимальной долговременной мощностью динамиков и их чувствительностью.

Максимальной долговременной мощностью акустики называется та мощность, при подведении которой АС может длительное время воспроизводить сигнал, близкий к музыкальному, не внося при этом в звук большого количества искажений (не больше одного процента). Чувствительностью акустики называется среднее звуковое давление, которое она создает при подведении мощности в один ватт (ее можно прикинуть по графику АЧХ системы). Оба этих параметра в совокупности позволяют вычислить максимальное звуковое давление, которое может создать АС (удвоение мощности дает прирост звукового давления на три децибела).

Для описания зашумленности тракта, как правило, приводятся два параметра – уровень шумов в отсутствии сигнала и уровень шумов в его присутствии. Второй параметр ближе к жизни, чем первый, поскольку редко кто слушает аппаратуру, не подавая на нее никакого сигнала. Как правило, в присутствии сигнала уровень шумов выше, чем в его отсутствии. Уровень шумов без сигнала приводится для того, чтобы по разнице обоих параметров можно было прикинуть, как сильно вырастут шумы при прохождении сигнала через звуковой тракт. У качественных современных звуковых карт проблем с динамическим диапазоном нет.

Чего нельзя сказать об усилителях и динамиках большинства мультимедийных акустических систем. Как правило, мощность встроенных усилителей не превышает 10 Вт RMS, а средняя чувствительность обычных колонок составляет 86 дБ/Вт/м. Таким образом, даже при наличии качественного усилителя мы получаем динамический диапазон в 56 дБ (притом, что теоретический предел динамического диапазона для записей стандарта AudioCD составляет 96 дБ).

Почему всего 56 дБ? Потому, что уровень шумов в среднем помещении (днем, в городе) редко падает ниже сорока децибел, а максимальное звуковое давление редко превышает 96 дБ. И это только при наличии качественного усилителя. А если вы слышите шипение системы, когда громкость выкручена на максимум, значит, диапазон еще уже, поскольку шумы тракта превышают уровень шума в комнате. И это в отсутствии сигнала…

Измерений недостаточно?

Многим нравится считать, что в звуке есть нечто загадочное, что не может уловить измерительная аппаратура, а посему эти люди нередко говорят, что объективные измерения полезной информации о звуке не несут. Очень хочется верить, что музыка есть явление мистическое. Что музыка – другой мир, плюющий на равнодушную действительность, пропитанную банальностями и прагматизмом. Это, безусловно, достойная точка зрения. Приятная и не лишенная оптимизма (как говорит Череш, “вы оптимист, батенька, и не надо этого стесняться!”). Но все же стоит учитывать, что аппаратура – порождение мира, основанного на законах логики и физики. И если аппарат, к примеру, воспроизводит одни частоты громче других, ни о какой правдоподобной передаче звукового контента речи идти не может. Если аппаратура искажает тестовый сигнал, она будет искажать и фонограммы.

Другое дело, что одних только измерений действительно недостаточно. Хотя бы потому, что реальный сигнал намного сложнее тестового. А как, насколько возрастет и изменится уровень искажений и их распределение в звуковом спектре, если мы поставим ту или иную запись, выставим ту или иную громкость, никто сказать не сможет. К тому же, статистические исследования показывают, что далеко не все аспекты звучания аппаратуры отражаются объективными характеристиками. Отсюда следует необходимость проведения субъективных тестирований (тестовых прослушиваний). Изучением субъективных прослушиваний и субъективных характеристик мы займемся в следующий раз.

Александр Енин

Никто не прокомментировал материал. Есть мысли?