
Широтно-импульсная модуляция (ШИМ) – метод кодирования аналогового сигнала в последовательность импульсов с переменной длительностью. В аудиотехнике ШИМ используется для преобразования звукового сигнала в цифровую форму с последующим восстановлением через фильтрацию. Частота несущей в аудиоприложениях обычно составляет 40–500 кГц, что позволяет минимизировать искажения при частоте дискретизации 44,1–192 кГц. Основное преимущество – высокая энергоэффективность, так как усилители класса D на базе ШИМ потребляют на 30–50% меньше энергии, чем линейные аналоги.
Принцип работы ШИМ в звуке основан на изменении коэффициента заполнения импульсов пропорционально амплитуде входного сигнала. Например, при амплитуде 0,5 В на входе и напряжении питания 5 В коэффициент заполнения составит 10%. Для корректного восстановления сигнала требуется фильтр нижних частот с частотой среза 20–22 кГц, чтобы подавить высокочастотные гармоники несущей. Важно учитывать, что недостаточная частота ШИМ приводит к появлению слышимых артефактов – aliasing, особенно заметных на высоких частотах.
Применение ШИМ в аудиотехнике охватывает портативные устройства, автомобильные усилители и системы высококачественного звука. В мобильных гаджетах ШИМ-усилители класса D позволяют продлить время автономной работы на 20–40% за счет снижения тепловыделения. В автомобильных аудиосистемах используются микросхемы с частотой ШИМ 300–600 кГц, что обеспечивает соотношение сигнал/шум >100 дБ. Для Hi-Fi-применений рекомендуется выбирать решения с частотой дискретизации 96 кГц и выше, чтобы минимизировать фазовые искажения.
Ключевые параметры при проектировании ШИМ-аудиосистем: разрешение модуляции (обычно 8–16 бит), частота несущей и тип фильтрации. Для 16-битного сигнала требуется не менее 65 536 уровней коэффициента заполнения, что достигается при частоте ШИМ >2,8 МГц. В реальных устройствах часто применяют delta-sigma модуляцию для повышения разрешения без увеличения тактовой частоты. При выборе компонентов обращайте внимание на джиттер тактового сигнала – его значение не должно превышать 100 пс, чтобы избежать деградации звука.
ШИМ модуляция звука: принцип работы и применение

Широтно-импульсная модуляция (ШИМ) преобразует аналоговый звуковой сигнал в последовательность импульсов с переменной длительностью, сохраняя информацию о его амплитуде. Частота несущей ШИМ для аудиоприложений выбирается в диапазоне 40–200 кГц – выше верхней границы слышимого спектра (20 кГц), чтобы избежать наложения гармоник. Коэффициент заполнения (duty cycle) импульсов пропорционален мгновенному напряжению сигнала: при 50% заполнении воспроизводится нулевой уровень, при 100% – максимальная амплитуда. Для восстановления исходного сигнала используется фильтр нижних частот (ФНЧ) с частотой среза 20–22 кГц, подавляющий высокочастотные компоненты ШИМ.

Основные параметры, влияющие на качество звука при ШИМ-модуляции:
- Разрешение ШИМ: определяет количество дискретных уровней амплитуды. Для 16-битного звука требуется не менее 65 536 уровней (216), что достигается при частоте несущей ≥1,3 МГц (для 20 кГц сигнала). В микроконтроллерах часто используют 8–12-битные ШИМ (256–4096 уровней) из-за ограничений тактовой частоты.
- Джиттер: временные отклонения фронтов импульсов. Допустимый джиттер для Hi-Fi звука – ≤1 нс. Для снижения джиттера применяют кварцевые генераторы с фазовой автоподстройкой частоты (PLL).
- Тип модуляции: однополярная (0–Vcc) или биполярная (±Vcc/2). Биполярная ШИМ обеспечивает лучшее соотношение сигнал/шум (SNR) за счет симметричного размаха напряжения.
Применение ШИМ в аудиотехнике включает:
- Цифро-аналоговые преобразователи (ЦАП): ШИМ используется в бюджетных ЦАП (например, в Arduino или Raspberry Pi) для воспроизведения звука через простые ФНЧ. Для повышения точности применяют многоуровневые ШИМ-схемы (например, 3-уровневая ШИМ в классе D усилителей).
- Усилители класса D: ШИМ лежит в основе работы этих усилителей, обеспечивая КПД до 90% за счет коммутации транзисторов в ключевом режиме. Примеры: TPA3116 (Texas Instruments) с частотой ШИМ 400 кГц и SNR 102 дБ.
- Синтез звука: в синтезаторах (например, Chiptune) ШИМ генерирует звуковые волны с заданной формой (пила, меандр) путем динамического изменения duty cycle. Для 8-битного звука частота несущей выбирается в 16–32 раза выше частоты сигнала (например, 32 кГц для ноты A4=440 Гц).
Для минимизации искажений рекомендуется использовать дифференциальные выходы ШИМ, снижающие синфазные помехи, и экранированные кабели для подключения нагрузки (динамиков).
Как формируется звуковой сигнал с помощью ШИМ в цифровых системах

В цифровых системах звук формируется посредством широтно-импульсной модуляции (ШИМ) путём преобразования дискретных аудиоданных в последовательность импульсов переменной длительности. Исходный сигнал, оцифрованный с частотой дискретизации (например, 44,1 кГц для CD-качества), разбивается на выборки амплитуды. Каждое значение амплитуды преобразуется в коэффициент заполнения ШИМ-сигнала: чем выше амплитуда, тем шире импульс в пределах фиксированного периода. Частота ШИМ должна минимум в 10 раз превышать верхнюю границу звукового диапазона (20 кГц), чтобы избежать наложения спектров – типовые значения составляют 250–500 кГц для аудиоприложений. Для подавления высокочастотных гармоник, возникающих из-за прямоугольной формы импульсов, применяется аналоговый фильтр нижних частот (ФНЧ) с частотой среза около 20 кГц, восстанавливающий исходную форму сигнала.
Ключевые параметры, влияющие на качество звука: разрядность ШИМ (обычно 8–16 бит) и стабильность тактового генератора. При 8-битной модуляции обеспечивается 256 уровней амплитуды, что достаточно для речи, но для высококачественного аудио требуется 12–16 бит (4096–65536 уровней). Джиттер тактового сигнала свыше 1 нс приводит к искажениям, поэтому в профессиональных системах используют кварцевые генераторы или PLL с фазовой автоподстройкой. Для снижения шумов квантования применяют методы дитеринга или сигма-дельта модуляцию, которая повышает эффективную разрядность за счёт избыточной дискретизации. В микроконтроллерах (например, STM32 или AVR) ШИМ реализуется аппаратно через таймеры с регистрами сравнения, что позволяет генерировать сигнал без загрузки ЦП.
Сравнение аналогового и ШИМ-методов воспроизведения аудио

Аналоговое воспроизведение звука основано на непрерывной передаче сигнала, где амплитуда напрямую соответствует звуковому давлению. Этот метод обеспечивает теоретически бесконечное разрешение по амплитуде, но на практике ограничен шумами усилителей, дрейфом компонентов и нелинейностями аналоговых цепей. Типичный SNR (отношение сигнал/шум) качественных аналоговых систем составляет 90–110 дБ, при этом искажения THD+N (суммарные гармонические искажения + шум) редко опускаются ниже 0,001% в высококлассных усилителях класса A. Однако аналоговые схемы чувствительны к температурным колебаниям и старению компонентов, что требует периодической калибровки.
ШИМ (широтно-импульсная модуляция) преобразует аудиосигнал в последовательность импульсов с переменной длительностью, где скважность соответствует мгновенной амплитуде. Основное преимущество – цифровая природа сигнала, устойчивая к помехам и дрейфу. Современные ШИМ-процессоры (например, TI TAS5754M) достигают SNR до 115 дБ и THD+N менее 0,005% при частоте дискретизации 192 кГц. Однако ШИМ требует фильтрации высокочастотных гармоник, генерируемых переключением, что может вносить фазовые искажения в области 20–50 кГц, критичные для высокочастотных сигналов.
Энергоэффективность – ключевое отличие ШИМ. Аналоговые усилители класса AB рассеивают до 50% мощности в виде тепла, тогда как ШИМ-усилители класса D работают с КПД 90–95%. Это позволяет использовать компактные радиаторы и снижать потребление энергии в портативных устройствах. Однако при малых уровнях сигнала (ниже –40 дБ) ШИМ может проигрывать аналогу из-за квантования и шумов джиттера, что проявляется в виде «зернистости» звука на тихих фрагментах.
С точки зрения стоимости и масштабируемости ШИМ выигрывает в массовом производстве. Аналоговые схемы требуют прецизионных резисторов, конденсаторов с низким ESR и малошумящих ОУ, что увеличивает себестоимость. ШИМ-решения, напротив, строятся на цифровых микросхемах с минимальным количеством внешних компонентов. Например, интегральный ШИМ-усилитель PAM8403 стоит менее $1 при выходной мощности 3 Вт, тогда как аналоговый усилитель с сопоставимыми характеристиками обойдется в 5–10 раз дороже.
Для высококачественного аудио аналоговые методы остаются предпочтительными в студийных мониторах и аудиофильских системах, где критичны минимальные искажения и естественность звучания. ШИМ доминирует в портативной электронике, автомобильных аудиосистемах и IoT-устройствах благодаря компактности и энергоэффективности. При выборе метода стоит учитывать: для сигналов с широким динамическим диапазоном (классическая музыка, джаз) аналог обеспечивает более плавное воспроизведение, а для ритмичных жанров (электронная музыка, поп) ШИМ демонстрирует достаточную точность при меньших затратах.
Гибридные решения, сочетающие цифровую обработку сигнала с аналоговым выходным каскадом, нивелируют недостатки обоих подходов. Например, ЦАП с аналоговым фильтром (как в ESS Sabre ES9038) позволяет получить преимущества ШИМ в части точности и гибкости, сохраняя аналоговую «теплоту» звучания. Для разработчиков рекомендуется тестировать оба метода на целевом контенте: ШИМ оптимален для систем с ограниченным питанием, аналог – для приложений, где качество звука превалирует над энергоэффективностью.
Практическая реализация ШИМ в микроконтроллерах для генерации звука

Для генерации звука через ШИМ в микроконтроллерах (МК) критически важно правильно выбрать параметры таймера и настроить выходной сигнал. В большинстве современных МК, таких как STM32, AVR или ESP32, используются аппаратные таймеры с режимами PWM (Fast PWM, Phase Correct PWM). Например, в STM32F103 частота ШИМ задаётся через регистры TIMx_ARR (период) и TIMx_CCRx (коэффициент заполнения). Для воспроизведения звука в диапазоне 20 Гц–20 кГц требуется частота ШИМ не менее 40 кГц (удвоенная верхняя граница слышимого диапазона), чтобы избежать наложения спектров и артефактов.
Основные шаги реализации:
- Инициализация таймера в режиме PWM с частотой не менее 40 кГц. Для STM32 это достигается установкой
TIM_TimeBaseInitTypeDefс параметромPrescaler, рассчитанным по формуле:
Prescaler = (SystemCoreClock / (PWM_Frequency * ARR)) - 1. - Подключение низкочастотного фильтра (RC-цепочка) к выходу ШИМ для сглаживания сигнала. Оптимальные значения: резистор 1–10 кОм, конденсатор 10–100 нФ, в зависимости от требуемой полосы пропускания.
- Загрузка аудиоданных в буфер и динамическое изменение коэффициента заполнения через
TIMx_CCRxс частотой дискретизации звука (например, 44,1 кГц для CD-качества).
При работе с ограниченными ресурсами МК (например, ATmega328P) частота ШИМ ограничена тактовой частотой процессора. В режиме Fast PWM на 8-битном таймере максимальная частота составит F_CPU / 256 (62,5 кГц при 16 МГц). Для повышения разрешения можно использовать 16-битные таймеры или программные методы, такие как delta-sigma модуляция, но это увеличивает нагрузку на процессор. В ESP32 доступны аппаратные LED PWM-контроллеры с разрешением до 16 бит и частотой до 40 МГц, что позволяет генерировать высококачественный звук без дополнительных ухищрений.
Для воспроизведения полифонических звуков или сложных мелодий рекомендуется использовать DMA (Direct Memory Access) для автоматической загрузки данных в регистры ШИМ. В STM32 это реализуется через HAL_TIM_PWM_Start_DMA(), где в качестве источника указывается массив с аудиоданными. При этом важно синхронизировать частоту обновления ШИМ с частотой дискретизации звука, чтобы избежать искажений. Для монофонических сигналов достаточно простого прерывания по таймеру, где в обработчике обновляется TIMx_CCRx. Пример кода для STM32 на HAL:
uint16_t audio_buffer[BUFFER_SIZE]; HAL_TIM_PWM_Start_DMA(&htim2, TIM_CHANNEL_1, (uint32_t*)audio_buffer, BUFFER_SIZE);
Для AVR аналогичный подход реализуется через прерывания по переполнению таймера, где в ISR(TIMER1_OVF_vect) обновляется регистр OCR1A.
Фильтрация и восстановление аудиосигнала после ШИМ-модуляции

После ШИМ-модуляции аудиосигнал представляет собой последовательность прямоугольных импульсов с переменной скважностью, содержащую высокочастотные гармоники несущей частоты (обычно 40–500 кГц). Для восстановления аналогового сигнала применяют фильтры нижних частот (ФНЧ) с крутым спадом АЧХ за пределами звукового диапазона (20 Гц–20 кГц). Оптимальные параметры фильтра: порядок не ниже 4-го (например, фильтр Баттерворта или Чебышёва), частота среза 20–25 кГц, неравномерность АЧХ в полосе пропускания ≤ 0,5 дБ. При использовании активных фильтров на операционных усилителях (например, NE5532) рекомендуется выбирать резисторы и конденсаторы с допуском ≤ 1% для минимизации фазовых искажений.
Ключевой проблемой при восстановлении является подавление остаточных гармоник ШИМ, которые могут проникать в звуковой диапазон из-за неидеальности фильтрации. Для этого применяют двухступенчатую фильтрацию: первая ступень – пассивный LC-фильтр с частотой среза 50–100 кГц для грубого подавления высокочастотных составляющих, вторая – активный ФНЧ 4–6 порядка. Пример расчёта пассивного фильтра: для несущей частоты 250 кГц и нагрузки 8 Ом индуктивность катушки выбирается по формуле L = R / (2πfc), где fc – частота среза (например, 70 кГц), что даёт L ≈ 18 мкГн. Конденсатор рассчитывается как C = 1 / (2πfcR), что при тех же параметрах даёт C ≈ 280 нФ.
Для оценки качества восстановленного сигнала используют коэффициент гармонических искажений (THD) и отношение сигнал/шум (SNR). В системах с ШИМ THD должен быть ≤ 0,1% в диапазоне 20 Гц–20 кГц, а SNR – не менее 90 дБ. Достижение таких показателей требует учёта паразитных параметров компонентов: эквивалентного последовательного сопротивления (ESR) конденсаторов (≤ 0,1 Ом для электролитических), собственной ёмкости катушек индуктивности (≤ 5 пФ) и входного импеданса операционного усилителя (≥ 1 МОм). При проектировании плат рекомендуется разделять аналоговые и цифровые земли, а также минимизировать длину проводников фильтра для снижения наводок.
