Компьютерное представление звуковой информации

  • Вид работы:
    Дипломная (ВКР)
  • Предмет:
    Информационное обеспечение, программирование
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    1,51 Mb
  • Опубликовано:
    2011-11-23
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Компьютерное представление звуковой информации


Курсовая работа

Компьютерное представление звуковой информации

Содержание

Введение

Кодирование звуковой информации

Основные звуковые форматы

Цифровые синтезаторы музыкальных звуков

Анализ музыкальных инструментов

Синтез музыкальных звуков

Табличные синтезаторы

Синтезаторы на основе частотной модуляции

Гармонические синтезаторы

Синтезаторы на основе моделирования физических процессов

Обработка звука

Звуковые редакторы. Общий обзор

Goldwave 5.08

Audacity 1.2.5

Acoustica Premium Edition 4.0

Wavelab 5

Sound Forge 9

Adobe Audition 3.0

Примеры обработки звука

Заключение

Список используемой литературы

Введение


В настоящее время школьный курс информатики предусматривает слишком малое количество учебных часов для изучения основ кодирования информации, а тем более кодирования звука. Данная тема проходится в ознакомительном режиме и не дает полного представления обо всех возможностях кодирования звука.

Кодирование звуковой информации


Из курса физики известно, что звук является волной, т.е. колебанием среды. В повседневной жизни средой является воздух, но на самом деле это необязательное условие. К примеру, звук хорошо распространяется по поверхности земли и в одной среде. Напротив, в вакууме и космосе звук не распространяется.

Звуковые колебания легко преобразуются в электрические с помощью микрофона. Сигнал микрофона является очень слабым, но на современном уровне развития техники его усиление не представляет проблемы. Форму полученных колебаний, т.е. зависимость интенсивности сигнала от времени, можно наблюдать на экране осциллографа - электроннолучевого, прибора для наблюдения функциональной связи между двумя или несколькими величинами (параметрами и функциями; электрическими или преобразованными в электрические).

В эпоху аналоговой записи звука, для сохранения полученного электрического сигнала его преобразовывали в ту или иную форму другой физической природы, которая зависела от применяемого носителя.

Например, при изготовлении грампластинок сигнал вызывал механические изменения размеров звуковой дорожки ( с помощью специальной аппаратуры сигнал преобразовался в механические колебания сапфирового резца, который нарезал на слое материала концентрические звуковые канавки).

Для старых киноаппаратов звук на пленку наносился оптическим методом (запись электрических колебаний звуковой частоты, осуществлялась фотографическим способом на движущейся киноплёнке).

Наибольшее распространение в быту получил процесс магнитной звукозаписи (запись производилась с помощью специального устройства - записывающей магнитной головки, создающей переменное магнитное поле на участке движущегося носителя (зачастую магнитной ленты), обладающего магнитными свойствами).

Во всех случаях интенсивность звука была строго пропорциональна какой-либо величине, например, ширине оптической звуковой дорожки, причем эта величина имела непрерывный диапазон значений.

Переход к записи звука в компьютерном виде потребовал принципиально новых подходов. При цифровой записи зависимости интенсивности звука от времени возникает принципиальная трудность: исходный сигнал непрерывен (т.е. его параметр может принимать любе значение в пределах некоторого интервала), а компьютер способен хранить в памяти только дискретные (параметр может принимать только конечное число значений в пределах некоторого интервала). Отсюда следует, что в процессе сохранения звуковой информации она должна быть “оцифрована”, т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты компьютера, который называется АЦП - аналого-цифровой преобразователь.

Основные принципы работы АЦП:

·        АЦП производит дискретизацию записываемого звукового сигнала по времени.

Это означает, что измерение уровня интенсивности звука в определенные фиксированные моменты времени (чаще всего через равные временные промежутки). Частоту, характеризующую периодичность измерения звукового сигнала, принято называть частотой дискретизации. Её выбор в значительной степени зависит от частотного спектра сохраняемого сигнала: существует специальная теорема Найквиста, согласно которой частота оцифровки звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала. Считается, человек слышит звук частотой не более 20 000 Гц = 20 кГц, поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц. Частота при таких требованиях должна быть не ниже 44 кГц. Такая частота чаще всего используется, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты 8 кГц. Результат при этом получается хотя и не блестящий, но вполне разборчивый, к примеру такое качество у голоса в телефоне.

Качество воспроизведения тем лучше, чем выше частота дискретизации, но в то же время и объем занимаемое памяти звуковых данных при этом тоже возрастает, так что оптимального “на все случаи” значения частоты не существует и частота всегда выбирается из расчета что более важно качество или объем занимаемой памяти.

·        АЦП производит дискретизацию амплитуды звукового сигнала Это следует понимать так, что при измерении имеется “сетка” стандартных уровней (например, 256 или 65 536 - это количество характеризует глубину кодирования (количество бит на кодировку звука)), и текущий уровень измеряемого сигнала округляется до ближайшего из них. В итоге появляется линейная зависимость между величиной входного сигнала и номером уровня. То есть в том случае, когда, например, громкость возрастает в 2 раза, то ожидается, что и соответствующее ему число возрастет вдвое. Но такое распределение применяется только в простейших случаях. Чаще всего при записи звука используют неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон.

Таким образом в ходе оцифровки звука мы получаем поток целых чисел, причем величина числа соответствует силе звука в данный момент.

На рисунке 1 графически проиллюстрировано приведенное выше описание процесса дискретизации. На рисунке представлен процесс оцифровки зависимости интенсивности звукового сигнала I от времени t. Отчетливо видна дискретизация по времени (равномерные отсчеты на горизонтальной оси) и по интенсивности (требуемое при этом округление схематически изображено “изломами” горизонтальных линий разметки). Конечно, реально различие между соседними значениями по обеим осям значительно меньше и, следовательно, форма сигнала передается гораздо точнее.








Рис.1

Данный метод преобразования показывает, что звук, как и любая другая информация, для возможности хранения в памяти компьютера, нуждается в представлении его в числовом форме и в последующем переводе в двоичную систему счисления.

При воспроизведении записанного в компьютерный файл звука производится преобразование в противоположном направлении - из дискретной цифровой формы представления сигнала в непрерывную аналоговую. Для этого существует соответствующий узел компьютерного устройства, который называется ЦАП - цифроаналоговый преобразователь.

Процесс реконструкции первоначального аналогового сигнала по имеющимся дискретным данным нетривиален, поскольку никакой информации о форме сигнала между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала могут использоваться различные способы. Наиболее наглядный и понятный из них является, тот что по имеющимся соседним точкам рассчитывает некоторую гладкую функцию, проходящую через заданные точки, которая и принимается в качестве формы аналогового сигнала.

Технические возможности современных микросхем позволяют для реконструкции формы сигнала производить весьма сложные вычисления. Выпускаются даже специализированные микропроцессоры, для которых в технической литературе принято название DSP (Digital Signal Processor) - процессоры цифровой обработки сигналов.

Основные звуковые форматы


Результаты дискретизации звуковой информации, как и все остальные компьютерные данные, сохраняются на внешних носителях в виде файлов. Звуковые файлы могут иметь различные форматы. Рассмотрим наиболее распространенные из них.

Формат AU. Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом другого, более общего формата RIFF (Resource Interchange File Format); другой разновидностью RIFF служат видеофайлы AVI. Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырех символьный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т.д.), а во втором - сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули). При стерео записи(запись при которой происходит раскладка звука через два (и более) независимых аудиоканала) числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный. Такая, казалось бы, излишняя структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

Формат MP3 (MPEG Layer3). Это один из форматов хранения аудио сигнала, позднее утвержденный как часть стандартов сжатого видео. Поскольку произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, приходится переходить к методам необратимым: иными словами, базируясь на знаниях о свойствах человеческого слуха, звуковая информация “подправляется” так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Такое кодирование называется адаптированным и позволяет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, сложны и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Технология MP3 является, пожалуй, самой во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные и т.д.). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить изначальный музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

Цифровые синтезаторы музыкальных звуков


Информация, которую несет музыкальный звук, рассказывает о высоте (то есть о том, какая нота звучит) и тембре или типе музыкального инструмента, с помощью которого производится звукоизвлечение (генерация звука). Так же, в структуру музыкального звука исполнитель закладывает свою "импрессию", варьируя силу и резкость начала (атаки) и окончания (затухания), громкость, применяя амплитудное и частотное вибрато. Осциллограмма сигнала музыкального инструмента представлена на рис.2.










рис. 2

Как правило, звук начинается с так называемой атаки, быстрого нарастания амплитуды сигнала. Длительность атаки для разных музыкальных инструментов варьируется от единиц до нескольких десятков или даже сотен миллисекунд. После атаки начинается поддержка, в течение которой уровень сигнала примерно постоянен или плавно меняется в случае применения амплитудного вибрато. Во время поддержки формируется ощущение высоты звука. Далее идет участок затухания, уменьшения величины сигнала. Атака, поддержка и затухание образуют так называемую амплитудную огибающую.

Спектр сигнала, то есть представление сигнала в частотной области, показан на рис. 3.







рис. 3

Спектр музыкального сигнала состоит из последовательности (по оси частот) узких "колоколов". Причем частоты, соответствующие максимумам (вершинам) "колоколов", примерно кратны основному тону или "фундаментальной" частоте музыкального звукового сигнала, под которой понимается частота, соответствующая человеческому ощущению высоты звука.

Анализ музыкальных инструментов


Целью анализа музыкальных звуков является изучение их структуры, определение существенных для восприятия человеческим слухом характеристик и использование полученных знаний для синтеза правдоподобно звучащих виртуальных цифровых музыкальных инструментов.

Традиционно для анализа сигналов в частотной области применяется быстрое преобразование Фурье. Данное преобразование позволяет представить любой дискретизированный сигнал, состоящий из N отсчетов в виде суммы N гармонических колебаний вида:

Yk(t)=Ak*sin(2П*Fk*t+Фk),

где k - номер гармоники, целое число от 0 до N-1; Ak - амплитуда k-й гармоники (расположенные на графике в виде вертикальных линий, как на рис. 3, в порядке возрастания k, они и образуют амплитудный спектр сигнала); Fk - частота k-й гармоники; Фk - фаза k-й гармоники; t - время, равное в моменты дискретизации (взятия отсчетов) сигнала

=i*Td,

где i - номер дискретного отсчета сигнала от 0 до N-1; Td - период дискретизации сигнала (интервал времени, через который берутся отсчеты сигнала). Td = 1/Fd, где Fd - частота дискретизации (например, 44,1 кГц). Fk - частота k-й гармоники, вычисляемая по формуле

звуковой электромузыкальный синтезатор цифровой

Fk=k*Fd/N.

Другими словами, Fk = k*F1. Такое же соотношение существует между гармониками (в смысле координат вершин "колоколов") в спектре музыкального сигнала. Таким образом получается, что даже спектр белого шума ( стационарный шум, спектральные составляющие которого равномерно распределены по всему диапазону задействованных частот), вычисленный с помощью БПФ, состоит из суммы "гармонических" гармоник. В данном случае над принять во внимание, что БПФ - это всего лишь один из многих инструментов анализа сигналов, математически устроенный определенным образом и обладающий некоторыми парадоксальными свойствами. То, что любой сигнал можно представить (используя БПФ) суммой "гармонических" гармоник с постоянными во времени амплитудами, вовсе не означает, что физически сигнал на самом деле был сгенерирован в виде такой суммы! Например, реальный сигнал может быть физически сгенерирован как сумма нескольких быстро затухающих или возрастающих синусоидальных колебаний с произвольными некратными частотами. Однако его оцифрованный с некоторой частотой дискретизации отрезок произвольной длительности математически с помощью БПФ всегда можно представить в виде суммы "чистых" гармоник с постоянной амплитудой, что значительно усложнит нам понимание истинной природы анализируемого сигнала и его синтез. Например, БПФ короткого отрезка быстро затухающей одиночной синусоиды даст широкий спектр, состоящий из десятков гармонических сигналов. Естественно, такой сигнал гораздо сложнее генерировать с вычислительной точки зрения, чем одиночную синусоиду с быстро уменьшающейся амплитудой. Следовательно, БПФ малопригодно для анализа гармонической структуры музыкального сигнала (с целью использования результатов анализа для синтеза) на стадии атаки и, в некоторых случаях, на стадии затухания.

На стадии поддержки БПФ позволяет провести довольно детальные исследования. Однако точность анализа с помощью простейшей формы БПФ, доступной в программах CoolEdit и WaveLab, ограничена величиной, равной 1/T Гц, где T - длина в секундах подвергавшегося БПФ участка сигнала. Положим, мы исследуем сигнал, состоящий из 4410 отсчетов при частоте дискретизации 44,1 кГц. Длина его по времени составит 0,1 секунды, и, следовательно, точность измерения частот гармоник с использованием БПФ не превысит 10 Гц, а это весьма заметная для музыканта ошибка. Надо заметить, что нота длинной 0,1 секунды - не такая уж большая редкость в реальных музыкальных произведения. Но получается, что с помощью простейших форм БПФ измерить с приемлемой точностью (0,1-0,5 Гц) частоту основного тона музыкального звука в этом случае практически невозможно. Поэтому при анализе спектра сигналов используют метод сверхвысокого разрешения Прони. В этом методе сигнал представляется в виде суммы затухающих или нарастающих синусоид, частоты которых вычисляются с высочайшей точностью в процессе анализа сигнала по формулам Прони и могут не образовывать гармонический ряд. Данный метод гораздо больше, чем БПФ, соответствует физической природе музыкальных сигналов и позволяет проводить анализ звуков на стадии атаки и затухания.

Синтез музыкальных звуков


Обобщенно технология создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах выглядит так: с помощью цифрового устройства, использующего волновой табличный, частотно-модуляционный, физического моделирования, аддитивного гармонического синтеза и другие методы, генерируется так называемый сигнал возбуждения с заданной высотой звука. Он должен иметь спектральные характеристики, максимально похожие на характеристики имитируемого музыкального инструмента на стадии поддержки. Затем сигнал возбуждения подается на фильтры, имитирующие амплитудно-частотные характеристики излучающих звук поверхностей (корпус, дека и т. д.) реальных музыкальных инструментов, и управляемые сигналом амплитудной огибающей фильтры, создающие эффект большего количества высоких частот во время стадии атаки и последующего их уменьшения. Одновременно формируется амплитудная огибающая сигнала с помощью умножения временных отсчетов сигнала на временные отсчеты образцовой для данного типа реального музыкального инструмента амплитудной огибающей. Могут быть добавлены частотное и амплитудное вибрато.

Далее обычно сигнал обрабатывается электронными звуковыми эффектами реверберации и хоруса. Иногда используются дополнительные эффекты: флэнжер, pitch-shifter, speaker simulator, гармонайзер, подавитель шумов, эквалайзер и другие. Если синтезируется нескольких одновременно звучащих нот разных музыкальных инструментов, то большинство описанных операций в мощных цифровых устройствах выполняется для каждой ноты каждого инструмента отдельно. Результирующий сигнал получается суммированием в цифровом виде всех составляющих звуков и только после этого преобразуется из цифрового представления в аналоговое с помощью высококачественного ЦАП. Естественно, в конкретных реализациях цифровых синтезаторов музыкальных звуков некоторые этапы могут быть упрощенны или вовсе отсутствовать, что, конечно, не улучшает качество их звука. Обычно синтезаторы получают в среде музыкантов упрощенное название по типу примененного в них генератора возбуждающей функции. Например, если применяется волновой табличный генератор, то и все устройство целиком может быть названо "wavetable synthesizer" - синтезатор с вэйвтейблом, или табличный синтезатор.

Табличные синтезаторы


В наше время самым распространенным и популярным является метод табличного синтеза и его модификации, который зачастую используют современные синтезаторы музыкальных звуков. Идея этого метода проста. В оперативную (ОЗУ) или постоянную (ПЗУ) память синтезатора записывается оцифрованный звук какого-нибудь музыкального инструмента. В нужный момент этот оцифрованный сигнал просто считывается и выводится на цифро-аналоговый преобразователь. Главным вопросом в таком деле остается, что делать с высотой и тональностью полученного звука? Ведь воспроизведется именно та нота, которая была сыграна в момент оцифровки звука музыкального инструмента, а синтезатор должен воспроизводить любую ноту с тембром образцового музыкального инструмента, оцифрованный звук которого хранится в памяти.

Предположим, что исходный сигнал дискретизирован с частотой 44,1 кГц. Если мы будем воспроизводить его на удвоенной частоте дискретизации 88,2 кГц, то есть вдвое быстрее, высота звука возрастет на октаву. Если же воспроизводить сигнал на пониженной частоте дискретизации, то высота звука соответственно уменьшится. Таким образом, при воспроизведении сигнала на измененной соответствующим образом частоте дискретизации, получаем звук любой высоты. Однако и у такого метода существуют свои недостатки. Во-первых, сделать высокостабильный плавно перестраиваемый генератор частоты дискретизации очень трудно. Кроме того, число таких устройств должно быть равно числу одновременно воспроизводимых нот разных музыкальных инструментов.

Однако существует и другой неприятный момент. Одновременно со смещением величины тактовой частоты и высоты звука будет изменяться длительность атаки и скорость затухания сигнала. Так, если удвоить тактовую частоту, то наряду с удвоением высоты звука в два раза уменьшится общее время звучания сигнала (так как он будет проигрываться в два раза быстрее). Отсюда вдвое сократится длительность атаки, и вдвое возрастет скорость затухания звука. Это вызовет искажение общего впечатления о звуке.

В реальном музыкальном инструменте при изменении высоты звука форма амплитудно-частотной характеристики (АЧХ) излучающих звук поверхностей, местоположение на оси частот, величина ее максимумов и провалов механических и акустических резонансов обычно не изменяются. А вот при изменении скорости воспроизведения оцифрованного сигнала вместе с частотой основного тона изменится и форма АЧХ (растянется или сожмется, максимумы и минимумы сместятся по оси частот). Конечно, это сильно исказит звук. Кроме того, в некоторых музыкальных инструментах (пианино, гитара и т. д.) звуки разной частоты формируются с помощью различающихся механически элементов конструкции (струны с оплеткой и без; несколько струн, настроенные в унисон). В этом случае звук, полученный с помощью удвоения скорости воспроизведения оцифрованного сигнала, может изначально не соответствовать реальному на октаву более высокому звуку. Поэтому в табличных синтезаторах применяется несколько другой способ изменения высоты звука. Оцифровывается несколько разных по высоте сигналов реального музыкального инструмента, перекрывающих весь его частотный диапазон. Шаг по частоте должен быть достаточно мал, чтобы изменения тембра, связанные с конструктивными особенностями инструмента, при смещении частоты основного тона с помощью варьирования частоты дискретизации не были заметны на слух.

Эксперименты показывают, что некоторые эксперты замечают изменения тембра при шаге в один тон. Однако в недорогих устройствах считается достаточной оцифровка через пол-октавы. При генерации звука определенной высоты табличный синтезатор определяет, в каком частотном диапазоне находится звук, и использует соответствующие отсчеты из своей таблицы, корректируя их частоту основного тона точно до требуемой высоты, виртуально подстраивая частоту дискретизации (ЧД). Под виртуальностью подразумевается следующее. ЧД выходного сигнала жестко стабилизирована кварцевым генератором (например, 44,1 кГц). Звук музыкального инструмента также дискретизирован на частоте 44,1 кГц. Для изменения высоты сигнала надо выбирать отсчеты сигнала из таблицы с частотой, немного отличной от 44,1 кГц, а подавать на ЦАП с частотой, точно равной 44,1 кГц. Это полностью аналогично (виртуальному) изменению частоты дискретизации данных в таблице и естественно будет восприниматься слухом как изменение высоты основного тона сигнала.

Синтезаторы на основе частотной модуляции


Синтезаторы на основе частотной модуляции (ЧМ) используются в основном в дешевых звуковых картах и в экзотических синтезаторах необычных "космических" звуков. Основаны они на психоакустическом феномене схожего звучание сигналов с похожими амплитудными спектрами. Для генерации сигналов со сложными спектрами близкими по форме к некоторым спектрам натуральных музыкальных инструментов используется функция вида:

(t)*sin(2П*F(t)*t),

где t - время; А(t) - амплитудная огибающая, состоящая из атаки, поддержки, затухания; F(t) =F0 +Z(t), где F0 - частота основного тона генерируемого сигнала, Z(t) - функция частотной модуляции. Фирмам производителям ЧМ-синтезаторов удалось подобрать достаточно простые функции Z(t) для генерации сигналов, звучащих похоже (но не очень) на некоторые натуральные музыкальные инструменты. Но из-за низкого качества имитации этот тип синтезаторов можно считать устаревшими.

Гармонические синтезаторы


Гармонические синтезаторы способны генерировать очень качественный "живой" звук, но требуют огромных вычислительных мощностей и поэтому недоступны для широкой публики. Выходной сигнал в таких синтезаторах вычисляется как сумма нескольких десятков (иногда до сотни) синусоидальных колебаний с изменяющимися во времени амплитудами, частотами и фазами по формуле

S(k=0..N-1)(Ak(t)*sin(2П*Fk(t)*t+Фk(t))),

где k - номер гармоники, N - число гармоник, Аk - амплитуда k-ой гармоники, Fk - частота k-й гармоники, Фk - фаза k-й гармоники. При таком синтезе учитывается "не гармоничность" гармоник частоты основного тона, дрожание фаз гармоник, изменение соотношения высокочастотных и низкочастотных компонентов в зависимости от стадии атаки, поддержки и затухания, а также другие "тонкие" эффекты, свойственные звуку реальных музыкальных инструментов. Синтезаторы этого типа применяются в дорогих проектах и научных исследованиях, проводимых некоторыми университетами США.

Синтезаторы на основе моделирования физических процессов


Синтезаторы на основе моделирования физических процессов генерируют звуковой сигнал, используя математическую модель физического устройства реальных музыкальных инструментов. При этом не требуется глубокого изучения свойств человеческого слуха и тщательного анализа временной динамики и частотной структуры музыкальных звуков. Для создания весьма правдоподобно звучащих виртуальных музыкальных инструментов достаточно воспользоваться сведениями о физической природе процессов звукоизвлечения и знаниями в области физики и математики. Синтезаторы на моделировании моделирования физических процессов дают качественный звук, но пока очень дороги.

Обработка звука


Обработка звука бывает разноплановой и зависит от целей, которые преследуют при обработке. Это может быть подавление шумов, наложение звуковых фильтров, добавление реверберации или дилея, выведение на передний план определённых частот и т.п.

Наиболее необходимой и практически повсеместно используемой процедурой является подавление шумов. Шумы могут быть как внешними, случайно записанными на микрофон фоновыми звуками в помещении с плохой звукоизоляцией, так и внутрисистемными, возникшими вследствие плохого экранирования шнуров и прочего звукозаписывающего оборудования. Шумы имеют свои частоты, диапазон которых сравнительно узок. Это позволяет подавлять их путём простой эквализации, то есть - убирать частоты, на которых больше всего шума и меньше всего нужных звуков. Запись, на которой шумы занимают сравнительно небольшой диапазон, не соприкасающийся с диапазоном других звуков, считается чистой. Запись, на которой шумы звучат почти на всех частотах, считается грязной, так как их практически невозможно подавить без ущерба для нужных звуков.

Реверберация считается вторым по востребованности шагом в обработке звука. Реверберация - это постепенное затухание звука, например, в большом помещении с хорошей акустикой. При небольшой продолжительности она добавляет вокалу или сольным инструментам глубину и выразительность звучания, поэтому её используют довольно часто. В отличие от простого эха, которое просто повторяет звук несколько раз, при этом, затихая, реверберация прогрессивно меняет соотношение частот повторяемого звука, что может создавать самые разнообразные эффекты.

После реверберации по популярности, пожалуй, стоят дилей-эффекты. Или попросту задержки звука. Это может быть как обычное эхо любой частоты затухания, так и более изысканные дилеи. Особенно дилей может понадобиться при обработке моно-звука и превращении его в псевдостерео. Для этого производится совсем незначительная задержка звука в одном из каналов. При этом одному каналу желательно добавить немного «сухости» (средних частот). Тогда бывший моно-звук начинает звучать в разных каналах и чуть-чуть по-разному, что и создаёт эффект стерео.

Если прибавить немного высоких и средних частот и совсем не использовать реверберации и дилея, то создаётся популярный в последнее время «эффект присутствия», как будто вокалист поёт прямо в комнате.

Фильтры - это эквализационные схемы, которые накладываются на записанный звук. Фильтры бывают статические и динамические. Статические фильтры просто убирают некоторые частоты трека, добавляя другие, а динамические постоянно меняют соотношение частот по определённой круговой схеме, из-за чего звук кажется «плавающим».

Звуковые редакторы. Общий обзор


В данном разделе мной будут рассмотрены некоторые наиболее известные звуковые редакторы. Конечно же в рамках данной работы не получится рассмотреть все существующие редакторы, поскольку в их в мире существует больше количество, как просто малоизвестных, так и узкоспециализированных, т.е. направленных на обработку трека, каким-либо определенным фильтром. Так же одной из главных проблем при выборе музыкального редактора остается поиск бесплатной программы. К сожалению возможности бесплатных программ, зачастую сильно ограничены. И так рассмотрим некоторые звуковые редакторы, не подразделяя их на бесплатные и платные.

Goldwave 5.08


Первые версии данного редактора начали появляться ещё в конце 90-х .

Основное окно Goldwave

Внешний вид основного окна стандартный. Специфическое деление каналов по цветам. Кроме того, есть два независимых окна визуализации. Всего доступно 12 видов визуализации, хотя они носят скорее декоративный характер. Хотя, возможно отображение формы волны или спектра при наведении курсора на волновое окно. Из удобств интерфейса можно отметить то, что встроенные эффекты вынесены на панель инструментов. Редактор поддерживает Direct-X плагины, но, к сожалению, VST-плагины не поддерживаются.

Присутствует CD-Grabber с возможностью конвертирования сразу в mp3, есть возможность применения цепи сразу нескольких эффектов (Tool>Effect chain editor) и есть возможность конвеерной обработки файлов (File>Batch processing). Все эффекты предварительно прослушиваются а затем применяются (как ко всему файлу, так и к выделенному фрагменту).

Предварительное прослушивание эффекта

Из особых достоинств стоит отметить функциональный процессор (Expression evaluator).










Этот инструмент можно использовать в разных целях - как генератор, либо как эффект. Все зависит от заданной формулы в поле Expression. Существуют уже готовые выражения в виде эффектов и различных генераторов.

Редактор поддерживает сохранение в сжатых форматах (ogg, mp3, wma), но для mp3 требуется загрузка внешнего кодека.

Audacity 1.2.5












Основное окно Audacity

Данный редактор появился относительно недавно. Первым его плюсом следует назвать то что он бесплатный. Но как было писано выше, это одновременно является и минусом.

Так же плюсом редактора поддерживает русский язык, работает под Linux и Mac OS. Насчет функциональности, то тут ее практически нет по сравнению с другими редакторами. Из эффектов поддерживаются только 2 десятка встроенных, ни Direct-X ни VST-плагины не поддерживаются. Естественно, драйверы поддерживаются только стандартные.

Есть поддержка экспорта в wav и ogg, но для mp3 нужен внешний кодек. Кроме того, редактор многодорожечный, каждая дорожка может быть приглушена, выделена и можно регулировать. Также есть анализатор спектра и возможность записи с мониторингом.

Premium Edition 4.0


Данный редактор не очень известный, но довольно интересный, не перегруженный лишним.

Интерфейс Acoustica

Кроме стандартных редактирования, записи с источника, записи на диск, здесь присутствует еще и очистка старых записей (Cleaning wizard). Интерфейс у программы очень удобный и доступный. Возможности у редактора довольно обширные: запись звука, его реставрация и редактирование. Есть поддержка как VST, так и Direct-X плагинов. Импортирование аудиотреков с компакт диска тоже в наличии. Запись на CD тоже есть.

Wavelab 5


Возможностями данный редактор обладает внушительными. Поддерживает все форматы плагинов, а так же имеет и свои встроенные. Есть поддержка компрессированных файлов, причем используются высококачественные кодеки (например, Fraunhoffer для mp3). Есть возможность как конвертировать треки с аудио дисков, так и записывать аудио диски и диски с данными. Кроме того, есть режим мультитрекового редактирования.

 

Мультитрековый режим Wavelab

 

Sound Forge 9


По известности Sound Forge стоит, пожалуй, на первом месте. Его используют не только профессиональные звукорежиссеры, но и обычные пользователи для практических целей.  Внешний вид Sound Forge 9



Текущая версия поддерживает плагины всех типов, компрессированные файлы, конвертирование аудиодисков, восстановление качества старых записей (демо) и неплохой набор встроенных эффектов. Мультитрекового режима здесь нет. Нету и спектрального анализа в реальном времени, в отличие от других редакторов. Вообще говоря, если рассматривать его исключительно как звуковой редактор, без дополнительных возможностей, то Sound Forge - один из лучших. Простота интерфейса и работы является главным его плюсом.

Adobe Audition 3.0










Продукты от Adobe известны не только на рынке звуковых программ, но и на в этом направлении они достигают внушительных результатов. Данный звуковой редактор является мощнейшим инструментом для записи и редактирования аудиофайлов. Он сочетает в себе два редактора в одной программе: редактора одиночных аудиофайлов (вид редактора), и редактора треков аудиофайлов или многодорожечного редактора (вида мультитрек (multitrack)).

Естественно у продукта такого уровня есть все возможности характерные для таких программ. Здесь и поддержка плагинов всех типов, и работа с записью (чтением) дисков и мультитрековый режим. Причем, мультитрековый режим в чем-то даже приближается к аудио-секвенсорам - то есть к микшеру. Но самое основное что выделяет Audition - это возможность выбирать рабочие пространства (workspaces) исходя из поставленной задачи. Причем, пользователь может создавать собственные рабочие пространства и сохранять их.

Примеры обработки звука


Adobe Audition не зря был рассмотрен последним, так как дальнейшая речь пойдет именно о работе в данном редакторе. При работе с аудиозаписями существуют различные способы редактирования. Рассмотрим некоторые из них подробнее.

Имея исходный аудио файл (audio1 Приложение 1) можно преобразовать его до неузнаваемости. Конечно, в обычной жизни это кажется только забавным использованием программы, но при профессиональной работе со звуком зачастую обработка с помощью эффектов совершенствует, а иногда и спасает аудио запись.

Одним из распространенных аудио эффектов является delay. Данный эффект применяется прежде всего тогда, когда запись аудио была выполнена с помощью одного микрофона, преобразуя его в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписи. При обработке трека задается время задержки для обоих каналов (правого и левого), а так же уровень задерживаемого сигнала, добавляемого в исходный. На примере (audio2 Приложение 1) хорошо слышно появление стереовещания. Однако рассмотренная обработка невелика - уровень задержки порядка 80 миллисекунд.

Так же часто используется эффект Echo. Более сложный предыдущего, но в отличии от него дополнительно обрабатывает задержанные копии сигнала, изменяя их спектр. При работе с данным эффектом возможно изменить уровень задержанного сигнала, время его существования, время задержки, и корректировать задержку с помощью эквалайзера.

Reverb относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации состоит в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает dilay. Отличие заключается в том, что при реверберации число задержанных копий сигнала может быть значительно больше, чем при dilay (audio4 Приложение 1 ). Данный эффект часто используется звукооператорами при обработке голоса.

Естественно кроме обработки звуковой информации различными эффектами в редакторе можно ”нарезать” трек. Т.е. можно вырезать часть информации, вставить её в другой блок и т.д. Так же аудио файл можно перевернуть, т.е. добиться его звучания в другую сторону. При некотором старании можно получить интересные преобразования даже не прибегая к серьезным эффектам.

Так же особого внимания заслуживает команда Mix past. Данная команда накладывает звуковые данные из буфера обмена на существующую аудиозапись(audio6 Приложение 1). Возможна как вставка вместо предыдущего, так и, как показано на примере, наложение.

Так же одной из полезнейших функций любого звукового редактора является Noise Reduktion. С помощью данного редактора можно уменьшить уровень шума, до неощутимого человеком уровня.

Приведенные эффекты только некоторая часть и всевозможных обработок звука. Рассмотренные мной эффекты встречаются практически в каждом редакторе и поэтому самые часто используемые. На самом деле для обработки различной информации подходят различные эффекты и настройки. Естественно что для обработки звука, электрической гитары или камерного органа обработка будет абсолютно различной а следовательно будет различен и результат.

Заключение


Компьютерные технологии являются одной из самых развивающихся отраслей современного мира. Буквально каждую неделю создаются всё более новые и усовершенствованные программы и техника. Конечно, это делает информатику сложной наукой, но, в то же время, именно по этой причине она интересна. Обработка звуковой информации представляется сложный, но необходимый в наше время процесс. Однако, благодаря разработке множества средств форматирования аудиозаписей, заниматься этим становится всё проще, даже для обычного пользователя. Изучение данной темы в курсы школьной программы может способствовать развитию у детей интереса к другим предметам, таким как математика, физика, музыка и интегрированному изучению данных предметов. К сожалению, вопрос бесплатного или хотя бы доступного ПО, остается поставленным очень жестко и является большой проблемой для современного образования. Поэтому возможности обработки звуковой информации следует рассматривать не углубляясь, однако, давая материал для самостоятельного размышления и изучения.

Список используемой литературы


1. Рош У.Л. Библия мультимедиа - Киев: ДиаСофт, 1998- 800 с.

. Информационная культура: Кодирование информации. Информационные модели. 9-10-е классы - М.: Дрофа, 2000 - 208 с.

. Угринович Н.Д. Информатика и информационные технологии. Учебное пособие для 10-11-х классов. Углубленный курс - М.: Лаборатория Базовых Знаний, 2000 - 440 с.

. Кенцл Т. Форматы файлов Internet - СПб.: Питер, 1997 - 320 с.

5. Симаненков Д. Тема номера. Компьютерра № 30-31, с. 20-33; № 32/1998, с. 20-28 (http://www.computerra.ru/offline/1998/258 и <http://www.computerra.ru/offline/1998/260>).

. Еремин Е.А. Представление звуковой информации в ЭВМ. Информатика 2004, № 45, с. 16-17.

Похожие работы на - Компьютерное представление звуковой информации

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!