Как выбрать разрядность и частоту дискретизации для микрофона
Как настроить микрофон на Windows 10
Микрофон всегда являлся важной частью персонального компьютера. Но, с распространением быстрого интернета его полезность возросла многократно. Сейчас компьютер с микрофоном можно использовать не только для записи своего голоса, но и для общения с людьми по всему миру.
Но, подключив к компьютеру новый микрофон многие пользователи сталкиваются с проблемами. У некоторых он вообще не работает, у других работает, но очень тихо. Если у вас также есть подобные проблемы, то предлагаем вам наш материал о настройке микрофона на компьютерах с Windows 10.
Как открыть настройки микрофона на Windows 10
Для того чтобы настроить микрофон на компьютере с Windows 10 вам нужно зайти в системные настройки звука. Это можно сделать по-разному. Самый простой вариант, это кликнуть правой кнопкой мышки по иконке звука на панели задач (в нижнем правом углу экрана, рядом с системными часами). После чего в открывшемся меню выбрать пункт «Записывающие устройства».
Также вы можете зайти в «Панель управления» и открыть там раздел «Оборудование и звук – Звук».
Так или иначе, перед вами появится окно «Звук», в котором сосредоточены все основные настройки, которые касаются динамиков, микрофона и вообще звука. Для того чтобы перейти непосредственно к настройкам микрофона откройте вкладку «Запись».
Здесь должны отображаться все микрофоны, которые подключены к компьютеру. Если микрофонов нет, то возможно они неправильно подключены, либо не установлены драйверы для звуковой карты. Более подробно об этих проблемах вы можете почитать в отдельной статье.
Настройка микрофона на Windows 10
После того как вы открыли окно «Звук» и вкладку «Запись», можно приступать к настройке микрофона на Windows 10. Для начала убедитесь, что микрофон включен. Для этого кликните по нему правой кнопкой мышки и выберите «Включить».
Если в системе несколько микрофонов, то вы также должны выбрать основной микрофон. Для этого выделите нужный микрофон и нажмите на кнопку «По умолчанию».
Чтобы проверить работает ли микрофон можно сказать что-то в него и понаблюдать за полоской в правой части окна. Она должна отображать изменение уровня сигнала от микрофона.
После этого можно переходить к основным настройкам микрофона Windows 10. Для этого выделите нужный микрофон мышкой и нажмите на кнопку «Свойства».
В результате откроется окно с настройками выбранного вами микрофона. Здесь все настройки размещены на нескольких вкладках. Самые важные настройки начинаются с вкладки «Прослушать». Здесь доступна функция «Прослушивать с данного устройства». Если ее включить, то звук с микрофона будет передаваться сразу на ваши динамики.
На вкладке «Уровни» можно настроить громкость микрофона и его усиление. Эти параметры будут очень полезны если ваш микрофон работает слишком тихо. Но, нужно помнить, что использование параметра «Усиление микрофона» может привести к появлению шумов.
На вкладке «Enchacement» или «Улучшения» доступны настройки микрофона, которые касаются улучшения качества звука. Настройки, которые здесь доступны зависят от модели вашей звуковой карты и версии драйвера. Поэтому у вас данная вкладка может сильно отличаться.
Последняя вкладка настроек микрофона называется «Дополнительно». Здесь можно выбрать разрядность и частоту дискретизации, которая будет использоваться при записи звука.
Также на вкладке «Дополнительно» есть кнопка «По умолчанию», которая возвращает стандартные настройки разрядности и частоты дискредитации микрофона.
Посмотрите также
comp-security.net
Проверяем на практике бессмысленность высоких частот дискретизации / Habr
Много чего написано про ненужность частоты дискретизации 192000 Гц в звуковых файлах, предназначенных для прослушивания. Но аргументы обычно ссылаются на теоремы, для правильного понимания которых нужно довольно хорошо разбираться в математике. Но есть другой способ проверки некоторых утверждений — провести соответствующие эксперименты много раз.Для начала необходимо сформулировать утверждение, которое будет проверяться в дальнейшем. Если частота 192000 Гц избыточна, то должна существовать более низкая частота дискретизации, при которой происходит корректное восстановление звукового сигнала. Предположим, что это частота 44100 Гц. Если при 192000 Гц происходит корректное восстановление, и при 44100 Гц происходит корректное восстановление, то в обоих случаях результат на выходе должен быть одинаковым. Чтобы проверить это на практике, нужно дорогое оборудование, которое есть далеко не у каждого. Поэтому пойдём немного другим путём. Если в файлах 44100 Гц и 192000 Гц содержится одинаковое количество информации о звуке, то это означает, что преобразование из 192000 Гц в 44100 Гц является сжатием без потерь, следовательно, должен существовать способ восстановления из файла 44100 Гц исходного файла 192000 Гц. Вот это уже может проверить каждый на любом современном компьютере.
В качестве исходника я выбрал музыкальный фрагмент с частотой дискретизации 192000 Гц. Если мне попался какой-то неправильный материал, в котором изначально не было чего-то важного, что должно потеряться при преобразовании из 192000 Гц в 44100 Гц, то любой желающий может проделать описанное в этой статье с любым другим файлом. Все действия будут производиться в свободном редакторе Audacity со стандартными эффектами. Все получаемые в процессе файлы будут сохраняться в формате FLAC с разрядностью 24 бит.
Исходный файл хранится в файле «A.FLAC» и выглядит вот так:
А вот так выглядит его спектр:
Нас интересует только звуковая информация, поэтому ультразвук удалим с помощью эквалайзера.
И получим такой спектр:
Экспортируем результат в файл «B.FLAC» — именно с ним мы будем сравнивать файл, который получится в конце всех преобразований.
Перед преобразованием частоты дискретизации убедимся, что в настройках выставлено максимальное качество:
Далее выбираем новую частоту дискретизации проекта и его экспортируем в файл «C.FLAC»
Затем открываем файл «C.FLAC», устанавливаем частоту дискретизации проекта 192000 Гц и экспортируем в файл «D.FLAC».
И остался самый главный этап: открыть файлы «B.FLAC», «D.FLAC» и сравнить их:
Посмотрим поближе:
Разницы нет. Сравним получше — инвертируем одну из дорожек
И сведём всё в одну дорожку:
Тишина! Полная тишина!
А чтобы всё же увидеть разницу, надо увеличить амплитуду на 96 дБ!
Разница настолько тихая, что её невозможно услышать, а это значит, что при преобразовании из 192000 Гц в 44100 Гц в звуковом диапазоне информация не теряется. Вот так без глубоких познаний в математике с помощью доступного каждому программного обеспечения можно проверить достаточность частоты дискретизации 44100 Гц для хранения музыкальных файлов.
habr.com
Записывая звук, выбираем оптимальную частоту. Полезная информация
Не только новичкам, но и некоторым энтузиастам, занимающихся звуком много лет, покажется откровением тот факт, что банальный процесс записи сопровождается сложнейшими физическими явлениями. Одним из таковых называют дискретизацию. Согласно определению, она представляет собой процесс преобразования непрерывной функции в дискретную. Людям, далёким от науки, это понять сложно, тем более, здесь задействована квантовая физика – самая сложная из существующих на сегодняшний день. Но профессиональные звукорежиссёры, например, работающие в московской студии звукозаписи «Интервал», знают, что такое частота дискретизации звука, какая лучше применима в тех или иных случаях. Почему? Потому что от этого явления зависит конечное качество записываемой музыки. В кассетно-плёночный период эти нюансы, ввиду ограниченной технической оснащённости, опускались. Но в современном высокотехнологичном цифровом мире частота дискретизации звука имеет значение при создании музыки и демонстрации её слушателям.
Детализация понятий
Что такое разрядность и частота дискретизации, какая лучше? Ответ на данный вопрос, несмотря на сложность природы этих явлений, получить можно. При этом нет необходимости штудировать учебники по физике. Достаточно вспомнить, что советскими полуподпольными звукорежиссёрами, записывающими рок и другую музыку, эти показатели определялись на интуитивном уровне. Дискретизацию ещё называют сэмплированием. Это определение более понятно для музыкантов. Её частота подразумевает интенсивность процессов в тот момент, когда аналоговый сигнал преобразуется в цифровой. Среди них хранение данных, конвертация, и непосредственно оцифровка.
Частота дискретизации измеряется в герцах. Ориентиром в её изучении является теорема Котельникова. Её автор раскрывает суть дискретизации. Согласно теореме, она ограничивает интенсивность оцифрованного сигнала до половины собственной величины.
Частота дискретизации. В чём её значение для звукозаписи
Дискретизация по времени – это процесс, который непосредственно связан преобразованием аналогового сигнала в цифровой. Наряду с ней происходит квантование данных по амплитуде. Дискретизация по времени означает измерение сигнала в момент всей его передачи. В качестве единицы берётся один сэмпл. Если на словах это не совсем понятно, то на примере выглядит более убедительно. Допустим, частота дискредитации равняется 44100 Гц – та самая, которая применялась на аудио-CD. Это означает, что сигнал измеряется 44100 раз в течение одной секунды.
Аналоговый сигнал по своей насыщенности всегда превосходит цифровой. И его преобразование – это неизбежная потеря в качестве. Частота дискретизации служит своеобразным ориентиром: чем она выше, тем ближе качество цифрового звука к аналоговому. Это явственно просматривается в списке ниже. Он показывает, какая частота звука лучше. Изучая его, вы увидите непосредственную взаимосвязь дискретизации и качества трека:
- 1. 8000 Гц. Данная частота характерна для телефонных разговоров и записи речи на простой по набору функций диктофон. Используется на звуке, преобразовываемом через кодек Nellymoser.
- 2. 22050 Гц применяется в радиовещании.
- 3. 44100Гц. Как уже упоминалось выше, данная частота характерна для Audio CD, и этот показатель долгое время отождествлялся с наиболее высоким уровнем качества. И сегодня формат не утрачивает своих позиций.
- 4. 48000 Гц. Это форматы DAT и DVD, пришедшие на смену AUDIO.
- 5. 96000 – DVD-аудио MLP-5,1.
- 6. 2822 400 ГЦ – высокотехнологичный формат SACD Super Audio.
Список чётко указывает на то, какая частота звука лучше. К тому же технологии на месте не стоят, и появляются новейшие форматы. Но прежде чем строить далеко идущие планы, следует учесть один очень весомый нюанс. Его суть проста: чем выше частота дискретизации, тем сложнее её достичь технологически. Для этого необходимо:
- обеспечить высокую интенсивность передачи цифровых потоков. А это возможно далеко не на каждом интерфейсе. И чем больше каналов задействовано в записи (а это характерно для музыкальных ансамблей), тем процесс сложнее;
- иметь на вооружении процессор, способный производить мощные вычислительные операции. Но даже в самых современных образцах возможности для получения звука сверхвысокого качества ограничены;
- использовать для записи компьютерную технику, обладающую большим объёмом оперативной памяти.
Учитывая вышеизложенную информацию, неудивительным является тот факт, что частота звука, равная 44100 Гц, продолжает оставаться наиболее востребованной и сегодня. Она десятилетиями удовлетворяет даже самые взыскательные запросы к качеству, и вместе с тем имеются все технические возможности для её достижения. Последний фактор является определяющим как для рядовых пользователей, так и для большинства звукозаписывающих студий. Даже зная, какая частота звука лучше, чтобы достигнуть её, необходимо позаботиться о технической оснащённости.
studiointerval.ru
мифы и реальность — Ferra.ru
Экспертное прослушивание
В качестве «референсных» устройств использовались:
- наушники типа «бутоны» (со сменными силиконовыми вкладышами) Sharp HP-MD33-S, номинальный импеданс 16 Ом
- Мониторные наушники Sennheiser 265 Linear (150 Ом)
Задействованные акустические системы:
Прослушивание показало, что наушники с номиналом 16 Ом категорически противопоказаны. Система прекрасно распознает их подключение, но бас куда то исчезает, а все фоновые шумы (в том числе от работающих дисков) как будто избирательно усиливаются. Наушники сопротивлением 150 Ом озвучиваются с полноценным басом, но система автоматически не распознала подключение профессионального номинала.
Нелинейные искажения на хороших колонках становятся слишком заметны. Подключение «хайфайной» многоканальной акустики лишено смысла при наличии только стерео записей. Хвала Всевышнему, программное (WinDVD 5.0 Platinum) воспроизведение шестиканального DVD - audio 24 бит 96 кГц идет без коверканного ресэмплирования звукового сигнала в 16 бит. Вот если бы Azalia еще и поддерживала многоканальный SACD! Тогда компьютерное аудио можно было бы рассматривать как резерв Hi-Fi аппаратуре.
Искусственная виртуализация даже на крутом шестиканальном акустическом комплекте вряд ли произведет должное впечатление. Кодек здесь ни при чем: просто в алгоритмах извлечения дополнительных каналов из обычного стерео о революционных достижениях говорить не приходится.
На панели настроек программного обеспечения кодека C-Media имеется занятная кнопочка под названием Dolby Digital Live. Неужто режим кодирования «живет»? Вынужден вас огорчить: в рамках нашего тестирования этот режим не исследовался – какие либо настройки качества кодирования в текущей версии программного обеспечения не доступны. Хотя кодек C-Media 9880 такую экзотику поддерживает, но все «штучки» от Dolby ® Laboratory, включая DDICE-DolbyR Digital Interactive Content Encoder, являются опциональными «софтовыми».
Возможно, использование более удачного аудио кодека и обвешивание его всякими фильтрами при встраивании в материнскую плату улучшит ситуацию, однако 32 бит 192 кГц звука нужны здесь как «в бане лыжи». Тем более миниатюризация материнок и корпусов входит в моду, и впихивать громоздкие «хай-файные» аудио железяки будет попросту некуда.
Заключение
Интегрированное аудио снова, мягко говоря, не блеснуло. Налицо «дебилизация» массового компьютерного звука. Алгоритмические примочки и прочие искусственные эффекты берут верх (за счет дешевизны размножения?).
Как выяснилось, технология High Definition Audio, реализованная в нынешнем виде, ничего общего не имеет с действительно высококачественным звуком (представленным в форматах DVD-audio и SACD). Просто очередная завлекалочка для покупателей, любителей всего новенького, обладающих дешевенькой многоканальной акустикой. Да, удобство эксплуатации впечатляюще улучшилось,а количество цифровых обработок значительно возросло и интерфейс приосанился. Но качество воспроизведения аналогового звука не улучшилось, а на некоторых материнских платах даже упало (по сравнению с добротными 16 битными аудио устройствами). Вот тебе и Azalia: реальная полоса частот не выше 20 кГц, хиловатый динамический диапазон 85 дБА, куча нелинейных искажений, пролезание импульсных помех, смехотворная разница между 16 и 24 бит. И это только воспроизведение. Запись на протестированной Azalia оказалась откровенно посредственной. При задействовании виртуальной многоканальности ключевые показатели еще хуже (вдобавок искажается частотный отклик). Отговорка вроде той, что драйверы-алгоритмы еще совершенствуются, спустя год, не убеждает.
Следует признать, что использование дорогого супер кодека с выделением обширного места на материнской плате под обвязку и частокола фильтров способно существенно улучшить ситуацию. Однако подозреваю, что популярным такое решение не станет. Если появится хотя бы одна реально продвинутая модель, то это уже станет событием из ряда вон. Поэтому истинным ценителям качественного звука от внешних саунд-карт отказаться не удастся и во времена High Definition Audio.
Ну а что творится со звуком на цифровых выходах сегодняшней (и завтрашней) Azalia – отдельная тема.
PS
Нынешние заправилы компьютерного аудио забывают прописную истину: главное – качество исходного сигнала и его воплощения в звук, а все остальное – вторично.
www.ferra.ru
Сравнение 24-битного и 16-битного звука: результаты аудиотеста / Habr
Блогер Archimago немало сил потратил, чтобы ответить на вопрос: какое качество звука человек способен определять на слух? В рамках одного из его последних аудиотестов респондентов просят вслепую различить звуки с динамическим диапазоном 24 бит и 16 бит. Каждый из них скачивал несколько пар 24-битных файлов, один из которых претерпел конверсию 24-16-24 бита, то есть на практике был 16-битным файлом. Их просили определить разницу.В тесте приняли участие 140 добровольцев (138 мужчин и 2 женщины: честная демографическая картина для аудиофилов). Средний возраст респондентов: 44 года.
Согласно анкетам, более 20% респондентов назвались музыкантами и звукоинженерами, поэтому можно сравнить результаты среди «профессионалов» и любителей, с учётом статистической погрешности.
Стоимость аудиоаппаратуры у участников опроса чаще всего лежит в диапазоне от $1000 до $3000.
Результаты опроса по трём парам файлов довольно любопытны. В двух из трёх композиций правильные и неправильные ответы распределились ровно пополам.
А в композиции Bozza 52,85% пользователей ошиблись, приняв 16-битный файл за 24-битный.
20 респондентов правильно ответили на все вопросы, а 21 человек ошибся во всех вариантах, что тоже вписывается в рамки статистического распределения.
Ещё более удивительно, что музыканты показали результат хуже среднего, даже с учётом статистической погрешности! Особенно сильно напутали в композиции Вивальди.
А вот результат среди пользователей, у которых стоимость звукового оборудования превышает $6000.
Наушники тоже вовсе не помогают отличить 16-битную музыку от 24-битной.
Подводя итог. Конечно, есть приложения, в которых нужно работать именно с 24-битным звуком (тот же мастеринг). Но факт в том, что на слух 16- и 24-битный звук совершенно не различимы друг от друга. Если кто-то заявляет, что способен услышать разницу, то этот человек наверняка заблуждается.
habr.com
Частота дискретизации и разрядность | Алексей Данилов
Когда сигнал поступает на АЦП с предусилителя, компрессора, выхода пульта, синтезатора, — он представляет собой электромагнитные колебания. То есть на вход АЦП приходит некая волна с изменяющимся напряжением (очень маленьких величин). Для сохранения сигнала в файл его нужно «оцифровать», то есть закодировать с помощью единиц и нулей. В результате получается график волны на экране компьютера.
Даже самый лучший преобразователь имеет погрешность, ведь между нулем и единицей нет промежуточных значений, и график волны будет состоять только из вертикальных и горизонтальных отрезков, без наклонных линий. На графическую прорисовку волны будут влиять высота звука (частота колебаний), его тембр (форма волны) и громкость (амплитуда). Качественный АЦП должен корректно передать системе записи все эти параметры.
Итак, звук поступает в систему дискретно, то есть разделенным мелкие отрезки. От величины этих отрезков зависит точность кодирования аналогового сигнала в цифровой среде. Чем мельче горизонтальная и вертикальная дискретные единицы, тем точнее оцифровка.
Частота дискретизации
Горизонтальное дробление волны дает нам представление о частоте дискретизации, или частоте семплирования. Чем чаще АЦП фиксирует изменения значений графика волны, тем выше частота семплирования. Собственно, один семпл — это дискретный единичный отрезок, минимальная единица звука. Чем он короче, тем выше частота дискретизации.
К примеру, значение частоты дискретизации в 44.1 кГц показывает, что в одной секунде записи содержится 44100 семплов. Мы можем редактировать волну, принимая за минимальный элемент редактирования отрезок длительностью 1/44100 секунды. При увеличении частоты семплирования до 48 кГц этот отрезок уменьшается до 1/48000 доли секунды, давая возможность более точного воздействия.
Согласование частот дискретизации
Каждый семпл по продолжительности равен предыдущему. Для корректного воспроизведения звука частоты дискретизации файла и системы должны быть идентичны. При добавлении в проект звуковой дорожки с частотой дискретизации, отличной от дискретизации хоста (программы), она должна быть сконвертирована.
Если воспроизводить файл более высокой частоты в системе с более низкой, он будет звучать медленнее, чем должен, и наоборот. Конвертирование сигнала из одной частоты в другую всегда приводит к появлению искажений. Чтобы «перекроить» звук под новую частоту дискретизации, система должна разбить семплы на более мелкие куски и снова собрать их в единую волну. Такой процесс может привести в лучшем случае просто к замыливанию звука, в худшем — к появлению щелчков.
Конечно, на встроенных колонках домашнего ноутбука разница будет незаметна. Но если речь идет о работе со звуком на профессиональном уровне, согласование частот дискретизации необходимо.
Не рекомендуется изменять частоту дискретизации в рамках одного проекта. Оправданием повышению дискретизации может быть, например, необходимость обработки файла алгоритмами или плагинами, лучше работающими на высоких частотах. Поскольку более высокая дискретность предполагает разбиение на более мелкие семплы, точность обработки будет выше, а качество в результате лучше. Но гарантировать эффективность этого метода тоже невозможно: в каждом случае результат будет индивидуальным. Необходимо каждый раз оценивать, что важнее — эффект от обработки на более высокой дискретности или негативное влияние конвертации.
Если по какой-то причине после завершения работы на частоте 48 кГц вам потребовалось конвертировать сигнал в 44.1 кГц, сохраните исходный файл на тот случай, если придется повторно вмешиваться в материал (например, для альтернативного мастеринга). Обработка на более высокой частоте дискретизации даст лучший эффект, чем на низкой.
Разрядность звука
Если горизонтальное дробление волны дает нам представление о частоте дискретизации, то вертикальная дискретизация – это разрядность, отвечающая за достоверную передачу динамических элементов записи. Чем большее количество «ступенек» может зафиксировать преобразователь, тем выше разрядность записанного звукового файла.
Например, волна за отрезок времени может совершить движение одной ступенькой от 0 до 16, а может четырьмя — по 4 единицы за шаг. Более точным представлением будет 16 шагов по единице. Количество ступенек, на которые волна дробится по вертикали, — это и есть разрядность.
Чем выше разрядность конвертора, тем достовернее он передаст сигналы разного уровня громкости. Если мы движемся большими шагами, каждый из которых равен 16 единицам (низкая разрядность), то при громкости входящей волны на уровне 4 график ее будет округлять до нуля. А если каждая ступенька разрядности равна 4 единицам (средняя разрядность), значение 4 будет зафиксировано на своем уровне, а значения 3 и 5 округлятся до 4. При единичном шаге все эти значения будут находиться на своих ступеньках — 3, 4, 5 (высокая разрядность).
Таким образом, более высокая разрядность АЦП дает возможность детальнее интерпретировать различные значения громкости звука и максимально приблизиться к форме реальной волны.
Разбиение волны на «ступеньки» по вертикали и горизонтали называется квантованием. Иногда частоту дискретизации называют частотой квантования, а разрядность динамическим квантованием, то есть разделением по уровням громкости (динамика).
Естественно, пример с 16 единицами — условность. Конверторы работают на гораздо более высоких значениях. Например, при разрядности 16 бит система может передать 65536 уровней громкости (2 в степени 16). А при 24 битах — 16777216 уровней (2 в степени 24).
Казалось бы, зачем столько? Неужели наше ухо способно различить хотя бы десять тысяч уровней громкости? Напрямую — не может. Скажем, два сигнала с «соседними» значениями даже при разрядности 16 бит мы различить не в состоянии. Но работа в студии ведется с разнообразными звуками, и некоторые из них имеют значительные перепады по громкости (к примеру, реверберация). Многие процессы требуют тонкой работы с громкостями (например, едва заметное воздействие эквалайзером на спектр). Для корректной работы нужна система с хорошей разрешающей способностью и по горизонтали, и по вертикали.
Но есть и обратная сторона медали. Высокие значения дискретизации и разрядности делают файлы более объемными, и для их обработки системе требуется больше ресурсов. Здесь самое время вспомнить про различия между ресурсонезависимыми и нативными системами. Чем выше квантование, тем сильнее загружается компьютер. Этот фактор более критичен для нативной системы, обремененной обслуживанием операционки и фоновых процессов.
Всегда нужно искать баланс между значениями дискретизации и разрядности и реальными возможностями системы. Не заставляйте ее работать на пределе, оставляйте резерв мощности.
Мы приближаемся к очень важной и мало кому понятной теме, связанной с музыкальным производством. Речь о так называемых шумах квантования. В ближайшее время этому явлению будет посвящен отдельный материал. Понимание природы шумов квантования дает возможность музыканту и звукорежиссеру разобраться в некоторых непростых вопросах, связанных с записью музыки в цифровой среде. Поскольку ввиду дороговизны и сложности в обслуживании аналогового оборудования подавляющее большинство музыкантов работает прежде всего именно в цифровых системах записи, эта тема так или иначе затрагивает всех.
Следите за обновлениями блога, подписывайтесь на новые статьи, чтобы совершенно бесплатно получать их на электронную почту. Также хочу напомнить, что очень много познавательной практической и теоретической информации содержится в моей книге «Академия Мюзикмейкера», которую без посредников можно приобрести на сайте MusicMaker.Pro.
Остались вопросы? Не стесняйтесь задавать их в комментариях под статьей или присоединяйтесь к обсуждениям в этой группе ВКонтакте, посвященной синтезаторам, музыкальному оборудованию и звукозаписи.
© Алексей ДаниловИллюстрации: А. РублевскийПри перепечатывании ссылка на источник обязательна
Хотите получать новые статьи
прямо на почту?
Подпишитесь на обновления блога А. Данилова
Интересное:
danalex.ru
К вопросу о выборе частоты дискретизации при сэмплировании аудио. – Radana
Статья взята из открытых источников. Интересны ваши мнения!
К вопросу о выборе частоты дискретизации при сэмплировании аудио.
К вопросу о выборе частоты дискретизации при сэмплировании аудио. Конечно, ничего нового и неизведанного в этом нет, какой частотой дискретизации пользоваться при записи музыкальной композиции (подразумеваем, что стремимся мы что-то записать как можно качественней, а не только для информационной наполненности).
Конечно, здесь немалое значение будет иметь сама, на то компьютера способность своевременно обрабатывать входящий аудиопоток, а также свойства аудиокарты.
Но суть, наверное, не в том, «хорошо ли курить или нет», а в самом «виде вывернутых лёгких» — недолгом и наглядном исследовании формы волны, после того, когда возникла полемика насчёт того, насколько лучше качество оцифровки в 96 кГц относительно стандартных 44-х…
После этого приятель «закачал» файл формата DVD-AUDIO на мой компьютер, а я сделал экстракт в «wave» и поместил полученный файл под микроскоп, с названием «Adobe Audition»,
Но об этом чуть позже…
До визуального исследования я полагал (предвзято), что если и будет наблюдаться какое-либо улучшение восприятия подобного звучания, то совсем незначительное, ввиду того, что с увеличением частоты за гранью восприятия звука она (частота) будет почти недосягаемой для «фиксации» мозгом и одел предложенные приятелем наушники (Zennheiser PMX 100) подключенные просто к выходу “дефолтной” звуковой карты компьютера.
Так вот я слушал и слушал, и убеждался в том, что разницу ещё нужно постараться поймать и пошёл к своему компьютеру загружать принятый недавно по «локале» файл. Преобразовал исходный файл в стандарт «wav», сохранив исходные 96 кГц. Теперь сигнал был подан уже через усилитель Pioneer и такие же Zennheiser PMX 100.
…И вот тут-то почувствовал, как преобразился звук, (а ещё я любитель приподнять немного высоких и низких частот…) звук казался «аналоговым». Сразу после этого включаю конвертированный до 44 кГц тот же файл, и… четко понимаю, что это не MP3, а «wave», причём стандарта качества CD-AUDIO, и, тем не менее, контрастом стало ощущение 44 кГц относительно 96-ти. Причём напоминало звучание MP3. И это даже не через высококлассные студийные мониторы и усилители…
А вот и сами «вывернутые лёгкие», загруженные в Аудишн:
Пример 44 кГц. Скачать (4,5 мег.)
Пример 96 кГц. Скачать (14,5 мег.)
Видим чётко, что попадает к нам в уши в обоих вариантах. Сколько нюансов теряется («домысливается», «дорисовывается (кротчайший, вероятный) путь» между соседними сэмплами) и упрощается по известным алгоритмам звуковой волны, где «были» те нюансы, которых мы теперь не слышим… (я про 44..).
Ещё важный момент: не обязательно впадать в фанатизм по поводу качества исходников. Хотя, это безусловно важно, но Оцифрована должна быть прежде всего Ваша идея… я о золотой середине… во всяком случае исходники (например в работе с мультитреком) ниже 48 кГц нежелательны. Если мощность компьютера заведомо недостаточна, то и устанавивать, к примеру, 192 кГц в новой сессии, конечно же неразумно.
Наш сегодняшний пример пришёл на исследование после оцифровки виниловой грамзаписи в формат DVD-AUDIO (понятно, что звуковой картой, «что надо» и «головой» соответствующей) и переконвертированный из этого формата в формат WAV.
Источник статьи
Ещё одно мнение на эту тему - отрывок из этой статьи:
Частота дискретизации
На сегодняшний день даже бюджетные аудио интерфейсы поддерживают частоту дискретизации 192 кГц. Но на различных музыкальных форумах по прежнему ведутся споры о том, стоит ли переходить с частоты дискретизации 44.1 кГц на 48, 88.2 или 96 кГц. Многие музыканты придерживаются комбинации 24-бит/44.1 кГц, потому как продолжают создавать музыку в основном с помощью внешних MIDI клавиатур и программных семплеров, которые работают с семплами 44.1 кГц. Так что они не видят никакого смысла в увеличении частоты дискретизации, тем более что окончательным носителем музыки все равно становится 16-бит/44.1 кГц аудио диск. Однако даже те, кто используют электронные инструменты, оценят более аккуратную компрессию и ограничение пиков на повышенной частоте дискретизации, да и эквалайзер будет работать более точно и звучать приближеннее к аналогу. Музыканты, использующие программные синтезаторы и генераторы формы волны также отметят более чистое звучание.
Для записи живой классической и любой другой акустической музыки большинство серьезных звукоинженеров используют режим 24-бит/96 кГц. В этом особенно есть смысл, если конечным носителем музыки оказывается DVD релиз с частотой дискретизации 48 или 96 кГц (в зависимости от количества каналов). Высокая частота дискретизации гарантирует Вам отличное качество записи на высоких частотах, детали звучания инструментов и пространственную локализацию (возможность различать на записи положение в пространстве каждого инструмента), чем при частоте дискретизации 44.1 кГц или 48 кГц. Также при большой частоте дискретизации высокочастотные сигналы выше 20 кГц делают звучание более натуральным. Однако помните, что качество звука определяется самым худшим звеном в цепи, так что если остальные устройства у Вас не высшего класса, то увеличение частоты дискретизации может Вам абсолютно ничего не дать.
Также стоит помнить, что при использовании частоты дискретизации, например, 192 кГц все плагины и программные синтезаторы будут потреблять в 4 раза больше ресурсов компьютера, занимать в 4 раза больше места на диске и в 4 раза уменьшать возможное время записи в отличие от использования частоты дискретизации 44.1 кГц.
promodj.com
Кодирование звуковой информации — Википедия
В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука — количество уровней)[1].
Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды[2].
Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде[2].
Другое название оцифровки звука — аналогово-цифровое преобразование звука.
Оцифровка звука включает в себя два процесса:
- процесс дискретизации (осуществление выборки) сигнала по времени
- процесс квантования по амплитуде.
Дискретизация по времени[править | править код]

Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется с определенным временным шагом — шагом дискретизации . Количество замеров величины сигнала, осуществляемых в единицу времени, называют частотой дискретизации или частотой выборки, или частотой семплирования (от англ. « sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором находится частота спектра равная Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm.
На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (20 Гц — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью (хотя исходя из теоремы Шенона и Котельникова это возможно)
Линейное (однородное) квантование амплитуды[править | править код]
Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2N −1 равных промежутков, разделив его на 2N уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
Точность округления зависит от выбранного количества (2N) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа — отсчетами или семплами (от англ. « sample» — «замер»). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).
Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.
Другие способы оцифровки[править | править код]
- Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией — неоднородной ИКМ (Nonuniform PCM).
- Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция — разностная ИКМ (англ. « Differential PCM») — в случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов[3].
Аналогово-цифровые преобразователи (АЦП)[править | править код]
Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).
Это преобразование включает в себя следующие операции:
- Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
- Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
- Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
- Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.
Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.
Кодирование оцифрованного звука перед его записью на носитель[править | править код]
Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.
- Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел — значений амплитуды. В этом случае существуют два способа хранения информации.
- Первый — PCM (Pulse Code Modulation — импульсно-кодовая модуляция) — способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
- Второй — ADPCM (Adaptive Delta PCM — адаптивная относительная импульсно-кодовая модуляция) — запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
- Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.
- Кодирование данных без потерь (lossless coding) — способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50 %, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.
- Кодирование данных с потерями (lossy coding). Здесь цель — добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путём использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» — сильное сжатие достигается путём «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания[4].
Терминология[править | править код]
- кодер — программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
- декодер — программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
- кодек (от англ. " codec " — " Coder / Decoder ") — программный или аппаратный блок, предназначенный для кодирования/декодирования данных.
Наиболее распространённые кодеки[править | править код]
- MP3 — MPEG-1 Layer 3
- ОGG — Ogg Vorbis
- WMA — Windows Media Audio
- MPC — MusePack
- AAC — MPEG-2/4 AAC (Advanced Audio Coding)
- Стандарт MPEG-2 AAC
- Стандарт MPEG-4 AAC
Некоторые форматы оцифровки звука в сравнении[править | править код]
Название формата | Квантование, бит | Частота дискретизации, кГц | Число каналов | Величина потока данных с диска, кбит/с | Степень сжатия/упаковки |
---|---|---|---|---|---|
CD | 16 | 44,1 | 2 | 1411,2 | 1:1 без потерь |
Dolby Digital (AC3) | 16-24 | 48 | 6 | до 640 | ~12:1 с потерями |
DTS | 20-24 | 48; 96 | до 8 | до 1536 | ~3:1 с потерями |
DVD-Audio | 16; 20; 24 | 44,1; 48; 88,2; 96 | 6 | 6912 | 2:1 без потерь |
DVD-Audio | 16; 20; 24 | 176,4; 192 | 2 | 4608 | 2:1 без потерь |
MP3 | плавающий | до 48 | 2 | до 320 | ~11:1 с потерями |
AAC | плавающий | до 96 | до 48 | до 529 | с потерями |
AAC+ (SBR) | плавающий | до 48 | 2 | до 320 | с потерями |
Ogg Vorbis | до 32 | до 192 | до 255 | до 1000 | с потерями |
WMA | до 24 | до 96 | до 8 | до 768 | 2:1, есть версия без потерь |
Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя[править | править код]

Помехоустойчивое и канальное кодирование[править | править код]
Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.
Принцип действия ЦАП[править | править код]
Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:
- Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
- Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
- Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот
Параметры, влияющие на качество звука при его прохождении по полному циклу[править | править код]
Основными параметрами, влияющими на качество звука при этом являются:
Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:
ru.wikipedia.org