MID-LEVEL FEATURES FOR AUDIO CHORD RECOGNITION USING A DEEP NEURAL NETWORK

Результат исследований: Вклад в журналСтатья

Аннотация

Глубокие нейронные сети, состоящие из нескольких предварительно обученных слоёв, успешно применяются в задачах, связанных с обработкой звука. В данной работе предложены и рассмотрены применительно к задаче распознавания аккордов некоторые конфигурации глубоких нейронных сетей (в том числе рекуррентных), допускающие предварительное послойное обучение при помощи многослойных очищающих автоассоциаторов. Рассмотренные нейронные сети позволяют преобразовывать спектрограмму звукозаписи в последовательность векторов признаков, по которой затем определяются звучащие аккорды. Качество распознавания аккордов, достигнутое с использованием описанных признаков, сравнивается с качеством распознавания аккордов, достигнутым при помощи часто используемых хроматических признаков, при вычислении которых не используются методы машинного обучения.
Язык оригиналаАнглийский
Страницы (с-по)109-117
Число страниц9
ЖурналУченые записки Казанского университета. Серия: Физико-математические науки
Том155
Номер выпуска4
СостояниеОпубликовано - 2013

ГРНТИ

  • 50.00.00 АВТОМАТИКА. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

Уровень публикации

  • Перечень ВАК

Fingerprint Подробные сведения о темах исследования «MID-LEVEL FEATURES FOR AUDIO CHORD RECOGNITION USING A DEEP NEURAL NETWORK». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать