Нейронная сеть для распознавания жанров музыки

Тайваньские программисты разработали программу, которая сможет самостоятельно определять жанр музыкальных файлов, оценивая музыкальный размер и темп композиции. Поскольку программа основана на искусственных нейронных сетях, поддерживается обучение и повышение точности с каждой новой оценкой.

Систематизация электронных музыкальных архивов становится настоящим кошмаром для многих пользователей. Даже в официально приобретенных музыкальных композициях издатели нередко забывают указать жанр каждой композиции в метаданных. Чтобы облегчить меломанам поиск нужной музыки, исследователь Чан Бяо Ян из национального университета им. Сунь Ятсена решил скомбинировать два базовых подхода к анализу музыкальных записей – так называемые методы Эллиса и Диксона.

На начальной стадии обучения нейронной сети авторы загрузили в эту экспериментальную программу несколько сот записей для бальных танцев. В ходе обучения исследователи исправляли ошибки автоматического оценивания и возвращали композиции на новую обработку. В результате первичного обучения нейронная сеть составила звуковые профили для каждого жанра, исходя из найденных неявных закономерностей.

Второй этап обучения нейронной сети заключался в применении вышеупомянутых методов Эллиса и Диксона для дальнейшего анализа уже оцененных файлов. Эти методы используют различные алгоритмы обработки сигнала при воспроизведении музыки. В каждом из этих методов реализован свой подход к определению разного рода пиковых значений – по взаимному расположению пиковых значений в композиции определяется музыкальный размер такта и темп композиции (например, 120 ударов в минуту для стиля «диско»).

Созданная и обученная система смогла с высокой точностью определить стили в коллекции музыки для бальных танцев. Так, сейчас эта система довольно уверенно отличает стили ча-ча-ча, джайв, квикстеп и танго. Сейчас разработчики планируют провести дополнительное обучение своей системы на файлах с классической, джазовой и поп-музыкой, чтобы расширить диапазон и точность оценки жанра. О коммерциализации нового метода автоматического определения жанра для музыкальных композиций пока ничего не известно.

Прокрутить вверх