Обновления в декабре

2023-12-21

1) Мы добавили новую модель BandIt Plus для разделения треков на голос, музыку и эффекты. Она может быть полезна для телевизионных или кинематографических роликов. Модель была выложена авторами статьи "A Generalized Bandsplit Neural Network for Cinematic Audio Source Separation" в репозитории на GitHub. Модель была натренирована на наборе данных Divide and Remaster (DnR). И на данный момент имеет лучшие метрики качества среди подобных моделей. Демо работы алгоритма можно посмотреть здесь.

Таблица качества

Название алгоритма	DnR dataset
Название алгоритма	SDR Speech	SDR Music	SDR Effects
BandIt Plus	15.62	9.21	9.69

2) Код почти для всех моделей был обновлен таким образом, что качество разделения немного выросло, а скорость разделения увеличилась.

3) Модель для удаления звуков толпы (Crowd removal) была обновлена. Добавлено более качественное удаление смеха.

🗎 Copy link

Обновления в декабре

Site information

Company

Extra