1) ViperX сделал релиз своих весов для модели BS Roformer, которая делает разделение музыкального трека на вокальную и инструментальную части. Качество разделения на данный момент лучшее в мире. Мы добавили эти веса на MVSep. Показатели SDR увеличились по сравнению с нашей собственной моделью BS Roformer.
Multisong датасет:
SDR vocals изменился: 10.43 -> 10.87
SDR instrumental изменился: 16.73 -> 17.17
Synth датасет:
SDR vocals изменился: 12.45 -> 12.76
SDR instrumental изменился: 12.16 -> 12.46
2) На основе новой весов от ViperX мы обновили алгоритмы ансамблей:
Ensemble (vocals, instrum) на Multisong датасете:
SDR vocals: 10.75 -> 11.06
SDR instrum: 17.06 -> 17.37
Ensemble (vocals, instrum) на Synth датасете:
SDR vocals: 12.76 -> 13.00
SDR instrum: 12.46 -> 12.70
Ensemble (vocals, instrum, bass, drums, other):
SDR vocals: 10.75 -> 11.06
SDR instrum: 17.06 -> 17.37
SDR bass: 12.53 -> 12.57
SDR drums: 11.84 -> 11.94
SDR other: 7.15 -> 7.22
3) Мы добавили больше функций в наш API MVSep для разработчиков.