Bleedless и Fullness. Эти метрики используют разности спектрограмм амплитуд между оцениваемым и эталонным сигналами, преобразованные в шкалу мел-частот и децибелы (дБ) для соответствия человеческому слуховому восприятию. В данной системе положительные значения указывают на нежелательные добавленные сигналы (например, перетекание, артефакты), а отрицательные — на недостающий контент (например, потерянные гармоники, отсутствующие инструменты). Метрика Bleedless штрафует средние положительные разности, а Fullness — средние отрицательные. Другими словами, Bleedless количественно оценивает, насколько оцениваемый сигнал "перетекает" в эталонный, а Fullness — насколько полно сохранён целевой источник. Обе метрики нормализованы в диапазоне [0, 100], где более высокие значения означают лучший результат.
На рисунке ниже эти концепции показаны через цветовую кодировку. Синие области обозначают отсутствующие в предсказанном треке элементы по сравнению с оригиналом, что снижает оценку Fullness: чем больше синего, тем больше потерь. Красные области показывают нежелательный контент в предсказанном треке, которого нет в оригинале — это "перетекание" из других треков, снижающее оценку Bleedless. Чем больше красного, тем сильнее влияние других инструментов.
Fullness и Bleedless обычно взаимно исключают друг друга в процессе обучения: при росте одной метрики другая уменьшается, и значения могут значительно колебаться. Существуют модели, которые делают акцент на более полное извлечение инструмента, но добавляют шум, и модели, которые снижают уровень шума ценой потери части данных инструмента. Реализация метрик доступна на GitHub.