Как изменится ROC AUC при дублировании положительных и отрицательных объектов и почему?

Компании, где спрашивали

Avito

Ответ от нейросети

sobes.tech AI

ROC AUC (площадь под ROC-кривой) является метрикой, которая измеряет качество ранжирования модели, то есть насколько хорошо модель разделяет положительные и отрицательные классы.

При дублировании положительных и отрицательных объектов (то есть увеличении выборки за счет копирования тех же примеров) ROC AUC не изменится. Это связано с тем, что ROC AUC зависит от относительного порядка предсказанных вероятностей для положительных и отрицательных объектов, а не от количества объектов.

Дублирование данных увеличивает количество пар сравнения, но все они будут иметь те же предсказания и метки, поэтому доля правильно упорядоченных пар (которая и есть ROC AUC) останется неизменной.

Таким образом, ROC AUC инвариантен к дублированию данных, если при этом не меняется распределение предсказаний.

Предыдущий Следующий