Что можно сказать об оптимальности плана запроса? MVCC Имеется таблица CREATE TABLE orders ( id BIGSERIAL PRIMARY KEY, status TEXT, updated_at TIMESTAMP ); и запрос к ней, выполняющийся каждую секунду UPDATE orders SET status = 'processed', updated_at = now() WHERE id = 1; Через несколько дней вы замечаете: • размер таблицы сильно вырос • работает медленнее запрос SELECT * FROM orders WHERE id = 1 Вопросы кандидату 1. Почему таблица растёт, хотя строка всегда одна и та же? 2. Какую роль играет MVCC в этой ситуации? 3. Что должно решать эту проблему?
Answer from AI
sobes.tech AI
-
Таблица растёт, потому что в PostgreSQL (и других СУБД с MVCC) при обновлении строки не происходит перезапись существующей записи, а создаётся новая версия строки. Старая версия остаётся в таблице до тех пор, пока не будет удалена сборщиком мусора (VACUUM). Поэтому даже при обновлении одной и той же строки физически в таблице накапливаются старые версии, что увеличивает размер таблицы.
-
MVCC (многоверсионность) обеспечивает изоляцию транзакций, позволяя видеть данные в состоянии на момент начала транзакции. Для этого при обновлении создаётся новая версия строки, а старая остаётся для других транзакций, которые могут её читать. Это приводит к накоплению "мертвых" версий строк.
-
Проблему решает регулярный запуск VACUUM (особенно VACUUM FULL или autovacuum), который удаляет устаревшие версии строк и освобождает место. Также можно настроить autovacuum для более частого срабатывания, чтобы не накапливались старые версии. В некоторых случаях помогает реорганизация таблицы или использование более подходящих стратегий обновления данных.