Sobes.tech
Back to questions
Middle+
5

Что можно сказать об оптимальности плана запроса? MVCC Имеется таблица CREATE TABLE orders ( id BIGSERIAL PRIMARY KEY, status TEXT, updated_at TIMESTAMP ); и запрос к ней, выполняющийся каждую секунду UPDATE orders SET status = 'processed', updated_at = now() WHERE id = 1; Через несколько дней вы замечаете: • размер таблицы сильно вырос • работает медленнее запрос SELECT * FROM orders WHERE id = 1 Вопросы кандидату 1. Почему таблица растёт, хотя строка всегда одна и та же? 2. Какую роль играет MVCC в этой ситуации? 3. Что должно решать эту проблему?

Companies where asked
Gravilink

Answer from AI

sobes.tech AI

  1. Таблица растёт, потому что в PostgreSQL (и других СУБД с MVCC) при обновлении строки не происходит перезапись существующей записи, а создаётся новая версия строки. Старая версия остаётся в таблице до тех пор, пока не будет удалена сборщиком мусора (VACUUM). Поэтому даже при обновлении одной и той же строки физически в таблице накапливаются старые версии, что увеличивает размер таблицы.

  2. MVCC (многоверсионность) обеспечивает изоляцию транзакций, позволяя видеть данные в состоянии на момент начала транзакции. Для этого при обновлении создаётся новая версия строки, а старая остаётся для других транзакций, которые могут её читать. Это приводит к накоплению "мертвых" версий строк.

  3. Проблему решает регулярный запуск VACUUM (особенно VACUUM FULL или autovacuum), который удаляет устаревшие версии строк и освобождает место. Также можно настроить autovacuum для более частого срабатывания, чтобы не накапливались старые версии. В некоторых случаях помогает реорганизация таблицы или использование более подходящих стратегий обновления данных.