В Amazon Athena партиционирование делается на основании колонок, которые часто используются в фильтрах запросов, чтобы уменьшить объем сканируемых данных и повысить производительность.

Чаще всего партиционируют по датам (например, year, month, day), так как многие аналитические запросы фильтруют данные по времени. Также могут использоваться другие логические колонки, например, region, category или status, если они позволяют эффективно ограничить выборку.

Пример:

CREATE EXTERNAL TABLE logs (
  id string,
  event string,
  ...
)
PARTITIONED BY (year string, month string, day string)
LOCATION 's3://bucket/path/';

Партиционирование строится на анализе паттернов запросов и структуры данных, чтобы минимизировать сканирование ненужных файлов.

На основании чего делали партиционирование в Amazon Athena?