Data Engineer
Были ли у тебя ad-hoc задачи при наличии чёткого ТЗ, и как ты относишься к ad-hoc запросам и смене приоритетов?
OLAP-кубы тебе знакомы? Когда мы работаем с многомерными данными, похожими на сводную таблицу в Excel, но для более быстрого взаимодействия с большими объёмами данных.
Есть ли какие-то функции и возможности в Greenplum, которых нет в обычном MySQL и других диалектах?
В каком порядке в SQL осуществляются основные операции: SELECT, FROM и т.д.?
У нас ORDER BY по количеству заказов, и у нас идёт два заказа по 5, ещё два заказа по 3. Как себя поведёт RANK() и как DENSE_RANK()?
Тебе пришла задача с номером ABC. Каков твой порядок действий в Git при начале работы?
По каким полям ты дистрибьютировал данные в Greenplum?
Когда ты строил пайплайны на Airflow, как ты решал проблему junk data (мусорных/невалидных данных)?
Строил ли ты дашборды и работал ли с инструментами визуализации данных (BI-инструменты)?