Data Engineer

Даны две таблицы t1 и t2. Задача выписать все виды джойнов, которые знаешь, и результат запроса select * from t1 <join> t2 on t1.t = t2.t для каждого из них. |t1.t| ------ 1 2 4 null ------ |t2.t| ------ 1 3 null null

Middle

Купер

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start d = { True: 42, 1: 2, 1.0: 100500 } print(d)

Middle

Леман про

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start

Middle

Леман про

В чём отличие RANK() от DENSE_RANK()?

Junior

Яндекс

Где лучше работает сжатие данных — в колоночном или строчном хранении и почему?

Junior

Яндекс

Расскажи, что ты знаешь про колоночное и строчное хранение данных. Когда и какое надо выбирать и почему?

Junior

Яндекс

Чем отличается цикл по строке от цикла по tuple в Python? Какие типы являются базовыми и как это влияет на производительность?

Middle

Купер

Расскажи о своём опыте работы: задачи, стек технологий

Junior

МодульБанк

Как подойти к ситуации, когда бизнес просит отчёт с визуализацией данных по новой акции?

Middle

Леман про

Сколько дополнительной памяти требует решение со словарём, не считая возвращаемых данных?

Junior

Яндекс

Как работали с Impala?

Middle

Aston

Где можно посмотреть логи задач в Airflow?

Middle

FOM GROUP

Расскажите о вашем опыте работы с Greenplum, DBT и Data Vault. Почему перешли от модели снежинки к Data Vault?

Middle

Купер

Что такое индексы в базах данных, зачем они нужны и какова их внутренняя структура?

Middle+

СБЕР

Где появляется параллелизм в Airflow?

Middle

FOM GROUP

С оптимизацией запросов приходилось работать? С чего вообще начинается оптимизация?

Middle

МВидео

Чем Pandas лучше обычных списков и словарей в Python?

Middle

FOM GROUP

Начиная с каких особенностей можно сказать, что хранилище данных нужно?

Middle

Леман про

Как Pandas обрабатывает пропущенные данные?

Middle

FOM GROUP

Как решить задачу за линейное время O(n), используя словарь? Что нужно хранить в словаре, чтобы потом собрать отсортированную строку? Как обработать символы, которых нет в order?

Junior

Яндекс

/17