Sobes.tech

Data Engineer

Даны две таблицы t1 и t2. Задача выписать все виды джойнов, которые знаешь, и результат запроса select * from t1 <join> t2 on t1.t = t2.t для каждого из них. |t1.t| ------ 1 2 4 null ------ |t2.t| ------ 1 3 null null

Middle
КуперКупер
32

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start d = { True: 42, 1: 2, 1.0: 100500 } print(d)

Middle
Леман про
32

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start

Middle
Леман про
31

В чём отличие RANK() от DENSE_RANK()?

Junior
Яндекс
30

Где лучше работает сжатие данных — в колоночном или строчном хранении и почему?

Junior
Яндекс
30

Расскажи, что ты знаешь про колоночное и строчное хранение данных. Когда и какое надо выбирать и почему?

Junior
Яндекс
27

Чем отличается цикл по строке от цикла по tuple в Python? Какие типы являются базовыми и как это влияет на производительность?

Middle
КуперКупер
26

Расскажи о своём опыте работы: задачи, стек технологий

Junior
МодульБанк
26

Как подойти к ситуации, когда бизнес просит отчёт с визуализацией данных по новой акции?

Middle
Леман про
25

Сколько дополнительной памяти требует решение со словарём, не считая возвращаемых данных?

Junior
Яндекс
25

Как работали с Impala?

Middle
AstonAston
24

Где можно посмотреть логи задач в Airflow?

Middle
FOM GROUP
24

Что такое индексы в базах данных, зачем они нужны и какова их внутренняя структура?

Middle+
СБЕРСБЕР
24

Где появляется параллелизм в Airflow?

Middle
FOM GROUP
23

С оптимизацией запросов приходилось работать? С чего вообще начинается оптимизация?

Middle
МВидеоМВидео
23

Чем Pandas лучше обычных списков и словарей в Python?

Middle
FOM GROUP
23

Расскажите о вашем опыте работы с Greenplum, DBT и Data Vault. Почему перешли от модели снежинки к Data Vault?

Middle
КуперКупер
23

Начиная с каких особенностей можно сказать, что хранилище данных нужно?

Middle
Леман про
23

Как Pandas обрабатывает пропущенные данные?

Middle
FOM GROUP
23

Как решить задачу за линейное время O(n), используя словарь? Что нужно хранить в словаре, чтобы потом собрать отсортированную строку? Как обработать символы, которых нет в order?

Junior
Яндекс
22
/17