Sobes.tech

Data Engineer

Даны две таблицы t1 и t2. Задача выписать все виды джойнов, которые знаешь, и результат запроса select * from t1 <join> t2 on t1.t = t2.t для каждого из них. |t1.t| ------ 1 2 4 null ------ |t2.t| ------ 1 3 null null

Middle
КуперКупер
18

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start d = { True: 42, 1: 2, 1.0: 100500 } print(d)

Middle
Леман про
18

Где лучше работает сжатие данных — в колоночном или строчном хранении и почему?

Junior
Яндекс
17

SELECT * FROM table1 AS t1 LEFT JOIN table2 AS t2 ON t1.date_start > t2.date_start

Middle
Леман про
16

Расскажи, что ты знаешь про колоночное и строчное хранение данных. Когда и какое надо выбирать и почему?

Junior
Яндекс
13

Чем отличается цикл по строке от цикла по tuple в Python? Какие типы являются базовыми и как это влияет на производительность?

Middle
КуперКупер
13

Где можно посмотреть логи задач в Airflow?

Middle
FOM GROUP
11

В чём отличие RANK() от DENSE_RANK()?

Junior
Яндекс
10

Начиная с каких особенностей можно сказать, что хранилище данных нужно?

Middle
Леман про
10

Как подойти к ситуации, когда бизнес просит отчёт с визуализацией данных по новой акции?

Middle
Леман про
10

Что такое индексы в базах данных, зачем они нужны и какова их внутренняя структура?

Middle+
СБЕРСБЕР
9

Как Pandas обрабатывает пропущенные данные?

Middle
FOM GROUP
9

С оптимизацией запросов приходилось работать? С чего вообще начинается оптимизация?

Middle
МВидеоМВидео
9

Расскажи о своём опыте работы: задачи, стек технологий

Junior
МодульБанк
9

Чем Pandas лучше обычных списков и словарей в Python?

Middle
FOM GROUP
9

Расскажите о вашем опыте работы с Greenplum, DBT и Data Vault. Почему перешли от модели снежинки к Data Vault?

Middle
КуперКупер
9

Как работали с Impala?

Middle
AstonAston
9

Сколько дополнительной памяти требует решение со словарём, не считая возвращаемых данных?

Junior
Яндекс
8

За какое время будет работать решение с использованием встроенного sorted? Можно ли придумать более быстрое решение?

Junior
Яндекс
8

Как будет читаться файл из HDFS, например Parquet — целиком или по блокам?

Middle
AstonAston
8
/16