Sobes.tech

Data Engineer

В плане запроса можем посмотреть, что происходит с данными, в том числе какие типы джойнов — какие типы джойнов мы можем там увидеть?

Middle
МВидеоМВидео
4

Напрямую со Spark приходилось работать? В чем его минус?

Middle
МВидеоМВидео
4

С Git приходилось работать? Что в Git хранили?

Middle
МВидеоМВидео
4

Как данные из внешней таблицы заливались в целевые таблицы?

Middle
МВидеоМВидео
4

Как Git Flow рекомендует оформлять новый релиз приложения? - Созданием новой issue-ветки - Созданием hotfix-ветки от master - Созданием отдельной release-ветки от develop - Прямым коммитом в ветку master - Слиянием ветки master напрямую в develop

Junior
01.tech
4

Это real-time, нужно как-то между Kafka и ClickHouse Spark включить — как это реализовать?

Middle
МВидеоМВидео
4

Данные из Greenplum и Trino перегружались в ClickHouse — каким образом можно передать данные туда?

Middle
МВидеоМВидео
4

Как вы оформляете свои проекты? Пишете README или что-то ещё?

Middle
ютэйр
3

Как выбрать правильный ключ шардирования для равномерного распределения данных?

Middle
ютэир
3

В чём особенности и отличия Set от List в Python? Помимо производительности, какие ещё есть особенности?

Middle
СБЕРСБЕР
3

-- Дана таблица numbers с одной колонкой num (целые числа, могут повторяться). -- Напишите SQL запрос, который разделит числа на две колонки: -- even – чётные числа (отсортированные по возрастанию) -- odd – нечётные числа (отсортированные по возрастанию) -- Числа должны располагаться строка за строкой: в первой строке – первое чётное и первое нечётное, -- во второй строке – второе чётное и второе нечётное и т.д. -- Если в одной из групп чисел больше, чем в другой, на недостающих местах должно быть NULL. -- исходная таблица -- num -- --------- -- [phone] -- результат запроса -- even | odd -- -----|----- -- 2 | 1 -- 4 | 3 -- 6 | 5 -- 8 | 7 -- 10 | 9 -- NULL | 11 -- NULL | 11

Middle
СБЕРСБЕР
3

Как вы обычно организуете свою работу над задачами и как отслеживаете прогресс?

Middle
ютэйр
3

Как обеспечить глобальную уникальность primary key в PostgreSQL при шардировании?

Middle
ютэир
3

Как вы обычно подходите к построению ETL и ELT процессов? В чём разница этих процессов?

Middle
ютэйр
3

Какое ограничение существует при использовании DISTINCT ON в PostgreSQL с ORDER BY?

Middle
ютэир
3

-- t1 -- num --------- -- 1 -- 2 2 null null 4 -- t2 -- num --------- -- [phone] null null 5 SELECT a.num AS a_num, b.num AS b_num FROM t1 a LEFT JOIN t2 b ON a.num = b.num;

Middle
СБЕРСБЕР
3

В какой команде и под каким руководством вам комфортнее всего работать?

Middle
ютэйр
2

Что для вас важно при проектировании пайплайна?

Middle
ютэйр
2

Как вы обычно работаете с Git в команде? И что такое Merge Request?

Middle
ютэйр
2

У нас ORDER BY по количеству заказов, и у нас идёт два заказа по 5, ещё два заказа по 3. Как себя поведёт RANK() и как DENSE_RANK()?

Middle
Альфа-БанкАльфа-Банк
0
/17