Sobes.tech

Data Engineer

Как работает MapReduce, в частности стадия Reduce?

Middle
AstonAston
10

Чем бы Вы хотели заниматься в нашей команде?

Junior
01.tech
10

В чём разница между WHERE и HAVING?

Middle
FOM GROUP
10

Какие бывают физические соединения (join methods)?

Middle
Леман про
10

Какие виды алгоритмов JOIN существуют в PostgreSQL и чем отличается Hash Join от Nested Loop Join? В каких случаях Hash Join неприменим?

Middle
КуперКупер
10

Доля трафика от ботов Команда антифрода разработала механизм определения трафика от ботов на сайт магазина — при входе бота на сайт в параметры его URL добавляется подстрока "bot" (без учета регистра). Если user_id хотя бы один раз был определен как бот в декабре, то он всегда должен определяться как бот. Изучите датасет с визитами пользователей на сайт и посчитайте долю ботов от общего числа пользователей в декабре 2024 года (округлите ее до одного знака после запятой). Формат ввода Таблица visits: - event_date (date) — дата визита - user_id (int) — уникальный идентификатор пользователя - url (string) — ссылка, по которой был осуществлен переход Данные не содержат пропусков или некорректных значений. Формат вывода Запрос должен вернуть таблицу с полями: - share (float) — доля ботов от общего числа пользователей в декабре, округленная до одного знака после запятой.

Junior
01.tech
9

Как работает Merge Join (соединение с сортировкой)?

Middle+
СБЕРСБЕР
9

Есть ли у вас вопросы по команде и роли?

Middle
RWB
9

Нам нужен pipeline engine — механизм, который позволит очень быстро создавать потоки путем подачи на вход контрактов и параметров. Как бы ты это реализовал на верхнем уровне?

Middle
МВидеоМВидео
9

Вы строите представление, которое показывает всех пользователей и, если есть, их последние заказы. Таблицы: users(id, name) и orders(id, user_id, created_at). Какой тип соединения нужно использовать, чтобы в выборку попали и те пользователи, у которых нет заказов? CROSS JOIN RIGHT JOIN INNER JOIN FULL JOIN LEFT JOIN

Junior
01.tech
9

Трассировка показывает только REST-запросы или что-то ещё?

Senior
ИП Ганус Александр Андреевич
9

Что такое утиная типизация (duck typing)?

Middle
Леман про
9

По Python: насколько углублённые знания, какие библиотеки использовал?

Middle
FOM GROUP
9

На CTE много идет памяти — когда у нас идет большое потребление памяти, что происходит с данными?

Middle
МВидеоМВидео
9

Какими стратегиями инкрементальной загрузки в dbt пользовался?

Middle
КИПР NDA(IGaming)
9

В таблице records(id) создан обычный B-tree индекс по id. Почему следующий запрос не будет использовать индекс? select * from records where id % 2 = 0 - Для id нужен индекс типа GIN - Индексы не работают с выражениями в WHERE - % — это операция сравнения, а не фильтрации - limit и offset обязательны для оптимизации с индексом - Запрос обращается к числовому полю, а не строковому

Junior
01.tech
9

Что происходит при параллелизации запросов в однонодовом Postgres?

Middle
Леман про
9

Дана строка order задающая желаемый порядок на символах. Требуется в строке unsorted_str переставить символы так, чтобы порядок был согласован со строкой order. Обе строки состоят из символов английского алфавита в нижнем регистре, все символы в строке order различны. Порядок символов в строке unsorted_str называется согласованным со строкой order, если из того, что символ x стоит раньше символа y в order следует, что любое вхождение x в строке unsorted_str должно быть раньше любого вхождения y. Допустимы ситуации, когда в order нет символов из unsorted_str и наоборот. Верните любую из допустимых перестановок. unsorted_str = "abcd" order = "cba" answer = "dcba" ("cdba", "cbda", "cbad") def CustomSort(unsorted_str: str, order: str) -> str: # code here

Junior
Яндекс
9

Как работает ClickHouse и чем он отличается от PostgreSQL?

Middle
FOM GROUP
9

Есть ли у вас опыт работы с библиотекой Langchain? Какие задачи вы решали с её помощью?

Junior
01.tech
9
/17