Sobes.tech

Data Engineer

У тебя есть запрос, который работает плохо, медленно или падает — как его оптимизировать?

Middle
МВидеоМВидео
6

Напиши простой DAG для Apache Airflow

Middle
ING BANK (EURASIA) JSC
6

Задача по Kafka: продюсер отправляет изменения цены товара (200 руб, затем 300 руб), консюмер реплицирован в 3 пода. Будут ли проблемы в дефолтной конфигурации?

Senior
ИП Ганус Александр Андреевич
6

Что такое партицирование? Что такое шардирование? Что такое репликация?

Middle+
СБЕРСБЕР
6

Как прочитать файл размером 100 гигабайт в Python?

Middle
FOM GROUP
6

Вы обнаружили, что в истории основного репозитория Git присутствуют коммиты, содержащие критически важные конфиденциальные данные. Эти данные необходимо полностью удалить из всей истории репозитория. Оцените, насколько правильно и безопасно будет использовать следующую стратегию: создать новый коммит, который удалит конфиденциальные данные из текущей версии файлов, и отправить его в main. - Правильно, но не оптимально. Лучше использовать git revert для отмены коммитов - Условно правильно. Это временное решение, пока не будет найдено более радикальное средство для удаления данных - Неправильно и небезопасно. Данные будут удалены из текущей версии, но останутся доступными в истории репозитория - Неправильно. Такой коммит может привести к новым конфликтам при слиянии с другими ветками - Правильно и безопасно. Этот способ гарантирует, что данные будут удалены и больше не появятся в репозитории

Junior
01.tech
6

Что такое Materialized View и чем он отличается от обычного View?

Middle
FOM GROUP
6

Можешь рассказать, что здесь в итоге у нас получится? Нужно прокомментировать каждый шаг, как это работает.

Middle
МВидеоМВидео
6

Как работает Nested Loop Join и какова его алгоритмическая сложность? Какова сложность всех трёх алгоритмов?

Middle+
СБЕРСБЕР
6

Расскажи про партиционирование. Какие интересные операции приходилось делать?

Middle
КИПР NDA(IGaming)
6

Схему самой базы данных ты как правил — прям руками в базе или скрипты где-то хранил, или вообще в Liquibase сидел, какой процесс был?

Middle
МВидеоМВидео
6

Расскажи про использование Airflow: какие нестандартные элементы применял

Junior
МодульБанк
6

Насколько вам интересна данная роль, учитывая тесную работу с аналитиками, ревью их кода и консультирование?

Middle
RWB
6

Чем CTE отличается от подзапроса?

Middle
МВидеоМВидео
6

Почему не стоит делать много маленьких инсертов в ClickHouse?

Middle
ютэйр
6

Можно ли посмотреть схему таблицы перед выполнением запроса в Hive?

Middle
AstonAston
6

Как правильно определить поле дистрибьюции в Greenplum? Что происходит при Motion?

Middle
СБЕРСБЕР
6

Как разбивать запрос на этапы? Что для этого делаем?

Middle
МВидеоМВидео
6

В PostgreSQL заголовок версии строки включает параметр xmax. Какова его роль в управлении транзакциями? - Для создания уникального идентификатора строки в таблице - Для проверки видимости строки другими транзакциями - Для обозначения номера транзакции, которая удалила или обновила строку - Для блокировки строки от одновременных изменений несколькими транзакциями - Для указания максимального значения, которое может быть записано в числовую колонку

Junior
01.tech
6

Как вы видите своё участие в проекте с учётом описанного состава команды?

Senior
ооо УК Арбат
6
/17