Data Engineer
Как работает Merge Join (соединение с сортировкой)?
Есть ли у вас опыт работы с библиотекой Langchain? Какие задачи вы решали с её помощью?
Дана строка order задающая желаемый порядок на символах. Требуется в строке unsorted_str переставить символы так, чтобы порядок был согласован со строкой order. Обе строки состоят из символов английского алфавита в нижнем регистре, все символы в строке order различны. Порядок символов в строке unsorted_str называется согласованным со строкой order, если из того, что символ x стоит раньше символа y в order следует, что любое вхождение x в строке unsorted_str должно быть раньше любого вхождения y. Допустимы ситуации, когда в order нет символов из unsorted_str и наоборот. Верните любую из допустимых перестановок. unsorted_str = "abcd" order = "cba" answer = "dcba" ("cdba", "cbda", "cbad") def CustomSort(unsorted_str: str, order: str) -> str: # code here
Нам нужен pipeline engine — механизм, который позволит очень быстро создавать потоки путем подачи на вход контрактов и параметров. Как бы ты это реализовал на верхнем уровне?
Produce a list of costly bookings Question How can you produce a list of bookings on the day of [phone] which will cost the member (or guest) more than $30? Remember that guests have different costs to members (the listed costs are per half-hour 'slot'), and the guest user is always ID 0. Include in your output the name of the facility, the name of the member formatted as a single column, and the cost. Order by descending cost, and do not use any subqueries.
Вы создаёте таблицу audit_logs, где нужно хранить дату и точное время с часовым поясом. Какой тип данных наиболее уместен? time with time zone interval timestamp with time zone date timestamp without time zone
Если вы хотите изменить ветку, на которую указывает подмодуль, что необходимо сделать? - Подмодули не поддерживают смену веток - Удалить подмодуль и добавить его заново с нужной веткой - Изменить ветку в подмодуле и выполнить коммит в основном репозитории - Выполнить git checkout нужной ветки в подмодуле и зафиксировать изменения в основном репозитории - Выполнить git submodule update --branch с указанием новой ветки
Чем HDFS отличается от обычных распределённых файловых систем?
Что такое семантическое версионирование? Когда двигать major, minor, patch?
Как оценить конфигурацию под перенос одного терабайта данных из PostgreSQL в ClickHouse?
Какими операторами Airflow пользовался? Как взаимодействовал с dbt через Airflow?
[имя] расскажите чуть-чуть по поводу своего опыта относительно наших задач, которые мы попытались описать в вакансии.
Есть ли опыт оптимизации SQL-запросов? Приведите пример.
Для чего нужны индексы, какие плюсы и минусы?
Расскажите ваш опыт работы с Airflow (оркестратором). Чем пользовались?
Почему выбрали именно DBT? Какие плюсы и минусы видишь у этого фреймворка?
В чём преимущества и недостатки строчных и колоночных баз данных? Что эффективнее для группировки и агрегации?
Чем отличается EXPLAIN ANALYZE от обычного EXPLAIN? Почему его нежелательно запускать на DELETE/UPDATE запросах?
В процессе работы с git bisect вы столкнулись с коммитом, который невозможно проверить из-за отсутствия нужной среды. Что нужно сделать в этой ситуации? - Повторить команду git bisect start с другими хешами - Пропустить этот коммит командой git bisect skip - Сбросить bisect командой git bisect reset - Объявить коммит хорошим командой git bisect good - Объявить коммит плохим командой git bisect bad
у нас есть таблица клиенты(ид имя адрес допустим), товары(ид название и т.п.), движение товара(тут у нас ид клиента товара дата количество сума), надо найти какие товары продались 1 января уникальные только ну и так же вывести имя покупателя и...