Product Analyst
**SQL–задания** 1) Выведите количество заказов в статусе "processing" по каждому исполнителю (executor) за март 2024 года ТОЛЬКО для приоритетных (priority = 'high') заказов. Отсортируйте по убыванию количества. Исключите исполнителей с 0 заказами. 2) Выведите количество успешно завершённых (completed) заказов по категориям, средняя выручка которых > 70000, при этом учитывайте только заказы клиентов с ID >= 1002. Категории без известной средней выручки исключаем из результата. 3) Добавьте к таблице orders_log столбец rank, ранжирующий записи для каждого исполнителя (executor) по timestamp по возрастанию, но только для заказов со статусом "pending" или "processing". Пример результата (executor=1):
Как работает группировка обращений и почему это сложная задача?
Работала ли ты с REST API? Знаешь ли, что это такое и чем отличается от SOAP?
Как работает система с фидбэком диспетчеров и инструкциями через RAG?
Как технически реализовать заполнение пропущенных дат последним известным значением курса?
Расскажите подробнее про командный проект: кто участвовал в команде, какова была ваша зона ответственности и как выстраивалась коммуникация внутри команды?
По оплате — у вас сейчас больше или меньше, насколько комфортны предложенные условия?
Почему не используете зарубежные модели (OpenAI и др.)? Как относишься к вопросу персональных данных и 152-ФЗ?
Приведите конкретный пример из последнего опыта — процесс, для которого вы делали тестовые кейсы.
Расскажите о своём опыте и чем занимаетесь сейчас?
Расскажите конкретный кейс: сбор данных, написание требований, результат?
Как бы вы подошли к расширению системы на новый тип запросов — например, от ФАС вместо ФНС?
Выявлены две проблемы: неполные данные в RAG и плохая передача контекста в LLM. Что делать дальше?
**Python-задания** Датaфрейм Pandas с данными из orders_log называется df. 1) Отфильтруйте строки: статус "processing" И выручка (revenue) > 50000 И приоритет "high". Выведите результат. 2) Создайте столбец 'revenue_group' по правилам: ‘Small’ (< 50000), ‘Medium’ (50000 <= revenue < 90000), ‘Large’ (>= 90000). Затем посчитайте количество заказов в каждой группе по категориям (Category) и выведите результат. 1) df[(df["state"] == "processing") & (df["revenue"] > 50000) & (df["priority"] == "high")] 2)
Логическая задача: есть три автомата — один всегда наливает кофе, один всегда наливает чай, третий наливает случайно. Таблички на всех перепутаны. Как за минимальное количество монеток определить, где какой автомат?
Почему ты так сделал тестовое задание? Почему оно так сформировано?
Какие агрегирующие и оконные функции использовала в работе?
Что такое нефункциональные требования? Можешь привести примеры?
Почему нельзя использовать среднее для расчёта скидок при скошенном распределении LTV?
Знаешь ли ты что-нибудь про архитектуру микросервисов? Знаешь ли, что такое хореография и оркестрация?