Назад к вопросам
Senior
3
Допустим, мы крупная рекламная сеть. Мы размещаем баннеры на сайтах-партнерах по всему миру. Нам необходимо спроектировать систему сбора и обработки событий в реальном времени. Эти данные критически важны для двух целей: Биллинг: Списание денег с рекламодателей за клики. Аналитика: Отображение текущей эффективности кампаний (CTR, показы) в личном кабинете. Исходные данные (для расчета нагрузки) Вам необходимо самостоятельно оценить требуемые мощности (RPS, трафик, хранилище), исходя из следующих метрик: Партнерская сеть: 500,000 активных сайтов. Трафик: На каждом сайте в среднем происходит 2 просмотра страниц в секунду. Рекламные блоки: На каждой странице отображается по 3 баннера одновременно. Конверсия: Средний CTR (Click-Through Rate) составляет 1%. Неравномерность: Пиковая нагрузка (вечерние часы) в 4 раза выше средней. Размер события: Объект события (ID баннера, ID сайта, UserID, Timestamp, тип события) весит примерно 500 байт. Технические требования Near Real-Time: Данные в аналитическом интерфейсе должны появляться с задержкой не более 10 секунд. Надежность: Потеря кликов недопустима (это прямая потеря денег). Потеря показов (impressions) допустима в пределах 0.01%. Масштабируемость: Система должна легко расширяться при росте количества площадок.
Компании, где спрашивали
Dataworks
Ответ от нейросети
sobes.tech AI
Для проектирования системы сбора и обработки событий в реальном времени для крупной рекламной сети с указанными параметрами, рассмотрим ключевые аспекты:
Оценка нагрузки
- Активных сайтов: 500,000
- Просмотры страниц в секунду на сайте: 2
- Баннеры на странице: 3
- CTR: 1%
- Пиковая нагрузка: ×4
- Размер события: 500 байт
Расчёт событий в секунду (RPS):
- Просмотры страниц: 500,000 × 2 = 1,000,000 в секунду
- Показов баннеров: 1,000,000 × 3 = 3,000,000 показов в секунду
- Клики: 3,000,000 × 1% = 30,000 кликов в секунду
Пиковая нагрузка: 3,000,000 × 4 = 12,000,000 показов и 30,000 × 4 = 120,000 кликов в секунду.
Трафик данных
- Показ: 500 байт × 12,000,000 = ~6 ГБ/сек
- Клик: 500 байт × 120,000 = ~60 МБ/сек
Архитектура системы
-
Сбор данных:
- Использовать легковесные агенты или SDK на сайтах для отправки событий.
- Протоколы: HTTP/2, gRPC или Kafka Producer для высокой пропускной способности.
-
Приём и буферизация:
- Использовать распределённый брокер сообщений (например, Apache Kafka) для устойчивого приёма и буферизации событий.
- Настроить партиционирование по ID сайта или баннера для масштабируемости.
-
Обработка:
- Потоковая обработка с помощью систем типа Apache Flink, Kafka Streams или собственного сервиса на Go.
- Клики обрабатывать с гарантией доставки (exactly-once или at-least-once).
- Показов можно допускать небольшую потерю (0.01%), использовать компромиссы в обработке.
-
Хранение:
- Для биллинга — база данных с транзакционной поддержкой (например, PostgreSQL, CockroachDB).
- Для аналитики — OLAP-хранилище или колоночная БД (ClickHouse, Druid) для быстрых агрегаций.
-
Отображение данных:
- Кэширование агрегированных данных для быстрого доступа в личном кабинете.
- Обновление данных с задержкой не более 10 секунд.
Масштабируемость и надёжность
- Горизонтальное масштабирование всех компонентов.
- Репликация и резервирование брокеров и баз данных.
- Мониторинг и алерты на потерю данных и задержки.
Итог
- Система должна выдерживать до 12 млн событий в секунду на пике.
- Использовать распределённые технологии для приёма и обработки.
- Обеспечить гарантии доставки для кликов и минимальные потери для показов.
- Обеспечить near real-time обновление аналитики с задержкой до 10 секунд.