Sobes.tech
Назад к вопросам
Senior
3

Допустим, мы крупная рекламная сеть. Мы размещаем баннеры на сайтах-партнерах по всему миру. Нам необходимо спроектировать систему сбора и обработки событий в реальном времени. Эти данные критически важны для двух целей: Биллинг: Списание денег с рекламодателей за клики. Аналитика: Отображение текущей эффективности кампаний (CTR, показы) в личном кабинете. Исходные данные (для расчета нагрузки) Вам необходимо самостоятельно оценить требуемые мощности (RPS, трафик, хранилище), исходя из следующих метрик: Партнерская сеть: 500,000 активных сайтов. Трафик: На каждом сайте в среднем происходит 2 просмотра страниц в секунду. Рекламные блоки: На каждой странице отображается по 3 баннера одновременно. Конверсия: Средний CTR (Click-Through Rate) составляет 1%. Неравномерность: Пиковая нагрузка (вечерние часы) в 4 раза выше средней. Размер события: Объект события (ID баннера, ID сайта, UserID, Timestamp, тип события) весит примерно 500 байт. Технические требования Near Real-Time: Данные в аналитическом интерфейсе должны появляться с задержкой не более 10 секунд. Надежность: Потеря кликов недопустима (это прямая потеря денег). Потеря показов (impressions) допустима в пределах 0.01%. Масштабируемость: Система должна легко расширяться при росте количества площадок.

Компании, где спрашивали
Dataworks

Ответ от нейросети

sobes.tech AI

Для проектирования системы сбора и обработки событий в реальном времени для крупной рекламной сети с указанными параметрами, рассмотрим ключевые аспекты:

Оценка нагрузки

  • Активных сайтов: 500,000
  • Просмотры страниц в секунду на сайте: 2
  • Баннеры на странице: 3
  • CTR: 1%
  • Пиковая нагрузка: ×4
  • Размер события: 500 байт

Расчёт событий в секунду (RPS):

  • Просмотры страниц: 500,000 × 2 = 1,000,000 в секунду
  • Показов баннеров: 1,000,000 × 3 = 3,000,000 показов в секунду
  • Клики: 3,000,000 × 1% = 30,000 кликов в секунду

Пиковая нагрузка: 3,000,000 × 4 = 12,000,000 показов и 30,000 × 4 = 120,000 кликов в секунду.

Трафик данных

  • Показ: 500 байт × 12,000,000 = ~6 ГБ/сек
  • Клик: 500 байт × 120,000 = ~60 МБ/сек

Архитектура системы

  1. Сбор данных:

    • Использовать легковесные агенты или SDK на сайтах для отправки событий.
    • Протоколы: HTTP/2, gRPC или Kafka Producer для высокой пропускной способности.
  2. Приём и буферизация:

    • Использовать распределённый брокер сообщений (например, Apache Kafka) для устойчивого приёма и буферизации событий.
    • Настроить партиционирование по ID сайта или баннера для масштабируемости.
  3. Обработка:

    • Потоковая обработка с помощью систем типа Apache Flink, Kafka Streams или собственного сервиса на Go.
    • Клики обрабатывать с гарантией доставки (exactly-once или at-least-once).
    • Показов можно допускать небольшую потерю (0.01%), использовать компромиссы в обработке.
  4. Хранение:

    • Для биллинга — база данных с транзакционной поддержкой (например, PostgreSQL, CockroachDB).
    • Для аналитики — OLAP-хранилище или колоночная БД (ClickHouse, Druid) для быстрых агрегаций.
  5. Отображение данных:

    • Кэширование агрегированных данных для быстрого доступа в личном кабинете.
    • Обновление данных с задержкой не более 10 секунд.

Масштабируемость и надёжность

  • Горизонтальное масштабирование всех компонентов.
  • Репликация и резервирование брокеров и баз данных.
  • Мониторинг и алерты на потерю данных и задержки.

Итог

  • Система должна выдерживать до 12 млн событий в секунду на пике.
  • Использовать распределённые технологии для приёма и обработки.
  • Обеспечить гарантии доставки для кликов и минимальные потери для показов.
  • Обеспечить near real-time обновление аналитики с задержкой до 10 секунд.