Sobes.tech
Назад к вопросам
Middle — Senior
9

Опишите цикл работы агента: thought → action → observation → ...

Компании, где спрашивали
ПАО Газпром нефть
OZONOZON

Ответ от нейросети

sobes.tech AI

Что хотят услышать интервьюеры:

Агент работает в цикле: сначала планирует следующий шаг, затем выполняет действие, после чего получает наблюдение и обновляет своё состояние. Важно показать, что это не разовая генерация ответа, а итеративный процесс с обратной связью. Также ожидают понимание, что цикл продолжается до достижения цели или остановки по лимиту.

Определение:

Цикл работы агента — это последовательность thought → action → observation, где модель сначала формирует внутреннее решение о следующем шаге, затем вызывает инструмент или выполняет действие, после чего получает результат этого действия из среды. Этот результат используется для следующего шага цикла. В итоге агент может постепенно решать задачу, а не пытаться вывести всё сразу.

Пример использования:

Агенту нужно найти статус заказа в корпоративной системе.

thought: Нужно узнать заказ по номеру и проверить текущий статус.
action: вызвать tool search_order(order_id=12345)
observation: заказ найден, статус = "отгружен", дата = "2026-05-24"
thought: Статус уже найден, можно сформировать ответ пользователю.
action: вернуть итоговый ответ
observation: ответ отправлен

Пояснение кода:

Код не требуется: это не язык программирования, а схема поведения агента. На практике цикл можно разложить так:

  1. Модель получает задачу и текущий контекст.
  2. На шаге thought она выбирает, что делать дальше: спросить инструмент, уточнить данные, продолжить рассуждение.
  3. На шаге action она выполняет действие, например вызывает API, поисковик, базу данных или вычислительную функцию.
  4. На шаге observation получает ответ инструмента и добавляет его в контекст.
  5. Цикл повторяется, пока не будет достигнута цель, не сработает условие остановки или лимит шагов.

Ключевые моменты:

  • thought — это не обязательно явный “внутренний монолог”, а шаг выбора следующего действия.
  • action обычно означает вызов внешнего инструмента или операции в среде.
  • observation — это результат действия, который влияет на следующие шаги.
  • Цикл делает агента интерактивным и позволяет решать многошаговые задачи.
  • Нужны ограничения: лимит шагов, проверка ошибок, защита от зацикливания.
  • В реальных системах часто разделяют планирование, выполнение и валидацию результата.