Опишите цикл работы агента: thought → action → observation → ...
Answer from AI
sobes.tech AI
Что хотят услышать интервьюеры:
Агент работает в цикле: сначала планирует следующий шаг, затем выполняет действие, после чего получает наблюдение и обновляет своё состояние. Важно показать, что это не разовая генерация ответа, а итеративный процесс с обратной связью. Также ожидают понимание, что цикл продолжается до достижения цели или остановки по лимиту.
Определение:
Цикл работы агента — это последовательность thought → action → observation, где модель сначала формирует внутреннее решение о следующем шаге, затем вызывает инструмент или выполняет действие, после чего получает результат этого действия из среды. Этот результат используется для следующего шага цикла. В итоге агент может постепенно решать задачу, а не пытаться вывести всё сразу.
Пример использования:
Агенту нужно найти статус заказа в корпоративной системе.
thought: Нужно узнать заказ по номеру и проверить текущий статус.
action: вызвать tool search_order(order_id=12345)
observation: заказ найден, статус = "отгружен", дата = "2026-05-24"
thought: Статус уже найден, можно сформировать ответ пользователю.
action: вернуть итоговый ответ
observation: ответ отправлен
Пояснение кода:
Код не требуется: это не язык программирования, а схема поведения агента. На практике цикл можно разложить так:
- Модель получает задачу и текущий контекст.
- На шаге
thoughtона выбирает, что делать дальше: спросить инструмент, уточнить данные, продолжить рассуждение. - На шаге
actionона выполняет действие, например вызывает API, поисковик, базу данных или вычислительную функцию. - На шаге
observationполучает ответ инструмента и добавляет его в контекст. - Цикл повторяется, пока не будет достигнута цель, не сработает условие остановки или лимит шагов.
Ключевые моменты:
thought— это не обязательно явный “внутренний монолог”, а шаг выбора следующего действия.actionобычно означает вызов внешнего инструмента или операции в среде.observation— это результат действия, который влияет на следующие шаги.- Цикл делает агента интерактивным и позволяет решать многошаговые задачи.
- Нужны ограничения: лимит шагов, проверка ошибок, защита от зацикливания.
- В реальных системах часто разделяют планирование, выполнение и валидацию результата.