Перейти к содержанию

Знание: Архитектура ИИ-агента и векторной базы (Agentic RAG)

Дата: 2026-04-02 Раздел: docs/13_знания

Ключевые выводы

  • Использование классического RAG (Retrieval-Augmented Generation) в проекте бронирования отелей/туров недостаточно из-за строгих фильтров (например, наличие свободных мест на конкретную дату).
  • Для решения этой проблемы применяется паттерн Agent with Tool Calling (Function Calling), где LLM выступает координатором и вызывает нужные инструменты (SQL запросы к базе данных, векторный поиск pgvector по знаниям).
  • Векторная база встроена в Supabase через расширение pgvector, что упрощает инфраструктуру (нет нужды поднимать отдельные векторные хранилища вроде Pinecone/Milvus). Индекс HNSW обеспечивает быстрый косинусный поиск.
  • Рекомендуемые модели: text-embedding-3-small для векторов (очень дешево и качественно), и GPT-4o-mini для координации агента (идеальный баланс цены, скорости и качества Function Calling на русском языке).