Знание: Архитектура ИИ-агента и векторной базы (Agentic RAG)¶
Дата: 2026-04-02 Раздел: docs/13_знания
Ключевые выводы¶
- Использование классического
RAG(Retrieval-Augmented Generation) в проекте бронирования отелей/туров недостаточно из-за строгих фильтров (например, наличие свободных мест на конкретную дату). - Для решения этой проблемы применяется паттерн
Agent with Tool Calling(Function Calling), где LLM выступает координатором и вызывает нужные инструменты (SQL запросы к базе данных, векторный поискpgvectorпо знаниям). - Векторная база встроена в
Supabaseчерез расширениеpgvector, что упрощает инфраструктуру (нет нужды поднимать отдельные векторные хранилища вроде Pinecone/Milvus). ИндексHNSWобеспечивает быстрый косинусный поиск. - Рекомендуемые модели:
text-embedding-3-smallдля векторов (очень дешево и качественно), иGPT-4o-miniдля координации агента (идеальный баланс цены, скорости и качества Function Calling на русском языке).