RAG означает Retrieval-Augmented Generation: генерация с поиском по источникам. Система сначала ищет релевантные фрагменты в базе документов, а потом передает их модели как контекст для ответа.
Почему это важно
Это полезно, когда нужно отвечать по внутренним регламентам, базе знаний, договорам, инструкциям или статьям сайта. Модель получает не только вопрос, но и найденные выдержки, поэтому ответ становится ближе к фактам.
Качество RAG зависит от подготовки документов, разбиения на фрагменты, embeddings, поиска и правил цитирования источников.