Advanced RAG & Knowledge Systems - AI02
Искусственный интеллект Artificial Intelligence
AI02 - Advanced RAG & Knowledge Systems
- Длительность: 4 дня (32 часа)
- Код курса: AI02
- Стоимость
- Очный формат: 709 500 ₸
- Онлайн формат: 690 500 ₸
Описание курса
Описание
Программа посвящена построению продвинутых систем извлечения и представления знаний: контекстному и визуальному чанкингу, гибридному поиску, GraphRAG, агентному retrieval, RAGOps, измеримости качества и обеспечению безопасности корпоративных ассистентов.
Аудитория
ML‑ и AI‑инженеры, архитекторы данных, инженеры данных, разработчики корпоративных ассистентов и систем поиска по документам.
Расписание
День 1. Архитектура знаний и продвинутый чанкинг.
Contextual retrieval и преобразование чанков перед индексацией для сохранения смысла. Семантический и документно‑визуальный чанкинг для PDF и презентаций с использованием vision‑моделей для описания таблиц и графиков. Late chunking как способ сохранить глобальный контекст в локальных эмбеддингах. Эмбеддинги 2026 года и подход Matryoshka с варьируемой размерностью для оптимизации скорости и памяти.
День 2. GraphRAG и гибридный поиск.
Построение графов сущностей и отношений поверх векторного индекса; сценарии, требующие связного знания. Гибридный поиск, объединяющий BM25, векторное сходство и графовые обходы; динамическая балансировка весов. Multi‑vector представления документа (краткое содержание, полные данные, гипотетические вопросы). Выбор стека хранения: серверные векторные базы и встраиваемые хранилища.
День 3. Retrieval как агент.
Декомпозиция и расширение запросов с помощью LLM. Подходы Self‑RAG и Corrective RAG: самооценка релевантности и переход к веб‑поиску при недостатке локальных данных. Re‑ranking на лёгких cross‑encoder‑ах и ColBERT‑подобных моделях. Стратегии long‑context RAG и RAG‑Fusion для моделей со сверхдлинным контекстом.
День 4. RAGOps, оценка качества и безопасность.
Метрики faithfulness и answer relevance в инструментах RAGAS и DeepEval, формирование тестовых наборов на синтетических данных. Дрейф данных и стратегии переиндексации. Защита от prompt injection через содержимое документов. Инфраструктура развёртывания (LangServe, BentoML), мониторинг качества и учёт стоимости поискового запроса.
Записаться на курс «AI02 - Advanced RAG & Knowledge Systems»
Контакты
LinkedIn
Email
Web










