Курс AI02 - Advanced RAG & Knowledge Systems обучение в Казахстане — HGK

Advanced RAG & Knowledge Systems - AI02

Искусственный интеллект Artificial Intelligence

AI02 - Advanced RAG & Knowledge Systems

Описание курса

Описание

Программа посвящена построению продвинутых систем извлечения и представления знаний: контекстному и визуальному чанкингу, гибридному поиску, GraphRAG, агентному retrieval, RAGOps, измеримости качества и обеспечению безопасности корпоративных ассистентов.

Аудитория

ML‑ и AI‑инженеры, архитекторы данных, инженеры данных, разработчики корпоративных ассистентов и систем поиска по документам.

Расписание

День 1. Архитектура знаний и продвинутый чанкинг.

Contextual retrieval и преобразование чанков перед индексацией для сохранения смысла. Семантический и документно‑визуальный чанкинг для PDF и презентаций с использованием vision‑моделей для описания таблиц и графиков. Late chunking как способ сохранить глобальный контекст в локальных эмбеддингах. Эмбеддинги 2026 года и подход Matryoshka с варьируемой размерностью для оптимизации скорости и памяти.

День 2. GraphRAG и гибридный поиск.

Построение графов сущностей и отношений поверх векторного индекса; сценарии, требующие связного знания. Гибридный поиск, объединяющий BM25, векторное сходство и графовые обходы; динамическая балансировка весов. Multi‑vector представления документа (краткое содержание, полные данные, гипотетические вопросы). Выбор стека хранения: серверные векторные базы и встраиваемые хранилища.

День 3. Retrieval как агент.

Декомпозиция и расширение запросов с помощью LLM. Подходы Self‑RAG и Corrective RAG: самооценка релевантности и переход к веб‑поиску при недостатке локальных данных. Re‑ranking на лёгких cross‑encoder‑ах и ColBERT‑подобных моделях. Стратегии long‑context RAG и RAG‑Fusion для моделей со сверхдлинным контекстом.

День 4. RAGOps, оценка качества и безопасность.

Метрики faithfulness и answer relevance в инструментах RAGAS и DeepEval, формирование тестовых наборов на синтетических данных. Дрейф данных и стратегии переиндексации. Защита от prompt injection через содержимое документов. Инфраструктура развёртывания (LangServe, BentoML), мониторинг качества и учёт стоимости поискового запроса.

Записаться на курс «AI02 - Advanced RAG & Knowledge Systems»

Наши партнеры

Antcolony
Huawei
Checkpoint
Asterisk
Juniper
Cisco
Wireshark
Paloalto
IBM
Fortinet
VMWare