Джокер
Администратор
- Регистрация
- 1 Янв 2015
- Сообщения
- 134.042
- Реакции
- 76.356
Складчина: LLM-инженер [Gigaschool] часть 2 из 5
ВНИМАНИЕ: Это вторая из пяти складчин на полный курс.
В связи с высокой стоимостью (180 000 руб.) и продолжительностью (5,5 месяцев) курса, для удобства участников принято решение о его разделении на 5 частей. Каждая часть соответствует одному большому разделу программы. Каждая последующая складчина является продолжением предыдущей, и соответственно необходимо оплатить предыдущую.
Это вторая часть большого онлайн-курса, посвященная подготовке данных для RAG-систем. Вы научитесь правильно обрабатывать тексты, работать с векторными базами данных и энкодерами, а также освоите продвинутые методы информационного поиска и ранжирования для повышения релевантности ответов LLM.
Спойлер: Что вы освоите в этой части?
Ключевые навыки:
Обрабатывать тексты: парсинг, чанкинг, препроцессинг
Работать с энкодерами и векторными базами данных
Настраивать и оптимизировать системы информационного поиска (полнотекстовый, гибридный)
Использовать кросс-энкодеры для переранжирования и улучшения качества поиска
Оценивать качество энкодеров и методов поиска по метрикам
Основные инструменты:
FAISS
Hugging Face Transformers (для энкодеров)
BM25
Программа второй части курса
Раздел 2. Prerequisites для RAG
Лекция: Работа с текстами - парсинг, обработка текстов (применение ML + LLM в обработке).
Семинар: Различные виды чанкинга.
Лекция: Векторная БД, энкодеры, MTEB.
Семинар: Развёртывание векторной БД, проверка качества различных энкодеров.
Лекция: Информационный поиск - полнотекстовый, гибридный поиск, BM25, симметричный и ассиметричный поиск.
Семинар: Сравнение симметричного поиска и ассиметричного на конкретном примере.
Лекция: Ранжирование - инструменты, метрики для оценки качества, переранжирование.
Семинар: Построение собственное системы ранжирования, использование кросс-энкодера для переранжирования.
Эксперты курса:
Александр Потехин (NLP Lead, X5 Tech), Роман Соломатин (ML Engineer, X5 Tech), Дарья Андреева (ML Engineer, X5 Tech), Кристина Желтова (Директор по разработке моделей, Газпромбанк), Евгений Кокуйкин (CEO, Raft).
Предыдущие части курса:
Часть 1. Своя LLM
Следующие части курса:
Часть 3. RAG
Часть 4. Агенты
Часть 5. Инфраструктура
СКАЧАТЬ СЛИВЫ КУРСОВ
ВНИМАНИЕ: Это вторая из пяти складчин на полный курс.
В связи с высокой стоимостью (180 000 руб.) и продолжительностью (5,5 месяцев) курса, для удобства участников принято решение о его разделении на 5 частей. Каждая часть соответствует одному большому разделу программы. Каждая последующая складчина является продолжением предыдущей, и соответственно необходимо оплатить предыдущую.
Это вторая часть большого онлайн-курса, посвященная подготовке данных для RAG-систем. Вы научитесь правильно обрабатывать тексты, работать с векторными базами данных и энкодерами, а также освоите продвинутые методы информационного поиска и ранжирования для повышения релевантности ответов LLM.
Спойлер: Что вы освоите в этой части?
Ключевые навыки:
Обрабатывать тексты: парсинг, чанкинг, препроцессинг
Работать с энкодерами и векторными базами данных
Настраивать и оптимизировать системы информационного поиска (полнотекстовый, гибридный)
Использовать кросс-энкодеры для переранжирования и улучшения качества поиска
Оценивать качество энкодеров и методов поиска по метрикам
Основные инструменты:
FAISS
Hugging Face Transformers (для энкодеров)
BM25
Программа второй части курса
Раздел 2. Prerequisites для RAG
Лекция: Работа с текстами - парсинг, обработка текстов (применение ML + LLM в обработке).
Семинар: Различные виды чанкинга.
Лекция: Векторная БД, энкодеры, MTEB.
Семинар: Развёртывание векторной БД, проверка качества различных энкодеров.
Лекция: Информационный поиск - полнотекстовый, гибридный поиск, BM25, симметричный и ассиметричный поиск.
Семинар: Сравнение симметричного поиска и ассиметричного на конкретном примере.
Лекция: Ранжирование - инструменты, метрики для оценки качества, переранжирование.
Семинар: Построение собственное системы ранжирования, использование кросс-энкодера для переранжирования.
Эксперты курса:
Александр Потехин (NLP Lead, X5 Tech), Роман Соломатин (ML Engineer, X5 Tech), Дарья Андреева (ML Engineer, X5 Tech), Кристина Желтова (Директор по разработке моделей, Газпромбанк), Евгений Кокуйкин (CEO, Raft).
Предыдущие части курса:
Часть 1. Своя LLM
Следующие части курса:
Часть 3. RAG
Часть 4. Агенты
Часть 5. Инфраструктура
СКАЧАТЬ СЛИВЫ КУРСОВ
Для возможности скачивать складчины и сливы курсов нужно зарегистрироваться
Возможно, Вас ещё заинтересует:
- [WP] Oxygen 6 - конструктор темы/контента Wordpress
- Противоречивость между материнским и сексуальным у женщин как основная проблема женского [EduNote] [Марина Куликова]
- Армянский хлеб [Xleb.tartin]
- Нейротехники по расслаблению + Запуск речи ребенка + Интенсив жизнь без истерик [Ксения Гринвич]
- Социальный интеллект коуча (Интенсив №4) [Ольга Рыбина]
- Клуб здоровья и молодости 3.0 (уроки 24-31) [Данила Сусак, Аман Атилов]
- [Вязание] Жилет Коко [Юлия Имукина]
- [Вязание] Панама из рафии [anutaknits]
- [Вязание] Свитер Алиса. Интерактивное описание [stepmother.queen] [Ольга Грознецкая]
- [Вязание] Золотая туника [Юлия Имукина]