Джокер
Администратор
- Регистрация
- 1 Янв 2015
- Сообщения
- 133.856
- Реакции
- 76.361
Складчина: Vector DB & RAG Developer [Stepik] [Алексей Малышкин]
Чему вы научитесь:
Пояснять, как работают эмбеддинги и к-NN-поиск
Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
Загружать и хранить миллионы векторов, не теряя производительность
Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
Реализовывать мультимодальный поиск (текст ↔ изображение) с CLIP
Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
Метриками Recall@K и nDCG измерять качество выдачи
Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem
О курсе:
Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.
За несколько недель вы:
развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;
оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;
защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).
Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.
Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik
Для кого этот курс:
ML / Data-инженеры, которым нужен быстрый поиск по embeddings.
Backend-разработчики, добавляющие умный поиск или чат-бота в продукт.
DS/Analytics-junior — хотите прокачать портфолио проектом на LLM.
Техлиды / CTO, выбирающие стек для корпоративного knowledge-base.
Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.
Начальные требования:
Запускать скрипт python main.py, ставить пакеты pip install …
Переходить между папками (cd), копировать-вставлять команды
Склонировать репозиторий git clone … — всё остальное покажем
Автор Алексей Малышкин
Аналитик-разработчик с опытом работы в крупных компаниях.
Победитель олимпиад по математике, программированию и анализу данных.
Цена 5990 руб.
СКАЧАТЬ СЛИВЫ КУРСОВ
Чему вы научитесь:
Пояснять, как работают эмбеддинги и к-NN-поиск
Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
Загружать и хранить миллионы векторов, не теряя производительность
Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
Реализовывать мультимодальный поиск (текст ↔ изображение) с CLIP
Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
Метриками Recall@K и nDCG измерять качество выдачи
Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem
О курсе:
Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.
За несколько недель вы:
развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;
оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;
защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).
Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.
Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik
Для кого этот курс:
ML / Data-инженеры, которым нужен быстрый поиск по embeddings.
Backend-разработчики, добавляющие умный поиск или чат-бота в продукт.
DS/Analytics-junior — хотите прокачать портфолио проектом на LLM.
Техлиды / CTO, выбирающие стек для корпоративного knowledge-base.
Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.
Начальные требования:
Запускать скрипт python main.py, ставить пакеты pip install …
Переходить между папками (cd), копировать-вставлять команды
Склонировать репозиторий git clone … — всё остальное покажем
Автор Алексей Малышкин
Аналитик-разработчик с опытом работы в крупных компаниях.
Победитель олимпиад по математике, программированию и анализу данных.
Цена 5990 руб.
СКАЧАТЬ СЛИВЫ КУРСОВ
Для возможности скачивать складчины и сливы курсов нужно зарегистрироваться
Возможно, Вас ещё заинтересует:
- Чтобы стать богатым, нужно быть нарциссом и психопатом [Александр Златозаров]
- Анатомия добычи: Бизнес без карт и иллюзий [Николай Щербатюк]
- Святой подонок: Инструкция по эксплуатации твоей Темной стороны [Николай Щербатюк]
- Пешкой без Спешки [Егор Колесников, Елена Филимонова] + Незаметные шахматные секреты (как обыгрывать любителей) [Сергей Жвакин, Евгений Шемонаев]
- Oreshki [Анастасия Воронова]
- Великие люди России [Лариса Клюшник] + Достижения и открытия россиян [Илья Маневич] + Чудеса России [Илья Маневич]
- Спокойствие по запросу: что делать, когда накрывает тревожность [Level One] [Татьяна Смирнова]
- Сексуальность в паре: от инфантильных источников возбуждения к взрослому наслаждению [EduNote] [Эрик Смаджа]
- На каких языках мы говорим в аналитической кабинете? [EduNote] [Юрий Баранов]
- Таблица Биона: Вертикаль [EduNote] [Елена Ливач]