Джокер
Администратор
- Регистрация
- 1 Янв 2015
- Сообщения
- 127.664
- Реакции
- 75.986
Whisper Voice Machine: Преврати гигабайты курсов в Знания, а голос в Деньги
Ваш Персональный Командный Центр с поддержкой MCP
История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня...
У вас тоже есть эта папка? "Разобрать позже"?
Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.
Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.
А теперь представьте другую реальность.
Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.
Whisper Voice Machine (WVM)
Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.
Почему я перестал печатать (владея слепой печатью 16 лет)?
Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать - это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace - идея ускользает или мутирует.
Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.
ТРИ РЕЖИМА ИСПОЛЬЗОВАНИЯ
Узнайте себя в одном из них
Для "Коллекционеров Знаний" (Складчиков)
Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод.
Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.
Для SMM, Копирайтеров и Креаторов
Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента.
Для Управленцев и Менеджеров
Вас бесят бесконечные переписки, но вы обязаны соблюдать корпоративный этикет?
Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной.
ВАШ ТЕХНОЛОГИЧЕСКИЙ АРСЕНАЛ
Спойлер: Раскрыть подробные возможности программы
1. Тотальный отказ от ручной печати
Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор - туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль.
2. "Пожиратель Курсов": Видео в Текст + Перевод
Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переведи на русский и оформи как конспект". Вы получите готовую методичку на родном языке.
3. Model Content Protocol (MCP Server)
Технология будущего, доступная сегодня.
WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
Вы можете попросить Claude Desktop (или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."
4. Умный поиск и База Знаний
Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется.
Окно поиска: Ваша база знаний всегда под рукой
Настройки AI: Полная свобода в выборе моделей и промтов
Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.
1) Распознавание (Уши) — 100% локально
Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.
Базовый вариант (без постобработки):
Вы можете выключить постобработку и работать почти что на любом современном компьютере.
Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
Это самый доступный режим.
2) Постобработка (Мозги) — на ваш выбор
Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
Пример: OpenRouter (Gemini Flash, DeepSeek и др.).
Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.
Вариант №3 — локальная постобработка (тотальная приватность)
Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.
Из протестированных мной моделей отлично себя показывают:
Qwen 3 (4B и 8B), Gemma 3 (разные размеры).
Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.
Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.
Системные требования (3 уровня)
1) Минимальные (базовый режим: только распознавание)
Для кого: если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).
CPU: Intel Core от 4-го поколения (у меня работает на таком железе).
ОЗУ: 8 ГБ.
GPU: не обязателен (можно на CPU, просто будет медленнее).
Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.
2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
Для кого: если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).
CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).
ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).
GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)
Интернет: нужен только для постобработки (распознавание всё равно локальное).
Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.
3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
Для кого: если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.
ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).
GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).
CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.
Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.
ПОЧЕМУ LIFETIME, А НЕ ПОДПИСКА?
Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:
Пожизненную лицензию (Lifetime) на 3 ваших компьютера.
Пакет «Системных промтов» (SMM, деловой стиль, кодинг).
Прямую поддержку от автора в этой теме.
Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.
Важно по-честному про обновления и поддержку:
Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
На международном рынке она, вероятно, будет стоить дороже.
Код будет защищен через обфускацию. Привязка к железу.
Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))
Хватит печатать и копить информацию. Начните управлять ею.
СПЕЦИАЛЬНЫЙ БОНУС ЗА РЕКЛАМУ
Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов
Внутри бонуса набор:
"Telegram-Машина" — посты из бубнежа.
"Корректор" — исправление ошибок с сохранением стиля.
"Деловая Акула" — жесткие юридические письма.
"Кодер" — оформление алгоритмов в чистый код.
Записывайтесь. В повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.
Все экраны приложения.
СКАЧАТЬ СЛИВЫ КУРСОВ
Ваш Персональный Командный Центр с поддержкой MCP
История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня...
У вас тоже есть эта папка? "Разобрать позже"?
Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.
Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.
А теперь представьте другую реальность.
Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.
Whisper Voice Machine (WVM)
Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.
Почему я перестал печатать (владея слепой печатью 16 лет)?
Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать - это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace - идея ускользает или мутирует.
Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.
ТРИ РЕЖИМА ИСПОЛЬЗОВАНИЯ
Узнайте себя в одном из них
Для "Коллекционеров Знаний" (Складчиков)
Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод.
Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.
Для SMM, Копирайтеров и Креаторов
Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента.
Для Управленцев и Менеджеров
Вас бесят бесконечные переписки, но вы обязаны соблюдать корпоративный этикет?
Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной.
ВАШ ТЕХНОЛОГИЧЕСКИЙ АРСЕНАЛ
Спойлер: Раскрыть подробные возможности программы
1. Тотальный отказ от ручной печати
Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор - туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль.
2. "Пожиратель Курсов": Видео в Текст + Перевод
Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переведи на русский и оформи как конспект". Вы получите готовую методичку на родном языке.
3. Model Content Protocol (MCP Server)
Технология будущего, доступная сегодня.
WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
Вы можете попросить Claude Desktop (или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."
4. Умный поиск и База Знаний
Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется.
Окно поиска: Ваша база знаний всегда под рукой
Настройки AI: Полная свобода в выборе моделей и промтов
Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.
1) Распознавание (Уши) — 100% локально
Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.
Базовый вариант (без постобработки):
Вы можете выключить постобработку и работать почти что на любом современном компьютере.
Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
Это самый доступный режим.
2) Постобработка (Мозги) — на ваш выбор
Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
Пример: OpenRouter (Gemini Flash, DeepSeek и др.).
Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.
Вариант №3 — локальная постобработка (тотальная приватность)
Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.
Из протестированных мной моделей отлично себя показывают:
Qwen 3 (4B и 8B), Gemma 3 (разные размеры).
Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.
Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.
Системные требования (3 уровня)
1) Минимальные (базовый режим: только распознавание)
Для кого: если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).
CPU: Intel Core от 4-го поколения (у меня работает на таком железе).
ОЗУ: 8 ГБ.
GPU: не обязателен (можно на CPU, просто будет медленнее).
Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.
2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
Для кого: если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).
CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).
ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).
GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)
Интернет: нужен только для постобработки (распознавание всё равно локальное).
Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.
3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
Для кого: если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.
ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).
GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).
CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.
Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.
ПОЧЕМУ LIFETIME, А НЕ ПОДПИСКА?
Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:
Пожизненную лицензию (Lifetime) на 3 ваших компьютера.
Пакет «Системных промтов» (SMM, деловой стиль, кодинг).
Прямую поддержку от автора в этой теме.
Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.
Важно по-честному про обновления и поддержку:
Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
На международном рынке она, вероятно, будет стоить дороже.
Код будет защищен через обфускацию. Привязка к железу.
Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))
Хватит печатать и копить информацию. Начните управлять ею.
СПЕЦИАЛЬНЫЙ БОНУС ЗА РЕКЛАМУ
Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов
Внутри бонуса набор:
"Telegram-Машина" — посты из бубнежа.
"Корректор" — исправление ошибок с сохранением стиля.
"Деловая Акула" — жесткие юридические письма.
"Кодер" — оформление алгоритмов в чистый код.
Записывайтесь. В повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.
Все экраны приложения.
СКАЧАТЬ СЛИВЫ КУРСОВ
Для возможности скачивать складчины и сливы курсов нужно зарегистрироваться
Возможно, Вас ещё заинтересует:
- [БОМБОРА] Библия садовых цветов. Однолетники, многолетники и луковичные. Советы по посадке, выращиванию и уходу
- Подписка на закрытые материалы (февраль 2026) [Светлана Драган]
- Как научиться учиться. Психология быстрого и эффективного обучения [Оксана Полякова]
- Когнитивная терапия на основе осознанности. Практики для работы с хроническим и травматическим стрессом [Сет Дж. Гиллихан]
- Фейковая реальность: как мы выдумали этот мир [Дмитрий Немшилов]
- [АСТ] Узоры спицами на каждый день. 50 узоров
- Психосоматика лишнего веса. Секрет, который мешает нам худеть [Анабелла Стирз]
- Цвет и свет в макияже. Профессиональное руководство по колористике и спецэффектам для визажистов [Кейти Миддлтон]
- Как вернуть права за управление в состоянии опьянения + Как вернуть права за выезд на встречную полосу [Е. Шельмин] + Как ездить без ДТП [А. Газаров]
- Подписка на закрытые материалы (февраль 2026) [Светлана Драган]