Скачать [Windows] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic]

Джокер

Администратор
Регистрация
1 Янв 2015
Сообщения
127.653
Реакции
75.982
Whisper Voice Machine: Преврати гигабайты курсов в Знания, а голос в Деньги
Ваш Персональный Командный Центр с поддержкой MCP

История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня...





У вас тоже есть эта папка? "Разобрать позже"?

Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.

Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.

А теперь представьте другую реальность.
Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.

Whisper Voice Machine (WVM)
Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.
Почему я перестал печатать (владея слепой печатью 16 лет)?

Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать - это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace - идея ускользает или мутирует.

Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.

ТРИ РЕЖИМА ИСПОЛЬЗОВАНИЯ
Узнайте себя в одном из них

Для "Коллекционеров Знаний" (Складчиков)
Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод.
Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.

Для SMM, Копирайтеров и Креаторов
Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента.

Для Управленцев и Менеджеров
Вас бесят бесконечные переписки, но вы обязаны соблюдать корпоративный этикет?
Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной.

ВАШ ТЕХНОЛОГИЧЕСКИЙ АРСЕНАЛ

Спойлер: Раскрыть подробные возможности программы
1. Тотальный отказ от ручной печати
Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор - туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль.

2. "Пожиратель Курсов": Видео в Текст + Перевод
Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переведи на русский и оформи как конспект". Вы получите готовую методичку на родном языке.

3. Model Content Protocol (MCP Server)
Технология будущего, доступная сегодня.
WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
Вы можете попросить Claude Desktop (или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."

4. Умный поиск и База Знаний
Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется.




Окно поиска: Ваша база знаний всегда под рукой




Настройки AI: Полная свобода в выборе моделей и промтов
Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.

1) Распознавание (Уши) — 100% локально
Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.

Базовый вариант (без постобработки):
Вы можете выключить постобработку и работать почти что на любом современном компьютере.
Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
Это самый доступный режим.

2) Постобработка (Мозги) — на ваш выбор


Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
Пример: OpenRouter (Gemini Flash, DeepSeek и др.).
Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.

Вариант №3 — локальная постобработка (тотальная приватность)
Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.

Из протестированных мной моделей отлично себя показывают:
Qwen 3 (4B и 8B), Gemma 3 (разные размеры).
Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.

Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.


Системные требования (3 уровня)

1) Минимальные (базовый режим: только распознавание)
Для кого: если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).

CPU: Intel Core от 4-го поколения (у меня работает на таком железе).
ОЗУ: 8 ГБ.
GPU: не обязателен (можно на CPU, просто будет медленнее).
Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.

2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
Для кого: если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).

CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).
ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).
GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)
Интернет: нужен только для постобработки (распознавание всё равно локальное).
Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.

3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
Для кого: если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.

ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).
GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).
CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.
Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.



ПОЧЕМУ LIFETIME, А НЕ ПОДПИСКА?
Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:


Пожизненную лицензию (Lifetime) на 3 ваших компьютера.
Пакет «Системных промтов» (SMM, деловой стиль, кодинг).
Прямую поддержку от автора в этой теме.
Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.

Важно по-честному про обновления и поддержку:
Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
На международном рынке она, вероятно, будет стоить дороже.
Код будет защищен через обфускацию. Привязка к железу.
Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))


Хватит печатать и копить информацию. Начните управлять ею.

СПЕЦИАЛЬНЫЙ БОНУС ЗА РЕКЛАМУ
Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов
Внутри бонуса набор:

"Telegram-Машина" — посты из бубнежа.
"Корректор" — исправление ошибок с сохранением стиля.
"Деловая Акула" — жесткие юридические письма.
"Кодер" — оформление алгоритмов в чистый код.

Записывайтесь. В повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.

Все экраны приложения.
















СКАЧАТЬ СЛИВЫ КУРСОВ
 

Возможно, Вас ещё заинтересует: