Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

ИИ умеет не только генерировать картинки и текст, но и транскрибировать аудио. Конечно, нейросети делают это не так хорошо, как люди: придется подправить знаки и некоторые ошибки. Но если нужно расшифровать небольшую запись, а не трехчасовой доклад, то такие сервисы вполне подойдут. Собрали несколько бесплатных нейросетей для расшифровки аудио.

Whisper

Лимиты: на бесплатных моделях нет
Стоимость: 9,99 $⁣ (800 ₽) в месяц за продвинутые модели — более быстрые и качественные
Поддерживает ли русский: да

Приложение для macOS, которое работает на нейросети Whisper от компании OpenAI. Бесплатно доступны две модели, их нужно предварительно скачать. Язык определяется автоматически. Сервис качественно и быстро транскрибирует, расставляет знаки препинания и разделяет текст на абзацы

Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

Riverside

Лимиты: 2 часа аудио
Стоимость: больше — от 15 $⁣ (1400 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: да

Достаточно перетащить файл на сайт, выбрать один из 100 языков и дождаться транскрибации. Корректно расшифровывает русскую речь и расставляет знаки препинания. Из минусов — не разделяет спикеров в диалоге и не поддерживает популярный формат M4A

Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

Otter.AI

Лимиты: 300 минут в месяц, 30 минут записи разговора за раз
Стоимость: больше — от 8,33 $⁣ (800 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: нет

Создан для расшифровки онлайн-встреч. Записывать звонки не придется: сервис можно подключить напрямую к Google Meets или Zoom. Разделяет речь спикеров, но поддерживает только английский язык

Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

Salute Speech Bot

Лимиты: до 200 000 символов
Стоимость: от 1000 ₽ в год за дополнительные символы
Поддерживает ли русский: да

Телеграм-бот от Сбера работает на нейросети Salute Speech. В нем можно расшифровывать чужие голосовые сообщения и таким образом заменить ботом функцию из платной подписки Telegram Premium. Недостаток — не до конца расшифровывает длинные сообщения

Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

Teamlogs

Лимиты: 15 минут
Стоимость: дальше — 6 ₽ за минуту
Поддерживает ли русский: да

Онлайн-сервис с интерфейсом на русском. Поддерживает 13 форматов аудио, разделяет речь спикеров, позволяет отредактировать расшифровку перед скачиванием. Дополнительно с помощью ИИ может составить конспект и выделить ключевые слова

Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

Писец

Лимиты: 10 минут бесплатно, потом — расшифровка на низких скоростях
Стоимость: 1290 ₽ за 5 часов быстрой расшифровки
Поддерживает ли русский: да

Сайт разделяет текст до пяти спикеров, расставляет знаки препинания и тайм-коды, но может ошибаться в отдельных словах. С бесплатным тарифом расшифровка иногда занимает несколько часов в зависимости от очереди

👾 Еще больше о нейросетях

В рассылке «Капча». Рассказываем про новые ИИ и полезные сервисы, разбираемся в интернет-культуре, делимся актуальными мемами и трендами

Подписываясь, вы принимаете условия передачи данных и политику конфиденциальности

Что еще можно делать с помощью нейросетей:

  1. Писать музыку.
  2. Искать в интернете.
  3. Генерировать картинки.

Источник: journal.tinkoff.ru

Like this post? Please share to your friends:
Нейросеть
Добавить комментарий