Голос в текст: три метода, 10+ инструментов

Всем привет, продолжаем разбираться с проблемами в Кали Линукс, и после очередного обновления столкнулся с интересной проблемкой. Ну, не проблема , конечно. Пропал звук, вобщем. И как на почту и в блог пишут люди, я такой не один. Давайте разберёмся вместе.

Используем stereo mix для записи звука с экрана компьютера

Чтобы сделать звукозапись, выполняем следующие действия:

  1. В трее нажмите левой кнопкой мышки по значку громкости, далее «Открыть параметры звука». Перейдите в «Панель управления звуком».
  2. В окне переходим на вкладку «Запись», находим функцию «Стерео микшер».
  3. Часто производители эту функцию делают невидимой. Если стерео микшера в каталоге нет, то в пустом поле вкладки кликаем правой клавишей мышки. Выпадает контекстное меню, в котором выбираем функцию, показывающую отключенные устройства. В итоге в перечне устройств увидим стерео микшер.
  4. Активируем устройство нажатием правой клавишей мышки, включаем и выбираем и «По умолчанию».

Примечание:

Особенности настройки звука в Ubuntu

В большинстве случаев операционная система находит драйвер, необходимый для звуковой карты, а если не обнаруживает его, то подставляет универсальный драйвер, который будет работать «из коробки» без дополнительной настройки.

В редких случаях, но звука после установки порою не слышно. Это объясняется следующими причинами:

  1. В микшере звук по умолчанию отключен (самая распространенная ситуация, когда ползунки в микшере выкручены на ноль, или стоит галочка — «Выключен звук»).
  2. Неработающий микшер ALSA (необходим набор утилит для проверки его исправности).
  3. Необходимо установить аудиодрайвер.
  4. Сохранить настройки alsamixer.

В зависимости от ситуации необходимо выбрать тот или иной алгоритм действий для исправления звука в Линукс.

Симптомы.

  • В Кали Линукс нет звука . Ни при загрузке, ни при воспроизведении музыкальных и видеороликов.

А раньше почему-то был… И ничего не предпринималось ведь…

У меня стоит 64-х битная версия Кали 2.0, но, думаю, прокатит и в остальных версиях. Пару простых команд – и мы в седле. Насколько я успел разобраться, нижеследующие советы в версиях 2019.Х также прокатывают. В последних версиях будьте внимательны – звук может быть активирован, но сигналов динамики, как прежде, при щёлкании мышкой по ползунку громкости не подают. Лучше включить музыку и проверять проделанное.

  • Сначала проверим, не делась ли куда звуковая карта. Наберём в терминале запрос на вывод имеющихся устройств:
Читайте также:  20 команд netstat для управления сетью Linux и Windows

lspci

Кто забыл английский, напомню, что аудиоустройство так и называется – audio. То есть вот оно, родимое:

Нужное я выделил. Ну что, уже легче. Проверим, не слетела ли сама аудиослужба. Но чтобы время не тратить, сразу наберите в терминале команду:

apt-get install libasound2 alsa-utils alsa-oss

Мой терминал ответил, что всё на месте. А раз так, запустим AlsaMixer и проверим настройки устройств воспроизведения и записи звука:

alsamixer

Ну точно… Всё приглушено… Видите спаренные ММ или одинарные М внизу каждого из устройств?

Через F6 выберу карту, выделенную терминалом:

А теперь с помощью стрелок вправо-влево и клавиши М (латинской, конечно) я снимаю атрибут “muted – приглушён“. Клавиши вверх-вниз увеличат-уменьшат звук. У меня получилось так:

Вуаля. Всё работает, мир снова полон красок и, конечно, звуков. Ну не в тишине же наказывать недобросовестных владельцев блогов и сайтов.

  • На всякий случай проверим аудиослужбу по умолчанию:

systemctl —user enable pulseaudio && systemctl —user start pulseaudio

Как записать звук напрямую с компьютера Windows без микрофона (в  браузере, плеере, игре и тд)

Разберем работу программы Audacity на примере:

1. Запустите Audacity и создайте новый проект;

Как записать звук напрямую с компьютера Windows без микрофона (в  браузере, плеере, игре и тд)

3. Наблюдайте, как программа фиксирует звук, воспроизводимый на компьютере;

4. По окончании записи, нажмите кнопку Стоп и сохраните полученную запись в нужном формате при помощи функции «Экспорт».

Как записать звук напрямую с компьютера Windows без микрофона (в  браузере, плеере, игре и тд)

Вот так легко и быстро можно записать звук с онлайн-семинара, аудиодорожку фильма или клипа.

Скачать Audacity

Смотрите также:

Как записать звук напрямую с компьютера Windows без микрофона (в  браузере, плеере, игре и тд)
  • Как ускорить Windows 10, 8 или 7, отключив ненужные службы операционной системы.
  • 10 функций Mac, которые можно использовать на компьютерах с Windows.
  • Как отключить пароль на вход в Windows 10: рабочие способы.

С помощью приложения Запись голоса

Запись экрана Windows 10 со звуком с рабочего стола

Как уже говорилось ранее, В Windows 10 запись микрофона может производиться при помощи встроенной утилиты «Запись голоса». Чтобы запустить эту встроенную программу, достаточно в строке поиска вписать «Запись голоса» и нажать на клавиатуре «Enter» для начала поиска. После чего запустить искомый элемент.

Читайте также:  Как восстановить работоспособность Wi-Fi в iOS 14 и iPadOS 14

Как найти приложение в ОС Windows 10

С помощью приложения Запись голоса

Интерфейс программы очень простой и понятный. Пользователю достаточно нажать на единственную кнопку, которая будет расположена в центре окна. Эта манипуляция позволит начать процесс записи своего голоса через микрофон. Если требуется записывать сторонние звуки, то на экране будет отображено три кнопки: стоп, пауза и метки. Кнопка метки визуально напоминает флаг и предназначена для выделения интересных мест, которые позже могут пригодиться.

После того, как юзер нажмет «стоп», запись с микрофона Windows 10 будет прекращена и на экране отобразятся все доступные записи. Также в нижней части экрана будет отображаться троеточие, предназначенное для отображения дополнительных функций: поделиться, присвоить записанному файлу новое имя, обрезать и т. д.

Интерфейс программы Запись голоса в Виндовс 10

Теперь стоит более детально ознакомиться с особенностями использования Диктофон Windows 10. Для записи звука предварительно нужно подключить микрофон, после чего следовать пошаговой инструкции:

  1. Открыть приложение «Запись голоса».
  2. Система отобразит на экране запрос на разрешение доступа к микрофону. Для продолжения работы нужно нажать «Да».
  3. Для начала записи можно нажать на изображение микрофона или же воспользоваться сочетанием клавиш «Ctrl + R».
  4. Если пользователю потребуется остановить запись, не прерывая сеанса, нужно нажать на кнопку «Пауза». Для завершения сеанса нажать «Стоп».
С помощью приложения Запись голоса

Все аудиофайлы сохраняются автоматически в формате .mp4. в папке «Звукозаписи», расположенной в другой папке под названием «Документы».

Усовершенствовать ручную расшифровку

Можно пойти другим путем — не автоматизировать, но упростить работу и транскрибировать без кошмара, описанного в самом начале статьи. Вам все равно придется слушать и записывать, но это будет удобно делать внутри хорошо обустроенного сервиса.

oTranscribe

Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.

Усовершенствовать ручную расшифровку

Интерфейс oTranscribeИнтерфейс oTranscribe

Express Scribe

Условно-бесплатное десктопное ПО для Windows/Mac. Позволяет загружать аудио и видеофайлы с самых разных источников: дисков, FTP-серверов, электронных писем и др. Поддержка форматов зависит от версии: например, mp3 и wav открываются в любом случае, а wmv, mp4 или 3gp — только в Pro.

Читайте также:  Мобильные операционные системы (мобильная ОС)

Гибкие настройки воспроизведения: управляйте горячими клавишами, меняйте скорость, переключайтесь на определенный таймкод. Можно добавлять заметки к файлам, подключать к работе ножную педаль — специальное устройство, USB-переключатель для геймеров и транскрибаторов.

Удобно, что все записи добавляются в список и между ними легко переключаться — не нужно каждый раз заново их загружать. Неудобно, что нет текстового редактора (зато есть интеграция с MS Word, Corel Wordperfect, Lotus Wordpro ​​и другими текстовыми процессорами под Windows).

Усовершенствовать ручную расшифровку

Неограниченная лицензия PRO стоит от 25 $, но для личного использования вполне хватит бесплатной версии.

Так выглядит окно Express Scribe

Transcriber Pro

Тоже десктопный инструмент для ускорения ручной расшифровки (правда, только аудио в текст и только для Windows). Функциональность похожа на аналогичные решения: есть управление горячими клавишами, создание заметок (тегов), автозамена текста, настройка «прыжка» после паузы и др.

В числе преимуществ Transcriber Pro также указали командную работу — возможность разбивать проект на подзадачи, выгружать их и пересылать, потом объединять результаты в один файл. Участники команды будут работать в офлайне, но результат потом соберется в одно целое.

Усовершенствовать ручную расшифровку

Видеообзор программы.

LossPlay

Это десктопный плеер для Windows в помощь расшифровщикам аудио/видео. Открывает mp3, wav, mp4 и др. (разработчики отмечают, что есть также «интеллектуальная поддержка недокументированных форматов», что бы это ни значило). Парит поверх всех окон, поэтому позволяет работать в любом текстовом редакторе.

Hot keys настраиваются не только для управления воспроизведением, но и для вставки шаблонных текстовых фрагментов. Если не нравится стандартный дизайн, в настройках можно задать элементам другие цвета.

Придется по душе тем, кто ностальгирует или до сих пор пользуется Winamp.

Усовершенствовать ручную расшифровку

Такой вот внешний вид у LossPlay

Универсальное решение:

Альтернатива всем вышеперечисленным инструментам — Transcribe (). Этот онлайн-сервис позволяет транскрибировать текст обоими способами: вручную (как в oTranscribe) и автоматически (создатели указывают точность 90%). Открывает десятки видов файлов: webm, mp3, mp4, 3gp, wmv и др. Есть автосохранение, работа без доступа к интернету, интеграция ножной педали, настройка горячих клавиш, экспорт видеосубтитров. В отличие от RealSpeaker, гарантируется безопасность и приватность.

Бесплатно можно получить только 1 минуту автоматической расшифровки. Далее — 6$ в час. Ручная транскрибация тоже стоит денег, но совсем небольших — 20$ в год.

Так выглядит инструмент для ручной транскрибации

Усовершенствовать ручную расшифровку

Пример работы авторасшифровщика