Легкий спосіб конвертувати голос з аудіо\відео файлу в текст (Audio to Text)

Нові коментарі

Нова тема   Відповісти
Автор Повідомлення
miroslav95 
Новенький


З нами з: 28.02.15
Востаннє: 27.11.24
Повідомлень: 21

2017-10-01 13:55  
Ця стаття, на мою думку, найбільш корисна буде для Перекладачів і тих, хто працює з текстом. Ця інструкція потенційно може зекономити ваш час на переробленні звуку в текст (Speech to Text).
Можливо, також хтось знайде ще якесь застосування цьому.
Практичне застосування для Толоки - переклад, субтитрування, озвучка відеокурсів.

Рекомендації щодо звуку.
Бажано, щоб звук в аудіо чи відео файлі був чистий. Гарно вийде, якщо це - інтерв’ю, урок, подкаст і т.п. – тобто, голос чіткий, розбірливий, без звукових ефектів і т.п.
А взагалі, - тестуйте.

1. Загугліть Virtual Audio Cable і завантажте з сайту download.cnet.com (перший в списку пошуку)
Розпакуйте архів.
Встановіть - файл setup - для 32-бітних ПК, та setup64 - для 64-бітних ПК. Пройдіть процес установки, в кінці погодьтесь зі встановленням драйверу.

2. Потім Правою кнопкою миші (далі - ПКМ), клацніть на значок звуку на панелі інструментів (знизу праворуч).
Виберіть – Пристрої записування.
СКРІНШОТ: https://drive.google.com/open?id=0B7oj6i_-QfQ4RnZlMlNHODRkRXM
На вільному місці у вікні клацнути ПКМ – Поставити 2 галочки – Показати вимкнуті пристрої та показати відключені пристрої.
Ви побачите всі пристрої записування, які є. Якщо є мікрофон або щось інше, воно буде включене. Його треба вимкнути. ПКМ на мікрофон – вимкнути.
ПКМ на Line 1 (драйвер, який встановили) – Увімкнути.
Переходимо на вікно Відтворення.
Тут так само на вільному місці ПКМ – показати вимкнуті пристрої та показати відключені пристрої.
ПКМ на Динаміки чи інший пристрій відтворення – вимкнути.
ПКМ на Line 1 – увімкнути.

3.Загугліть - Web Speech API Demonstration. Зайдіть на сайт. Виберіть мову голосу файлу.
Натисніть на кнопку мікрофон. Може з'явитись вікно, в якому треба дозволити використання мікрофону.
Відкриваєте аудіо\ відео файл через ваш програвач, тиснете play.
Ви нічого не почуєте, але коли перейдете до браузера, побачите, що текст почне з’являтись.
Під час конвертування файлу, не можна відкривати інші аудіо\відео файли в браузері чи програвачі чи щось інше, що може видавати звуки, щоб вони не заважали онлайн-програмі, але взагалі за ПК працювати можна.

4. По закінченню ставимо паузу. Тепер можна скопіювати текст в текстовий редактор, перевірити з аудіо\відео на помилки конвертування (які обов'язково будуть), відредагувати і далі робити, що вам треба. Але, перед цим треба повторити крок 2 в зворотньому порядку – тобто, виключити Line 1 в Відтворення та в Запис, і відповідно включити Динаміки і мікрофон, чи те, що ви відключали - щоб чути в динаміках звук і мікрофон для Скайпу і т.д.

Якщо щось незрозуміло, чи є якісь питання - пишіть.
Також буде цікаво почути ваші способи перетворення звуку в текст.
igor911 
Модератор відео


З нами з: 18.01.08
Востаннє: 11.12.24
Повідомлень: 17151

2017-10-01 14:13  
miroslav95, дякую за статтю. Спробував одразу з мікрофону говорити текст - сприймає досить непогано.
Ваш часовий пояс: GMT + 2 Години

Нова тема   Відповісти