Юристы в профессиональной деятельности зачастую сталкиваются с необходимостью расшифровать аудиозапись в текст. Аудиопротоколы судебных заседаний, записи встреч и иные подобные записи, конечно, могут быть расшифрованы вручную, но такая работа отнимает много времени и сил.
Однако появляются сервисы, позволяющие автоматизировать транскрибацию и значительно упростить ее.
В данной статье проанализированы следующие сервисы автоматической транскрибации:
-
сервис «Писец» https://pisec.app/transcription/
-
сервис «Whisper JAX» https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
-
сервис «Riverside» https://riverside.fm/transcription
«Писец»
-
Расшифровывает любые аудио- и видеофайлы (WMA, MP4, MKV, FLV, OGG, AAC, WAV, AVI, MOV, WMV, M4A, MP3, FLAC и др.);
-
бесплатный, однако срок ожидания может составлять до 24 часов;
-
есть платный тариф с быстрой расшифровкой;
-
русский язык;
-
разделяет текст по спикерам.
«Whisper JAX»
-
Расшифровывает запись диктофона, аудиофайлы, ссылку на видео на YouTube;
-
бесплатный;
-
русский и английский языки;
-
есть возможность поставить тайм-коды в тексте.
«Riverside»
-
Расшифровывает ограниченное количество форматов (MP3, WAV, MP4, MOV);
-
бесплатный;
-
большой выбор языков (100+).
Для тестирования была взята запись судебного заседания продолжительностью 36 минут.
Сервис «Писец»
Письмо с результатом расшифровки в формате *.docx приходит на электронную почту. Так как сервис предоставляет пользователям один час расшифровки в месяц на высокой скорости, запись была обработана сразу же.
Скриншот с результатом распознавания:
Сервис не справился с разбивкой текста по спикерам. «Писец» верно распознает специализированные фразы и термины: «право собственности на объект самовольной постройки», «иск о подтверждении там права собственности», «госинспекция». В то же время сервис плохо справляется с транскрибацией фамилий: в тексте встречается четыре варианта написания одной и той же фамилии.
Однако основная проблема расшифровки заключается в том, что часть текста не была транскрибирована вообще. В предварительном судебном заседании судья удалилась, в связи с чем на протяжении ~11 минут в записи не было речи. В последние 2 минуты записи речь была возобновлена, но сервис не расшифровал ничего из этого отрезка.
Сервис «Whisper JAX»
Результат расшифровки выдается прямо на сайте в виде текста, который доступен к копированию. Скорость обработки записи — 16 секунд.
Скриншот с результатом распознавания:
Данный сервис справляется с распознаванием примерно на том же уровне, что и предыдущий, при этом в тексте встречаются «правомощные документы», «неживое здание», «ИСЦУ» (имеется в виду «истцу»).
Период тишины в расшифровке выглядит следующим образом:
Однако «Whisper JAX», в отличие от предыдущего сервиса, расшифровывает текст полностью, не пропуская последние 2 минуты записи.
Сервис «Riverside»
Результат расшифровки доступен также на сайте в виде текста с тайм-кодами, который доступен к копированию. Скорость обработки записи ~1 минута.
Уровень распознавания «Riverside» значительно хуже, чем у аналогов. Слова транскрибируются с ошибками: «отведчиков», «самоуальной» («самовольной»), «важимые» («уважаемые»). В некоторых отрывках понять, о чем идет речь, невозможно, так как текст представляет собой набор несуществующих слов:
Стоит отметить, что с расшифровкой голосового сообщения, записанного в хорошем качестве, все вышеуказанные сервисы справляются гораздо лучше. Если же исходный файл записан нечетко, и, как протокол судебного заседания, который был использован для примера, содержит паузы, посторонние шумы, наложения голосов, то ни один из рассмотренных сервисов не справится с расшифровкой на 100%.
Таким образом, в настоящий момент сервисы автоматической расшифровки не доведены до идеала и не могут полностью заменить ручную расшифровку. В любом случае потребуется последующая корректировка текста вручную. В то же время использование подобных программ несоизмеримо облегчает последующую транскрибацию.
Надеемся, что наш краткий обзор поможет вам и облегчит вашу профессиональную деятельность.
Автор статьи:
юрист Елена Чжао
Юридическая компания «Неделько и партнеры»