Привет, Хабр! Представляю вашему вниманию перевод статьи «Являются ли онлайн-сервисы транскрипции безопасными и конфиденциальнымиЭ» автор Мэтью Хьюз .
Транскрипция когда-то была утомительным процессом вручную.
Врачи, журналисты и целый ряд специалистов записывали свои записи и разговоры на диктофон, а затем садились перед компьютером и печатали их на клавиатуре.
В 2020 году существует ряд сервисов, которые можно использовать для преобразования аудио в текст. Однако остается вопрос: безопасны ли они? Например, вы можете скачать записи конфиденциальных разговоров и частных голосовых сообщений.
Давайте посмотрим на эти услуги и на то, как вы можете защитить свою информацию.
Автор иллюстрации: Янгард
Это изображение доступно по адресу Лицензия Creative Commons Attribution-ShareAlike 4.0 по всему миру .
Как работают услуги транскрипции аудио
Услуги по транскрипции аудио обычно делятся на три категории.Первый полностью управляется компьютером и использует существующие модели искусственного интеллекта и машинного обучения для обработки разговора.
Второй – самый дорогой – это когда весь процесс осуществляют люди.
Третий — это сочетание компьютерной обработки и человека.
Вы, скорее всего, наиболее знакомы с первой категорией.
Службы транскрипции голоса, такие как Google, Apple и Выдра.
ай , преобразуйте аналоговые волны, создаваемые вашим голосом, в цифровое представление.
Затем они разбиваются на небольшие (иногда тысячные доли секунды) сегменты и сравниваются с известными «фонемами» или элементами языка.
Затем эти алгоритмы пытаются рассмотреть их в контексте других фонем и пропустить через статистические модели и модели искусственного интеллекта, которые в конечном итоге создают текст. Поскольку эти услуги транскрипции полностью управляются компьютером, они, как правило, самые недорогие.
Однако точность не всегда самая лучшая, особенно когда речь идет об извлечении текста из шумной или многопользовательской среды.
Человеческая транскрипция включает в себя специальные платформы, такие как Преподобный , которые подключают клиентов к пулу предварительно одобренных транскрипционистов.
Вы также можете нанять фрилансеров, например Апворк или Фиверр .
Наконец, существует смесь того и другого.
Чтобы ускорить процесс транскрипции, некоторые сайты позволяют ИИ выполнить предварительную работу, а затем кто-то очищает выходные данные и исправляет любые ошибки.
Службы транскрипции ведут себя плохо
В последние годы многие сервисы транскрипции стали объектом нарушений и скандалов.Вероятно, самым старым (и, возможно, самым вопиющим) был SpinVox, который в 2000-х годах предлагал услугу, превращающую голосовую почту в SMS-сообщения.
В то время это считалось технологическим прорывом.
Фирма быстро привлекла положительную прессу, клиентов и обширное финансирование.
В чем проблема? Скрытые от клиентов их голосовые сообщения обрабатываются людьми, работающими в офисах, расположенных в Пакистане, Маврикии и Южной Африке.
.
Один инсайдер компании заявил, что только 2% голосовой почты обрабатывается машинами, а остальную часть обрабатывают примерно 10 000 эксплуатируемых рабочих.
Когда сотрудникам пакистанского офиса SpinVox не заплатили зарплату, они в знак протеста начали рассылать сообщения напрямую клиентам.
В конце концов правда вышла наружу, и SpinVox потеряла большую часть своей стоимости, а оставшаяся часть компании была продана Нюанс , одного из крупнейших поставщиков услуг распознавания голоса в мире.
Совсем недавно журналист по кибербезопасности Брайан Кребс обнаружил серьезное нарушение, произошедшее в MEDantex , расположенного в Канзасе поставщика услуг по транскрипции голоса для медицинских работников.
Произошла утечка данных (некоторые из которых относятся к 2007 году), содержащих конфиденциальные медицинские записи.
Их содержимое могло быть загружено с небезопасного портала в виде файлов Microsoft Word. Даже полностью цифровые службы транскрипции небезопасны.
Вы заказываете такую компьютеризированную услугу, а компания может привлечь контрактников для контроля качества.
В 2019 году бельгийский новостной сайт ВРТ НВС обнаружила, что подрядчики Google прослушивают разговоры между людьми и их умными помощниками Google Home. Один подрядчик даже предоставил VRT NWS доступ к разговорам, многие из которых были очень деликатными, а в некоторых случаях и сексуально интимными.
Amazon, Apple и Microsoft также использовали подрядчиков.
Другими словами, возможно, кто-то прослушивал голосовые записи вашего виртуального помощника .
Горячий вопрос: безопасны ли онлайн-сервисы транскрипции?
Ответ на этот вопрос немного сложен.На данный момент рынок в значительной степени созрел для услуг транскрипции, и наиболее вопиюще плохие игроки отсеяны.
Однако, когда вы доверяете свои данные (в данном случае частные разговоры) третьей стороне, вы ожидаете, что они достаточно защищены.
Независимо от того, являются ли они онлайн-сервисами или сервисами, использующими работников транскрипции.
Но в любом случае задайте себе два вопроса: доверяете ли вы этому сервису и насколько конфиденциальны ваши разговоры? Если вы ищете службу транскрипции, всегда стоит провести небольшое исследование.
Имеет ли эта компания хорошую репутацию? Хорошо ли он себя зарекомендовал? Были ли у нее какие-либо нарушения в прошлом? Существует ли политика конфиденциальности, в которой четко указано, как ваши данные будут обрабатываться и защищаться? Как уже упоминалось ранее, службы на основе искусственного интеллекта часто полагаются на сотрудников и сторонних подрядчиков для проведения проверок качества.
Хотя эти чеки представляют собой лишь часть всех заказов, всегда существует вероятность того, что кто-то сможет прослушать ваши записи.
Но во многих случаях это не станет препятствием для сделки.
Однако, если ваш разговор носит глубоко личный или коммерческий характер, рассмотрите возможность открытия текстового процессора и расшифровки его самостоятельно.
Теги: #информационная безопасность #Звук #microsoft #Google #История ИТ #Исследования и прогнозы в ИТ #Apple #AI #безопасность #исследования #машинное+обучение #конфиденциальность #информационная безопасность #информация+утечки #искусственный+интеллект
-
Gis Days 2020, Краткий Обзор Сессии Pro2
19 Oct, 24 -
Как Я Скачал Исходный Код Собственного Сайта
19 Oct, 24 -
Открытка В Твиттере
19 Oct, 24 -
Kbtrainer: Chrome, Firefox, Hta
19 Oct, 24