Project Naptha — Выделяйте, Копируйте И Переводите Тексты С Любых Картинок

Я не смог найти ни одного упоминания об этом замечательном расширении для Google Chrome на hh/gt. Хочу поделиться им с сообществом, потому что в последнее время это помогает мне экономить около 10 минут каждый день — там много скриншотов из соцсетей на разных языках, которые можно перевести в два клика с помощью этого плагина.

Встретиться - Проект Нафта ( Интернет-магазин Chrome ).



Project Naptha — выделяйте, копируйте и переводите тексты с любых картинок

Список возможностей:

  • скопировать текст с изображения
  • выделить весь текст
  • Google выделил текст
  • выбор перевода (бета)
  • говорить (TTS) выделено
Проект был создан Кевин Квок и представляет собой систему OCR (оптическое распознавание символов), реализованную на JavaScript как расширение браузера.

Project Naptha, хотя и прост для конечного пользователя, довольно сложен внутри.

Прежде всего, прежде чем начнется само распознавание текста, необходимо определить, где на картинке расположены собственно блоки с текстом.

Довольно нетривиальная задача, учитывая, что текст может располагаться поверх совершенно разных фонов и сам иметь разные цвета.

Для реализации этого механизма Naptha использует проект Microsoft Преобразование ширины штриха (SWT) — эффективный алгоритм, учитывающий тот факт, что шрифты обычно имеют примерно одинаковую толщину линий (font-weight) и, следовательно, легко отделить блоки текста от остального шума на изображении.

Оригинал:

Project Naptha — выделяйте, копируйте и переводите тексты с любых картинок

После СВТ:

Project Naptha — выделяйте, копируйте и переводите тексты с любых картинок

Нафта, конечно, не распознает каждую картинку на открытой странице — это было бы крайне расточительно по отношению к ресурсам.

Вместо этого он начинает распознавать расположение блоков текста только после.

нет, не наведя указатель мыши на изображение (наведение курсора мыши), как можно подумать, а предположив, что курсор будет находиться над изображением на основе его движения.

.

Дальше Веб-работники (многопоточность в фоновом режиме) работают над распознаванием расположения текста на изображении без заметного замедления работы браузера.

Когда вы выбрали блок текста и нажали «Копировать текст» (Ctrl+C), он отправляется на сервер с помощью Окрад OCR - механизм распознавания текста с открытым исходным кодом.

Ocrad попытается распознать фрагмент растрового изображения в текст, что может занять пару секунд, а после завершения вернет распознанный текст, который можно вставить обычным способом куда угодно (Ctrl+V).

Функция перевода все еще находится в стадии бета-тестирования, чтобы попробовать ее, вам нужно отправить запрос на их адрес электронной почты.

Ожидается, что он будет работать аналогично уже работающему аналогу в Google Translate на мобильных устройствах: Проект пока находится на стадии тестирования, но уже на данный момент он достаточно хорош, чтобы использовать его в производстве.

Можно, конечно, придраться к деталям и возможным тормозам, но этот товар, насколько мне известно, единственный в своем роде и он уже экономит мне время.

Теги: #Google Chrome #расширения Google Chrome #расширения #ocr #ocr технологии #Google Chrome #обработка изображений #расширения браузера

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.