Разогнанный Движок – Abbyy Finereader Engine 10 Для Windows Работает Намного Быстрее

На прошлой неделе мы выпустили очередную версию OCR SDK — продукта для внедрения технологий распознавания текста в различные приложения.

Вот уже много лет мы дополняем выпуск кастомных коробочных FineReader тиражом кружек и футболок, выпуская соответствующие технологии в виде SDK — FineReader Engine (для краткости мы называем его FRE).

Ниже под катом я расскажу об улучшениях новой FRE по сравнению с предыдущими версиями.

Разрабатывая новую версию, мы ставили перед собой почти олимпийские цели – точнее, быстрее, функциональнее.

Мы активно работали над точностью и функциональностью девятой версии FineReader Engine и добились в этом плане заметных улучшений.

В десятой версии на первый план вышла скорость.

К релизу нам удалось ускорить Fast Mode (специальный режим скоростного распознавания) в 1,5–2 раза для большинства европейских языков.

В то же время увеличение скорости не произошло в ущерб качеству; точность распознавания в быстром режиме осталась в среднем на том же уровне.

Для русского языка скорость выросла в среднем на 44%.

Такие цифры были получены в результате внутреннего тестирования на пакетах, содержащих основные виды офисных документов.



Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

Относительный прирост скорости для каждого языка по сравнению с результатами FRE 9.0 (выпущено 21 октября 2008 г.

) Для основных азиатских языков — китайского, японского и корейского — точность по-прежнему оставалась главной целью.

Количество ошибок при распознавании документов на этих языках снизилось в среднем на 30-40%.

Кроме того, на графике видно значительное увеличение скорости.

Также было сделано множество менее очевидных улучшений.

Новая бинаризация – преобразование цветных изображений и изображений в оттенках серого в черно-белые.

Это необходимый этап подготовки документов к признанию; он определяет, можно ли будет распознать бледный текст на скане скомканного листа с отпечатками пальцев.

Бинаризация стала намного лучше, это одна из причин, почему качество не пострадало при увеличении скорости.

Камера оптического распознавания символов ТМ — набор специальных преобразований для улучшения качества распознавания текста на сфотографированных документах.

Среди них: — исправление трапециевидных искажений, появляющихся при съемке под углом, — устранение размытости на фотографиях — характерный дефект при съемке без штатива, — сглаживание шума ISO — множество разноцветных точек на фотографии, которые появляются при высокой чувствительности камеры в условиях плохой освещенности.

Появились новые возможности АДРТ ТМ — восстановление структуры документа (карты документа) и оглавления (ТОС) по заголовкам, автоматическое создание стилей, распознавание подписей к картинкам, установка специального стиля подписи и объединение картинки и подписи в единый объект. Очень важным улучшением является повышение понятности, доступности продукта и упрощение работы с ним.

OCR SDK — это многофункциональный инструмент с огромным API, который позволяет настраивать большое количество параметров.

Пользователи решают самые разные задачи.

Кто-то разрабатывает системы сканирования книг из библиотеки в PDF с возможностью контекстного поиска, кто-то реализует автоматическую регистрацию документов в SЭD на основе распознавания штрих-кодов, а кто-то разрабатывает собственные технологии извлечения данных с использованием функции распознавания и проверки текста.

Очевидно, что разные задачи предъявляют разные требования к функциональности SDK и качеству технологий.

В одном случае на первом месте стоят качество и размер получаемых PDF-файлов, в другом — точность распознавания текста или штрих-кода.

Поэтому для решения разных задач требуются разные настройки.

Чтобы упростить настройку продукта, мы создали ряд профили , содержащий оптимальные значения параметров для решения конкретных задач.

Эта идея отражена в основном «визуале» продукта:

Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

Просто выберите подходящий профиль, и вы готовы к работе.

Кроме того, значительно улучшена справка по продукту; он стал более структурированным и законченным.

Мы надеемся, что все это поможет вам быстрее и проще интегрировать FineReader Engine в приложения и получить еще лучшие результаты распознавания.

Мы планируем выпустить версию FRE10 для Linux примерно через год. Семен Сергунин Отдел технологических продуктов Теги: #abbyy #finereader #engine #ocr #recognition #sdk #ECM/EDS

Вместе с данным постом часто просматривают: