На прошлой неделе мы выпустили очередную версию OCR SDK — продукта для внедрения технологий распознавания текста в различные приложения.
Вот уже много лет мы дополняем выпуск кастомных коробочных FineReader тиражом кружек и футболок, выпуская соответствующие технологии в виде SDK — FineReader Engine (для краткости мы называем его FRE).
Ниже под катом я расскажу об улучшениях новой FRE по сравнению с предыдущими версиями.
Разрабатывая новую версию, мы ставили перед собой почти олимпийские цели – точнее, быстрее, функциональнее.
Мы активно работали над точностью и функциональностью девятой версии FineReader Engine и добились в этом плане заметных улучшений.
В десятой версии на первый план вышла скорость.
К релизу нам удалось ускорить Fast Mode (специальный режим скоростного распознавания) в 1,5–2 раза для большинства европейских языков.
В то же время увеличение скорости не произошло в ущерб качеству; точность распознавания в быстром режиме осталась в среднем на том же уровне.
Для русского языка скорость выросла в среднем на 44%.
Такие цифры были получены в результате внутреннего тестирования на пакетах, содержащих основные виды офисных документов.
Относительный прирост скорости для каждого языка по сравнению с результатами FRE 9.0 (выпущено 21 октября 2008 г.
) Для основных азиатских языков — китайского, японского и корейского — точность по-прежнему оставалась главной целью.
Количество ошибок при распознавании документов на этих языках снизилось в среднем на 30-40%.
Кроме того, на графике видно значительное увеличение скорости.
Также было сделано множество менее очевидных улучшений.
Новая бинаризация – преобразование цветных изображений и изображений в оттенках серого в черно-белые.
Это необходимый этап подготовки документов к признанию; он определяет, можно ли будет распознать бледный текст на скане скомканного листа с отпечатками пальцев.
Бинаризация стала намного лучше, это одна из причин, почему качество не пострадало при увеличении скорости.
Камера оптического распознавания символов ТМ — набор специальных преобразований для улучшения качества распознавания текста на сфотографированных документах.
Среди них: — исправление трапециевидных искажений, появляющихся при съемке под углом, — устранение размытости на фотографиях — характерный дефект при съемке без штатива, — сглаживание шума ISO — множество разноцветных точек на фотографии, которые появляются при высокой чувствительности камеры в условиях плохой освещенности.
Появились новые возможности АДРТ ТМ — восстановление структуры документа (карты документа) и оглавления (ТОС) по заголовкам, автоматическое создание стилей, распознавание подписей к картинкам, установка специального стиля подписи и объединение картинки и подписи в единый объект. Очень важным улучшением является повышение понятности, доступности продукта и упрощение работы с ним.
OCR SDK — это многофункциональный инструмент с огромным API, который позволяет настраивать большое количество параметров.
Пользователи решают самые разные задачи.
Кто-то разрабатывает системы сканирования книг из библиотеки в PDF с возможностью контекстного поиска, кто-то реализует автоматическую регистрацию документов в SЭD на основе распознавания штрих-кодов, а кто-то разрабатывает собственные технологии извлечения данных с использованием функции распознавания и проверки текста.
Очевидно, что разные задачи предъявляют разные требования к функциональности SDK и качеству технологий.
В одном случае на первом месте стоят качество и размер получаемых PDF-файлов, в другом — точность распознавания текста или штрих-кода.
Поэтому для решения разных задач требуются разные настройки.
Чтобы упростить настройку продукта, мы создали ряд профили , содержащий оптимальные значения параметров для решения конкретных задач.
Эта идея отражена в основном «визуале» продукта:
Просто выберите подходящий профиль, и вы готовы к работе.
Кроме того, значительно улучшена справка по продукту; он стал более структурированным и законченным.
Мы надеемся, что все это поможет вам быстрее и проще интегрировать FineReader Engine в приложения и получить еще лучшие результаты распознавания.
Мы планируем выпустить версию FRE10 для Linux примерно через год. Семен Сергунин Отдел технологических продуктов Теги: #abbyy #finereader #engine #ocr #recognition #sdk #ECM/EDS
-
Тяжёлая Тишина: Дом Тупика.
19 Oct, 24 -
Дети Настоящего И Гаджеты Прошлого
19 Oct, 24