Для каких целей используют программу fine reader


Что такое ABBYY FineReader

ABBYY FineReader — это система оптического распознавания текстов (OCR — Optical Character Recognition). Она предназначена для конвертирования в редактируемые форматы отсканированных документов, PDF-документов и файлов изображений документов, включая цифровые фотографии.

Преимущества программы ABBYY FineReader 12

Скорость и высокая точность распознавания

  • Используемая в ABBYY FineReader система оптического распознавания быстро и точно распознает и максимально полно сохраняет исходное оформление документа.
  • Благодаря технологии адаптивного распознавания документов ADRT® (Adaptive Document Recognition Technology) ABBYY FineReader позволяет анализировать и обрабатывать документ целиком, а не постранично. В результате восстанавливается исходная структура документа, включая форматирование, уровни заголовков, гиперссылки, а также колонтитулы, номера страниц и сноски.
  • Еще одной особенностью программы ABBYY FineReader является малая чувствительность к дефектам печати и способность распознавать тексты, набранные практически любыми шрифтами.
  • Программа также позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры мобильного телефона. Дополнительные настройки предобработки изображений позволяют существенно улучшить качество изображений и получить более качественные результаты распознавания.
  • Программа эффективно использует несколько ядер компьютера, чтобы обеспечить максимальную скорость обработки. Кроме того, возможна быстрая обработка в специальном черно-белом режиме.

Поддержка большинства мировых языков*

  • ABBYY FineReader распознает документы, написанные на одном или нескольких из 190 языков, включая арабский, вьетнамский, корейский, китайский, японский, тайский и иврит. В программу встроена функция автоматического определения языка документа.

Проверка результатов распознавания

  • С помощью встроенного в программу редактора текста ABBYY FineReader позволяет сравнить в одном окне исходный документ и распознанную копию. Расширенные функции по редактированию позволяют корректировать форматирование документа.
  • Кроме того, пользователь может вручную задать области для распознавания или научить программу распознаванию специфических шрифтов.

Простой и понятный интерфейс

  • Встроенные задачи программы охватывают список наиболее часто используемых задач по конвертированию отсканированных документов, PDF и файлов изображений в редактируемые форматы и позволяют получить электронный документ одним нажатием кнопки. Благодаря интеграции ABBYY FineReader с Microsoft Office и Проводником Windows, вы можете распознать документ непосредственно при работе с Microsoft Outlook, Microsoft Word, Microsoft Excel и Проводником Windows.
  • В программе поддерживаются привычные для Windows  комбинации горячих клавиш, типичные движения для сенсорных экранов, например прокрутка или изменение масштаба.

Быстрое цитирование

  • Программа позволяет быстро копировать фрагменты отсканированных документов в другие приложения. Изображения страниц открываются мгновенно и доступны для просмотра, выделения, копирования текста, таблиц  или изображений еще до завершения распознавания всего документа.

Распознавание сфотографированных документов

  • При наличии цифровой камеры, вы можете сфотографировать документы в любом месте и в любое время и позднее распознать их с помощью ABBYY FineReader 12.

Создание PDF-архивов

  • Программа позволяет преобразовывать бумажные документы или отсканированные PDF-файлы в форматы PDF и PDF/А с возможностью поиска.
  • Можно уменьшить размер получившегося PDF-документа, применив к нему MRC-сжатие. Это позволить эффективно использовать дисковое пространство компьютера для архивного хранения документов.

Сохранение документов в различных форматах, а также отправка в облачные хранилища

  • ABBYY FineReader 12 позволяет сохранять распознанные изображения документов и PDF-файлов как в форматы Microsoft Office (Word, Excel, PowerPoint), так и в PDF/A и PDF  с возможностью поиска для долгосрочного архивирования, популярные форматы электронных книг и др.
  • При этом, теперь результаты распознавания можно сохранить не только на локальном компьютере, но и в облачном  хранилище (Google Drive, Dropbox, SkyDrive), чтобы получить к ним доступ с любого устройства. Также, поддерживается экспорт напрямую в MS SharePoint Online и Microsoft Office 365.

Бонусные приложения: ABBYY Business Card Reader и ABBYY Screenshot Reader

  • ABBYY Business Card Reader (доступно только в FineReader 12 Corporate) – удобная программа, которая с высокой точностью распознает данные с визиток и переносит их сразу в Microsoft® Outlook®, Salesforce и другие системы управления контактами.
  • ABBYY Screenshot Reader – простая и удобная программа для создания снимков любой области экрана. Она поможет сохранить изображение всего экрана, окна приложения или выделенной вручную области. При необходимости программа распознает текст с выбранной области экрана и сохранит его в редактируемый формат.

Бесплатная техническая поддержка для зарегистрированных пользователей

* Набор языков распознавания может отличаться в разных версиях продукта.

11/2/2018 5:31:21 PM

help.abbyy.com

Как пользоваться программой ABBYY FineReader

Один из популярнейших функционалов по работе со сканированием и обработкой файлов различного типа — Файн Ридер. Функционал программного продукта был разработан российской компанией ABBYY, он позволяет не только распознавать, но и обрабатывать документы (переводить, менять форматы и другое). Многие пользователи могут только установить, а как пользоваться ABBYY FineReader, сразу разобраться не могут. На многие вопросы вы сможете найти ответы в этой статье.

Программа позволяет сканировать и распознавать текст — и не только

Что представляет собой приложение от ABBYY?

Чтобы подробно разобраться, что это за программа ABBYY FineReader 12, необходимо подробно рассмотреть все её возможности. Первой и самой простой функцией является сканирование документа. Существует два варианта сканирования: с распознаванием и без него. В случае обычного сканирования печатного листа вы получите изображение, которое сканировали в указанной папке на вашем компьютерном устройстве.

ВНИМАНИЕ. Лист нужно класть на сканирующую часть принтера ровно, по указанным на принтере контурам. Не допускайте заламывания исходника, это может привести к плохому качеству итогового скана.

Поместите документ в сканер для того, чтобы перевести его в электронный вид

Вы должны самостоятельно решить, для чего нужен FineReader именно вам, так как утилита имеет значительный функционал, например, вы можете самостоятельно выбрать в каком цвете хотите получить изображение, есть возможность перевести все фото в чёрно-белый. В чёрно-белом цвете распознавание происходит быстрее, качество обработки возрастает.

Если же вас интересует функция распознавания текста ABBYY FineReader, перед сканированием вам нужно нажать специальную кнопку. В этом случае есть несколько вариантов получения информации. Стандартно на ваш экран выведется распознанный кусок листа, который вы сможете скопировать или отредактировать вручную.

Если вы выберите другие функции, то сможете сразу получить файл Word-документом или Excel-таблицей. Выбирать функции очень просто, меню интуитивно понятно, легко настраивается благодаря тому, что все нужные вам кнопки перед глазами.

ВАЖНО. Перед тем как распознать текст ABBYY FineReader, вам необходимо точно подобрать язык обработки. Несмотря на то, что утилита работает полностью автоматически, бывает, что низкое качество исходника не позволяет понять, что за язык был в исходнике. Это сильно снижает качество итоговых результатов работы приложения.

Чтобы полностью разобраться, как пользоваться ABBYY FineReader 12, необходимо попробовать два режима работы «Тщательный» и «Быстрое распознавание». Второй режим подходит для высококачественных изображений, а первый — для низкокачественных файлов. Режим «Тщательный» в 3–5 раз дольше обрабатывает файлы.

На иллюстрации показан результат работы программы — распознавание текста с изображения

Какие ещё есть функции?

Распознавание текста в программе ABBYY FineReader не единственная полезная функция. Для большего удобства пользователей имеется возможность переводить документ в необходимые пользователю форматы (pdf, doc, xls и др.).

Изменение текста

Чтобы понять, как в Файн Ридере изменить текст, пользователю необходимо открыть вкладку «Сервис» — «Проверка». После этого откроется окно, которое позволит редактировать шрифт, менять символы, цвета и др. Если вы редактируете изображение, то стоит открыть «Редактор изображений», он практически полностью соответствует простой рисовалке Paint, но сделать минимальные правки позволит.

ВНИМАНИЕ. Если вы так и не смогли разобраться, как продуктивно пользоваться ABBYY FineReader, вы можете прочесть раздел «Помощь», который можно найти в окне приложения, во вкладке «О программе».

Теперь вы знаете, для каких целей служит программа FineReader, и сможете правильно её применять у себя дома или в офисе. Функционал приложения огромен, воспользуйтесь им и вы сможете убедиться в незаменимости этого программного продукта при обработке документов и файлов во время офисной работы.

nastroyvse.ru

Как это работает: FineReader

Хотя авансы, выданные искусственному интеллекту (ИИ) за последние 50 лет, ни на йоту не приблизили «умные» машины к когнитивным возможностям человека, полностью отрицать успехи в данном направлении было бы несправедливо. Наиболее очевидный и яркий пример — шахматы (не говоря уже о более простых играх). Компьютер пока не может имитировать наше мышление, но он вполне способен компенсировать данный пробел большим объемом специализированной памяти и скоростью перебора. Владимир Крамник охарактеризовал игру победившей его в 2006 г. программы Deep Fritz как «нечеловеческую» в том смысле, что она зачастую противоречила устоявшимся (человеческим) правилам стратегии и тактики.

А чуть более года назад очередное детище IBM, в свое время положившей начало триумфальным шахматным победам компьютеров (знаменитый Deep Blue), под названием Watson совершило новый прорыв, с большим отрывом победив сразу двух чемпионов популярной американской викторины Jeopardy. Показательно, однако, что хотя Watson самостоятельно озвучивал ответы, вопросы ему все же передавались в текстовом виде. Это говорит о том, что успехи во многих сферах приложения ИИ — распознавании речи и образов, машинном переводе — достаточно скромны, хотя это и не мешает нам уже сегодня применять их на практике. Наибольшие же успехи, пожалуй, демонстрируют системы оптического распознавания символов (OCR, Optical Character Recognition), с которыми наверняка так или иначе знакомы почти все пользователи ПК. Тем более, что российские разработки в данной области занимают достойное место в мире — я имею в виду ABBYY FineReader.

Немного истории

Текущая версия ABBYY FineReader имеет номер 11, т. е. приложение прошло достаточно долгий путь развития, и даже история этого процесса представляет определенный интерес. Не претендуя на исчерпывающую летопись, приведу лишь основные вехи за последнее десятилетие, в течение которого я более-менее следил за FineReader:

ГодВерсияГлавные особенности
20037.0Прирост точности распознавания до 25%. Больше всего это отразилось на таблицах, особенно сложных, с окрашенными ячейками, скрытыми разделителями и пр.
20058.0Дальнейшая оптимизация алгоритмов распознавания, в первую очередь направленная на работу не со сканами документов, а с цифровыми фотографиями. Для этого появились дополнительные функции подготовки оригиналов (устранение искажений, выравнивание строк и пр.).
20079.0Появление технологии ADRT, которая учитывает логическую структуру всего обрабатываемого (многостраничного) документа и умеет выделять повторяющиеся элементы (колонтитулы), соединять «перетекающие» объекты (таблицы) и пр.
200910.0Дальнейшее совершенствование ADRT и алгоритмов распознавания, повышение точности обработки оригиналов с низким разрешением до 30%.
201111.0Основное внимание уделено скорости работы программы. «Второе пришествие» черно-белого режима, который на оригиналах хорошего качества дает дополнительное ускорение до 30%.

Естественно, за это же время в FineReader расширялась поддержка форматов документов, совершенствовались встроенные инструменты и интерфейс, улучшалось воссоздание структуры оригиналов и т. п. Однако выделенные моменты непосредственно связаны с технологиями OCR и неплохо демонстрируют скачкообразный процесс развития, характерный для сложных наукоемких систем, когда после очередного «прорыва» следует некоторый период «затишья», необходимый для совершенствования новых алгоритмов. Они-то и представляют главную ценность любой OCR-программы, и поэтому сколько-нибудь подробная информация о них крайне редко доходит до пользователей. Однако компания ABBYY любезно согласилась приоткрыть завесу тайны, и сегодня мы имеем возможность заглянуть в святая святых FineReader.

Базовые принципы

Итак, поскольку OCR относится к области ИИ, вполне логично, что разработчики стремятся хоть в какой-то степени имитировать деятельность нашего мозга. Конечно, устройство нашей зрительной системы невероятно сложно, но базовые «крупноблочные» принципы ее функционирования достаточно изучены, обычно их выделяют три:

  1. Целостность (integrity) — объект рассматривается как совокупность своих частей и (для зрительных образов) пространственных отношений между ними. В свою очередь и части получают толкования только в составе всего объекта. Этот принцип помогает строить и уточнять гипотезы, быстро отсекая маловероятные.
  2. Целенаправленность (purposefulness) — поскольку любая интерпретация данных преследует определенную цель, то и распознавание представляет собой процесс выдвижения гипотез об объекте и целенаправленной их проверки. Система, действующая в соответствии с этим принципом, будет не только экономнее расходовать вычислительные мощности, но и реже ошибаться.
  3. Адаптивность (adaptability) — система сохраняет накопленную в процессе работы информацию и использует ее повторно, т. е. самообучается. Этот принцип позволяет создавать и накапливать новые знания и избегать повторного решения одних и тех же задач.

FineReader — единственная в мире OCR-система, которая действует в соответствии с вышеописанными принципами на всех этапах обработки документа. Соответствующая технология носит название IPA — по первым буквам английских терминов. К примеру, согласно принципу целостности, фрагмент изображения будет интерпретироваться как символ, только если в нем присутствуют все структурные части подобных объектов, причем находящиеся в определенных взаимоотношениях. Это помогает заменить перебор большого числа эталонов (в поисках более-менее подходящего) целенаправленной проверкой разумного количества гипотез, причем опираясь на накопленные ранее сведения о возможных начертаниях символа в распознаваемом документе.

Однако принципы IPA применяются при анализе не только фрагментов, соответствующих (предположительно) отдельным символам, но и всего исходного изображения страницы. Большинство OCR-систем основываются на распознавании иерархической структуры документа, т. е. страница разбивается на основные структурные элементы, такие как таблицы, изображения, блоки текста, которые, в свою очередь, разделяются на другие характерные объекты — ячейки, абзацы — и так далее, вплоть до отдельных символов.

Такой анализ может проводиться двумя основными способами: сверху-вниз, т. е. от составных элементов к отдельным символам, или, наоборот, снизу-вверх. Чаще всего применяется один из них, но в ABBYY разработали специальный алгоритм MDA (multilevel document analysis, многоуровневый анализ документа), который сочетает оба. Вкратце он выглядит следующим образом: структура страницы анализируется методом сверху-вниз, а воссоздание электронного документа по окончании распознавания происходит снизу-вверх, однако на всех уровнях дополнительно действует механизм обратной связи. В результате резко снижается вероятность грубых ошибок, связанных с неверным распознаванием высокоуровневых объектов.

ADRT

Исторически OCR-системы развивались от распознавания отдельных символов. Эта задача и до сих пор является важнейшей и самой трудной, именно с ней связаны наиболее сложные алгоритмы. Однако вскоре стало понятно, что в ее решении может помочь более высокоуровневая информация (к примеру, о языке документа и правильности написания распознанных слов) — так появились контекстная и словарная проверки. Затем стремление сохранять форматирование и воссоздавать физическую структуру (т. е. взаимное расположение различных объектов) документа привело к необходимости подробного анализа целой страницы. Понятно, что это также заметно влияет на общее качество распознавания, поскольку помогает корректно обрабатывать многоколоночную верстку, таблицы и другие приемы «нелинейного» расположения текста.

Большинство современных OCR действуют именно на этих трех уровнях — символов, слов, страниц, — практикуя, как уже было сказано, подходы сверху-вниз или снизу-вверх. Однако ABBYY, в соответствии с принципами IPA, ввела в FineReader еще один уровень — всего многостраничного документа. Прежде всего это понадобилось для корректного воспроизведения логической структуры, которая в современных документах становится все сложнее. Но есть и дополнительные бонусы: повышение точности и ускорение обработки повторяющихся объектов, более корректная идентификация (а значит, и распознавание) «перетекающих» со страницы на страницу объектов.

Именно для этого и была разработана ADRT (Adaptive Document Recognition Technology) — технология анализа и синтеза документа на логическом уровне. В конечном итоге она помогает сделать результат работы FineReader максимально похожим на оригинал. Для этого анализируется изображение всего документа, а распознанные слова объединяются в группы (кластеры) в зависимости от начертания, окружения и местоположения на странице. Таким образом программа как бы видит «логику» разметки документа и в дальнейшем может унифицировать оформление результата.

Благодаря ADRT, FineReader, начиная с версии 9.0, научился обнаруживать, распознавать и воспроизводить следующие структурные части и элементы форматирования документа:

  • основной текст;
  • верхние и нижние колонтитулы;
  • номера страниц;
  • заголовки одного уровня;
  • оглавление;
  • текстовые вставки;
  • подписи к рисункам;
  • таблицы;
  • сноски;
  • зоны подписи/печати;
  • шрифты и стили.

Процесс распознавания

В соответствии с алгоритмом MDA, собственно распознавание начинается сверху-вниз, с уровня страницы. Понятно, что чем больше неверных решений будет сделано на ранних этапах этого процесса, тем больше будет на следующих. Именно поэтому точность распознавания так сильно зависит от качества оригиналов, но и алгоритмы их предварительной обработки могут иметь существенное значение. Так, по мере роста популярности цветных документов в FineReader появилась процедура адаптивной бинаризации (adaptive binarization, AB). Если отсканировать сразу в черно-белом режиме документ, где присутствуют водяные знаки либо текст расположен на текстурной или цветной подложке, то на изображении неизменно появится «мусор», который затем будет довольно сложно отделить от «полезного» изображения (т. к. исходная информация о нем уже потеряна). Именно поэтому FineReader предпочитает работать с цветными или полутоновыми изображениями, самостоятельно преобразуя их в черно-белые (этот процесс и называется бинаризацией). Но и это не всё. Поскольку цвета текста и фона могут различаться в пределах страницы и даже отдельных строк, AB выделяет слова с более-менее одинаковыми характеристиками и подбирает для каждого оптимальные с точки зрения качества распознавания параметры бинаризации. Именно в этом и состоит адаптивность алгоритма, который, таким образом, является примером использования обратной связи в MDA. Понятно, что эффективность AB сильно зависит от оформления исходных документов — на тестовой базе ABBYY этот алгоритм обеспечил повышение точности распознавания на 14,5%.

Но наиболее интересное, конечно, начинается, когда процесс распознавания опускается на самые нижние уровни. Так называемая процедура линейного деления разбивает строки на слова, а слова на отдельные буквы; далее, в соответствии с принципом IPA, формирует набор гипотез (т. е. возможных вариантов того, что́ это за символ, на какие символы разбито слово и т. д.) и, снабдив каждую оценкой вероятности, передает на вход механизма распознавания символов. Последний состоит из ряда так называемых классификаторов, каждый из которых также формирует ряд гипотез, ранжированных по предполагаемой степени вероятности. Важнейшей характеристикой любого классификатора является среднее положение правильной гипотезы. Понятно, что чем выше она находится, тем меньше работы для последующих алгоритмов — к примеру, словарной проверки. Но для достаточно отлаженных классификаторов чаще всего оценивают такие характеристики, как точность распознавания по первым трем гипотезам или только по первой — т. е., грубо говоря, способность угадать верный ответ с трех или с одной попытки. ABBYY в своих системах применяет следующие типы классификаторов: растровый, признаковый, признаковый дифференциальный, контурный, структурный и структурный дифференциальный — которые сгруппированы на двух логических уровнях.

Принцип действия РК, или растрового классификатора, основан на попиксельном сравнении изображения символа с эталонами. Последние формируются в результате усреднения изображений из обучающей выборки и приводятся к некой стандартной форме; соответственно, для распознаваемого изображения также предварительно нормализуются размер, толщина элементов, наклон. Этот классификатор отличается простотой реализации, скоростью работы и устойчивостью к дефектам изображений, но обеспечивает сравнительно низкую точность и именно поэтому используется на первом этапе — для быстрого порождения списка гипотез.

Признаковый классификатор (ПК), как и следует из его названия, основывается на наличии в изображении признаков того или иного символа. Если всего таких признаков N, то каждую гипотезу можно представить точкой в N-мерном пространстве; соответственно, точность гипотезы будет оцениваться расстоянием от нее до точки, соответствующей эталону (который также нарабатывается на обучающей выборке). Понятно, что типы и количество признаков в значительной степени определяют качество распознавания, поэтому обычно их достаточно много. Этот классификатор также сравнительно быстр и прост, но не слишком устойчив к различным дефектам изображения. Кроме того, ПК оперирует не исходным изображением, а некой моделью, абстракцией, т. е. не учитывает часть информации: скажем, сам факт наличия каких-то важных элементов ничего не говорит об их взаимном расположении. По этой причине ПК используется не вместо, а вместе с РК.

Контурный классификатор (КК) представляет собой частный случай ПК и отличается тем, что анализирует контуры предполагаемого символа, выделенные из исходного изображения. В общем случае его точность ниже, чем у полновесного ПК.

Признаковый дифференциальный классификатор (ПДК) также похож на ПК, однако используется исключительно для различения похожих друг на друга объектов, таких как «m» и «rn». Соответственно, он анализирует только те области, где скрываются отличия, а на вход ему подаются не только исходные изображения, но и гипотезы, сформированные на ранних стадиях распознавания. Принцип его работы, однако, несколько отличается от ПК. На этапе обучения в N-мерном пространстве формируются два «облака» (групп точек) возможных значений для каждого из двух вариантов, затем строится гиперплоскость, отделяющая «облака» друг от друга и примерно равноудаленная от них. Результат распознавания зависит от того, в какое полупространство попадает точка, соответствующая исходному изображению.

Сам по себе ПДК не выдвигает гипотез, а лишь уточняет имеющиеся (список которых в общем случае сортируется пузырьковым методом), так что прямая оценка его эффективности не проводится, а косвенно ее приравнивают к характеристикам всего первого уровня OCR-распознавания. Однако понятно, что она зависит от корректности подобранных признаков и представительности выборки эталонов, обеспечение чего является достаточно трудоемкой задачей.

Структурно-дифференциальный классификатор (СДК) первоначально применялся для обработки рукописных текстов. Его задача состоит в различении таких похожих объектов, как «C» и «G». Таким образом, СДК основывается на признаках, характерных для каждой пары символов, процесс его обучения еще сложнее, чем у ПДК, а скорость работы ниже, чем у всех предыдущих классификаторов.

Структурный классификатор (СК) является предметом гордости компании ABBYY, первоначально он был разработан для распознавания так называемого рукопечатного текста, т. е. когда человек пишет «печатными» буквами, но впоследствии был применен и для печатного. Он используется на завершающих этапах распознавания и вступает в действие достаточно редко, а именно, только в том случае, когда до него доходят как минимум две гипотезы с достаточно высокими вероятностями.

Качественные характеристики всех классификаторов собраны в следующую таблицу. Они, впрочем, позволяют лишь оценить эффективность алгоритмов друг относительно друга, т. к. не являются абсолютными, а получены на основе обработки конкретной тестовой выборки. Может создаться впечатление, что на последних этапах распознавания борьба идет буквально за доли процента, но на самом деле каждый классификатор вносит существенную лепту в повышение точности распознавания — так, к примеру, СК снижает количество ошибок на ощутимые 20%.

 РКПКККПДК*СДК**СК**
Точность по первым трем вариантам, %99,2999,8199,3099,8799,88
Точность по первому варианту, %97,5799,1395,1099,2699,6999,73

* оценка всего первого уровня OCR-алгоритма ABBYY** оценка для всего алгоритма после добавления соответствующего классификатора

Любопытно, однако, что, несмотря на довольно высокую точность, алгоритм собственно распознавания не принимает окончательного решения. В соответствии с принципом MDA, гипотезы выдвигаются на каждом логическом уровне, и число их может расти в геометрической прогрессии. Соответственно, последовательная проверка всех гипотез вряд ли окажется эффективной, и потому в OCR-системах ABBYY применяется метод структурирования гипотез, т. е. отнесения их к тем или иным моделям. Последних существует пара десятков, вот только несколько их типов: словарное слово, несловарное слово, арабские цифры, римские цифры, URL, регулярное выражение — а в каждый может входить множество конкретных моделей (к примеру, слово на одном из известных языков, латиницей, кириллицей и т. д.).

Все финальные действия выполняются уже именно с гипотезами, построенными по моделям. К примеру, контекстная проверка определит язык документа и сразу же существенно понизит вероятность моделей с использованием неправильных алфавитов, а словарная компенсирует погрешности при неуверенном распознавании некоторых символов: так, слово «turn» присутствует в словаре английского языка — в отличие от «tum» (во всяком случае, оно отсутствует среди популярных). Хотя приоритет словаря выше, чем у любого классификатора, он не обязательно является последней инстанцией, и в общем случае не останавливает дальнейшие проверки: во-первых, как говорилось выше, имеется модель несловарного слова, во-вторых, специальная организация словарей позволяет с высокой долей вероятности предположить, может ли какое-то неизвестное слово относиться к тому или иному языку. Тем не менее, словарная проверка (и полнота словарей) оказывает существенное влияние на результат распознавания, и в тестах самой ABBYY сокращает количество ошибок практически вдвое.

Не только OCR

Печатные документы — далеко не единственные, представляющие интерес с точки зрения их оцифровки и автоматической обработки. Довольно часто приходится работать с формами, т. е. документами с предопределенными и фиксированными полями, которые заполняются вручную, но сравнительно аккуратно (так называемыми рукопечатными символами) — примером могут служить различные анкеты. Технология их обработки имеет отдельное название — ICR (intelligent character recognition) — и достаточно существенно отличается от OCR. Так, поскольку в данном случае задача состоит не в воссоздании всего документа, а в извлечении из него конкретных данных, то она распадается на две основные подзадачи: нахождение нужных полей и собственно распознавание их содержимого.

Это достаточно специфическая область, и ABBYY предлагает для нее совершенно отдельный программный продукт ABBYY FlexiCapture. Он предназначен для создания автоматизированных и полуавтоматизированных систем, предполагает настройку на конкретные типы документов, для которых создаются специальные шаблоны, умеет интеллектуально находить на страницах различные поля и верифицировать данные в них и т. д. Однако в самой основе лежат алгоритмы распознавания символов, аналогичные тем, что применяются в FineReader, да и общая схема весьма похожа:

Впрочем, важное отличие все же имеется: структурный классификатор является обязательным участником процесса — это связано со спецификой рукопечатных символов. Кроме того, ICR предполагает большое число специфических дополнительных проверок: например, не является ли символ зачеркнутым, или действительно ли распознанные символы формируют дату.

www.ixbt.com

Как работает ABBYY FineReader

ABBYY FineReader очень полезное программное обеспечение как для офиса, так и для дома. С его помощью можно сканировать абсолютно любые документы и сохранять в любом формате на выбор. Подобных аналогов, достойных тягаться с данным приложением, пока нет, поэтому уметь пользоваться им должен каждый.

Учитывая то, что большинство пользователей плохо знаю функционал данной программы, или вовсе не умеют ей пользоваться, в данной статье разберем работу в данной программе от начала до конца.

Как работать в ABBYY FineReader

Для того, чтобы уметь грамотно работать с данной программой, необходимо понимать ее функционал. Программа снимает сканы с документов, с последующей возможность распечатки текста, редактирования, записи, сохранения.  Приложение имеет актуальную версию 14, которая особо ничего не отличается от предыдущей версии.

Программное обеспечение имеет довольно неплохой функционал, и способно работать с огромным списком различных языков. Кроме этого, при помощи программы можно перевести напечатанный текст, или сохранить информацию в заданный пользователем формат.

Работу с FineReader следует начать со скачивания с официального сайта, и установкой на компьютер. С этого, в данной статье, и начнем.

Как установить

Следует начать с того, что эксплуатация данной программы платное, и перед установкой необходимо купить ключ на использование данной программы. Без него установить приложение не получится. Годовая лицензия стоит порядка 15 000 рублей.

После того, как лицензия куплена, необходимо перейти на сайт разработчика и скачать актуальную версию программного обеспечения. После скачивания запускаем файл setup и производим установку по указанным параметрам. От пользователя потребуется только указать используемый язык, и указать расположение файла. Остальное программа сделает автоматически.

Скачивать и устанавливать файл настоятельно рекомендуется только с официального сайта производителя. Программное обеспечение эксплуатируется на платной основе, при довольно высокой стоимость годовой подписки. В связи с этим, в интернете много мошенников, кто хочет наживиться на данной программе.

После полной установки программы, для дальнейшего использования необходимо ее запустить. Для этого нужно выполнить ряд следующих операций:

  • Найти на рабочем столе ярлык от приложения, и щелкнуть мышкой по нему 2 раза;
  • Дождаться открытия окна программы, и произвести тестовое сканирование;
  • Полноценно использовать программу.

Кроме запуска через рабочий стол, запустить приложение можно другими способами:

  • Через меню пуск. Для этого нужно открыть меню пуск, и среди списка программ отыскать FineReader, и запустить через найденный ярлык.
  • Через проводник. Найти в корне располагающийся файл и запустить при помощи ABBYY FineReader;
  • Через Офис. Выбрать значок FineReader на инструментальной панели.

Как настроить программу

После запуска программы, необходимо его полностью настроить. Для этого, необходимо найти «сервис», и щелкнуть по блоку настроек. В открывшемся окне можно задать необходимые параметры.

Здесь можно настроить параметры самого документа, параметры сканирования, распознавания, сохранения и общего вида документа.

Программа имеет очень обширный функционал и целую массу настроек использования. Для грамотного и профессионального обращения, необходимо потрать немного времени на обучение работы с программой. Приложение довольно сложное, и не сразу можно понять его работоспособность, касательно сложных объектов и ситуаций.

Полученные сканы можно сохранять практически во все форматы. Программа имеет отличную совместимость в использовании файлов, и поддерживает все форматы, отсюда и преобразовывает во все форматы.

Программа является незаменимой в качестве распознавания текста. Начать распознавание можно сделав несложные подготовительные действия:

  • Заранее отсканировать документ, необходимый для распознавания;
  • Сохранить отсканированный файл на компьютер;
  • Открыть саму программу FineReader;
  • Выбрать параметр «Новое задание», которое располагается в верхнем левом углу;
  • В открывшемся окне выбрать нужный формат для выходного текста, а с ним и задачу распознавания;
  • Запустить процесс распознавания.

Режим распознания также можно дополнительно настроить во вкладке «Сервис», где можно выбрать тщательное или быстрое распознание. Тщательное отвечает за детальную считку с исходного документа, но данный процесс занимает намного больше времени.

Как переводить текст

Кроме распознавания, программа является отличным переводчиком текста. Часто данную программу используют как сканирование – распознавание – перевод. Именно из-за этого она и является сильным лидером в данной области, так как нет ни одного другого приложения, которое было бы способно выполнять такие же операции.

Для перевода документа в новый формат, необходимо перед началом операции указать формат конвертации текстового документа. На выходе можно получить абсолютно любой документ, который пользователь только пожелает: Word, Excel, PDF.

Как изменить текст

При сканировании могут возникать такие случаи, когда выходной текст местами непонятен, из-за ошибок или пропущенных букв. Такое возможно при плохом состоянии исходного документа, или при неправильно произведенном сканировании документа.

В таких ситуациях необходимо вручную править документ, чтобы не переделывать все с самого начала. Для редактирования, разработчиками были придуманы 2 способа изменения текста.  Первый – сразу после обработки текста, в этом же окне. Необходимо тыкнуть мышкой в нужную область текста, и поправить недочеты и ошибки.

Второй вариант изменения полученного текста через параметр «Сервис». Необходимо выбрать его, и в появившемся окне выбрать «Проверка».  В результате, перед пользователем появляется новое окно с текстом, которое можно править самостоятельно, и после сохранить в нужный файл и место.

Заключение

Данная программа является очень полезной и нужной в сфере работы с документами. Без нее приходится крайне тяжело тем, кто не умеет ей пользоваться, или не может позволить себе дорогую лицензию.

ABBYY FineReader обладает уникальным функционалом, и способен, за считанное время, производить проверки всего текста, распознавать и конвертировать документ.  При работе с более старыми версиями не стоит пугаться, так как в функционале программы меняется совсем немного, и версии почти ничем не отличаются.

ctrlalt.ru

Система оптического распознавания «abbyy FineReader».

1 Назначение

ABBYY FineReader – это система оптического распознавания текстов (Optical Character Recognition, OCR). Она предназначена для того, чтобы быстро перевести отсканированные бумажные документы, а также PDF–файлы в удобный для дальнейшего использования электронный формат – файл Word или Excel, HTML–страничку, презентацию PowerPoint или в любой другой из поддерживаемых форматов, при этом полностью сохранив оформление документа. FineReader удовлетворяет самым высоким требованиям профессиональных пользователей благодаря большому количеству различных опций и настроек.

2 Установка и запуск

Для установки FineReader используется специальная программа установки, входящая в состав дистрибутива. Всегда производите установку, используя CD–Rom только из дистрибутива, который Вы получили при покупке.

Установка программы FineReader

Программа установки поможет Вам установить ABBYY FineReader. Перед началом установки рекомендуется закрыть все другие приложения. Чтобы установить ABBYY FineReader:

1. Вставьте компакт–диск в дисковод для компакт–дисков. Программа установки запустится автоматически.

2. Следуйте инструкциям программы установки. В случае если программа установки не запустилась автоматически:

1. Нажмите кнопку Пуск на Панели Задач и выберите пункт Настройка/Панель управления.

2. Дважды нажмите на значок Установка и удаление программ.

3. Выберите закладку Установка и удаление и нажмите кнопку Установить...

4. Далее следуйте инструкциям программы установки.

В процессе установки программы FineReader Вам будет предложено выбрать одну из предложенных опций установки:

_ Обычная (рекомендуется) – устанавливаются все компоненты дистрибутива, в том числе все языки распознавания, язык интерфейса (один) – выбранный при установке.

_ Установка компонентов дистрибутива по выбору – из предложенного набора компонентов, входящих в дистрибутив, Вы можете выбрать только те, которые нужны Вам (в том числе доступные языки распознавания).

Внимание! Если Вы хотите применять пользовательские словари и эталоны из предыдущей версии программы, не деинсталлируйте ее до инсталляции новой версии. Установив новую версию, Вы сможете применять эталоны и словари предыдущей версии.

Для людей с низким уровнем интеллекта.

Как ввести документ за минуту

1. Включите сканер (если он имеет отдельный от компьютера источник питания).

Внимание! Многие модели сканера необходимо включать до включения компьютера.

2. Включите компьютер и запустите FineReader (Пуск/Программы/ABBYY FineReader 7.0 Professional Edition или Corporate Edition). Перед Вами откроется Главное окно программы FineReader.

3. Вставьте в сканер страницу, которую Вы хотите распознать.

4. Нажмите на стрелку справа от кнопки Scan&Read, в открывшемся локальном меню выберите пункт Мастер Scan&Read.

Мастер Scan&Read вызывает специальный режим, при котором Вы можете отсканировать и распознать страницу или открыть и распознать графическое изображение (пример графического файла Вы можете найти в папке Demo. Она находится в папке, куда Вы установили FineReader). При этом каждый шаг сопровождается подсказками системы.

5. Далее следуйте указаниям Мастера Scan&Read.

Процесс ввода документов в компьютер состоит из четырех этапов: сканирование, распознавание, проверка и сохранение результатов распознавания. В результате сканирования появится окно Изображение, содержащее “фотографию” страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются голубым цветом.

Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диск, либо продолжить обработку следующих изображений.

Главное окно программы FineReader

Работая с программой FineReader, пользователь всегда имеет дело с некоторым пакетом.

Пакет – это папка, в которой хранятся изображения и рабочие файлы программы. Каждое отсканированное изображение записывается как отдельная страница пакета. При запуске программы FineReader по умолчанию открывается новый пакет. Вы можете продолжить работу с новым пакетом или же открыть уже существующий пакет. Вы можете продолжить работу с пакетом по умолчанию или создать новый пакет. Более подробно о работе с пакетом см. Общие сведения по работе с пакетом.

Вверху Главного окна FineReader находится меню системы, под ним – инструментальные панели. В программе их четыре: Стандартная, Форматирование, Изображение и Scan&Read.

Спрятать или показать инструментальные панели на экране можно через меню Вид (пункт Панели инструментов) или через локальное меню. Чтобы открыть локальное меню, щелкните правой кнопкой мыши на одной из инструментальных панелей. Панели, которые видны на экране, отмечены галочкой. Выберите панель, которую Вы хотите спрятать или, наоборот, показать.

Чтобы выбрать вид окна Пакет:

_ Нажмите на соответствующую кнопку ( / ) на панели инструментов Стандартная, или

_ Нажмите правой кнопкой мыши на окне Пакет и выберите в локальном меню пункт Вид>...

Внизу окна расположена информационная панель (еще ее называют строкой состояния), где Вы можете получить сведения о состоянии системы и производимых ею операциях, а также краткую справку о выбираемых Вами пунктах меню и кнопках. Остальное пространство Главного окна занимают по мере своего появления рабочие окна системы: Пакет, Изображение, Крупный план и Текст.

Окна Изображение, Крупный план и Текст связаны между собой: при двойном щелчке на изображении в окне Изображение курсор в окнах Крупный план и Текст (при наличии распознанного текста) переместится на ту же позицию, что и в окне Изображение.

Используется при редактировании большого количества страниц пакета.

Окно Пакет сверху; тип отображения страниц пакета: Вид со свойствами; Окна Текст и Крупный план.

Используется при большом количестве страниц пакета.

Окно Пакет сверху; тип отображения страниц пакета:

Вид со свойствами; Окна Изображение, Текст и Крупный план.

Используется при малом количестве страниц пакета.

Окно Пакет слева; тип отображения страниц пакета:

Пиктограммы; Окна Изображение, Текст и Крупный план Применение: Вариант расположения окон:

Возможности программы ABBYY FineReader

FineReader позволяет ввести документ одним нажатием на кнопку Scan&Read, не вдаваясь в подробности работы программы. Распознанный текст можно передать в текстовый редактор или электронную таблицу, сохранить в форматах RTF, DOC, Word XML (при сохранении в Microsoft Office 2003), PDF и HTML с полным сохранением оформления документа или сохранить в базе данных.

Для людей со среднем уровнем интеллекта.

Системы оптического распознавания символов (Optical Character Recognition – OCR) предназначены для автоматического ввода печатных документов в компьютер.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии “целостного целенаправленного адаптивного распознавания”.

Процесс ввода документа в компьютер можно подразделить на два этапа:

1. Сканирование. На первом этапе сканер играет роль “глаза” Вашего компьютера: “просматривает” изображение и передает его компьютеру. При этом полученное изображение является не чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно отредактировать ни в одном текстовом редакторе.

2. Распознавание. Обработка изображения OCR–системой. Остановимся на втором шаге более подробно. Обработка изображения системой FineReader включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.

Как уже упоминалось, распознавание изображения осуществляется на основе технологии “целостного целенаправленного адаптивного распознавания”.

_ Целостность – объект описывается как целое с помощью значимых элементов и отношений между ними.

_ Целенаправленность – распознавание строится как процесс выдвижения и целенаправленной проверки гипотез.

_ Адаптивность – способность OCR–системы к самообучению.

В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки.

Следуя принципу адаптивности, программа самостоятельно “настраивается”, используя положительный опыт, полученный на первых уверенно распознанных символах. Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к возможным дефектам письма. В результате работы в окне FineReader появится распознанный текст, который Вы можете отредактировать и сохранить в наиболее удобном для Вас формате.

Основные улучшения по сравнению с предыдущей версией:

_ Поддержка основных способов автоматической установки с сервера на рабочие станции. FineReader Corporate Edition поддерживает все основные способы автоматической установки в локальной сети: с помощью Active Directory, Microsoft Systems Management Server или с помощью командной строки.

_ Работа с многофункциональными устройствами, в том числе сетевыми. Многофункциональные устройства, совмещающие в себе функции сканера, принтера, копира и факса, становятся все более популярными. Теперь необязательно ставить каждому сотруднику свой сканер – достаточно одного мощного устройства, с которым работают все пользователи организации. FineReader умеет работать с такими устройствами, как подключенными к рабочей станции, так и сетевыми. Специальные настройки программы позволяют пользователю автоматически открывать и отсканированные изображения с любого места в локальной сети или с ftp сервера и распознавать их.

_ Различные модели корпоративного лицензирования. Кроме лицензирования по числу одновременного работающих пользователей, стали доступны также другие способы лицензирования. Вы сможете выбрать тот вариант, который в большей степени отвечает Вашим потребностям.

_ License Manager – средство управления лицензиями в сети. В FineReader Corporate Edition появилась удобная утилита управления лицензиями (Менеджер лицензий). С помощью нее осуществляется отслеживание использования FineReader на рабочих станциях, резервирование лицензий за рабочими станциями, добавление новых лицензий.

Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:

_ Microsoft Word Document (*.DOC)

_ Rich Text Format (*.RTF)

_ Microsoft Word XML Document (*.XML) (только для Microsoft Word 2003)

_ Adobe Acrobat Format (*.PDF)

_ HTML

_ Microsoft PowerPoint Format (*.PPT)

_ Comma Separated Values File (*.CSV)

_ Простой текст (*.TXT). FineReader поддерживает различные кодовые

страницы (Windows, DOS, Mac, ISO) и кодировку Unicode.

_ Microsoft Excel Speadsheet (*.XLS)

_ DBF

Сканирование

FineReader работает со сканерами через TWAIN–интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN–драйвер:

_ через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReader Настройки сканера;

_ через интерфейс TWAIN–драйвера сканера: для настройки опций сканирования используется диалог TWAIN–драйвера сканера.

Преимущества одного режима перед другим

В режиме Использовать интерфейс TWAIN–драйвера сканера, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалог TWAIN–драйвера сканера у каждого сканера выглядит по–своему, в большинстве случаев все надписи на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру.

В режиме Использовать интерфейс FineReader доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.

Вы можете легко переключаться между этими режимами:

_ на закладке Сканирование/Открытие диалога Опции (меню Сервис>Опции) установите переключатель в одно из положений: Использовать интерфейс TWAIN–драйвера сканера или Использовать интерфейс FineReader.

studfiles.net

Работа с программой FineReader

Все операции, необходимые в ходе преобразования бумажного документа в электронную форму, могут быть выполнены с помощью программы FineReader (рис. 17.2). Эта программа способна выполнять сканирование и распознавание текстов на разных языках, в том числе и смешанных двуязычных текстов. С ее помощью можно выполнять пакетную обработку многостраничных документов, а также настраивать режим распознавания для улучшения соответствия электронного документа бумажному оригиналу при плохом качестве последнего или использовании в нем шрифтов, далеких от стандартных.

Основные операции обработки бумажного документа в программе FineReader выполняются с помощью панели инструментов Scan&Read. С точки зрения этой программы, процесс обработки документа состоит из пяти этапов:

• сканирование документа (кнопка Сканировать);

• сегментация документа (кнопка Сегментировать);

• распознавание документа (кнопка Распознать);

• редактирование и проверка результата (кнопка Проверить); • сохранение документа (кнопка Сохранить).

Сканирование документа.На этапе сканирования производится получение изображений при помощи сканера и сохранение их в виде, удобном для последующей обработки. Чтобы начать сканирование, надо включить сканер и щелкнуть на кнопке Сканировать на панели инструментов Scan&Read. В программе FineReader сканирование может производиться как через драйвер TWAIN, так и в обход его. Первый способ используют, когда требуется точная настройка параметров сканирования, когда документ включает цветные иллюстрации, которые необходимо сохранить, а также когда разные страницы многостраничного документа сильно различаются по качеству. Второй вариант обеспечивает максимальную скорость и удобство сканирования. Выбор используемого варианта осуществляется при помощи флажка Показывать диалог TWAIN-драйвера сканера (Сервис > Опции > Сканирование).

Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких, как смена сканируемой страницы. Возможность вмешательства в работу программы заблокирована размещением на экране специального диалогового окна, уведомляющего о том, что идет сканирование, и позволяющего прервать это процесс.

По завершении сканирования значки всех обработанных страниц отображаются в окне Пакет. В основной части рабочей области появляется окно Изображение, содержащее изображение текущей страницы. Добавлять страницы в пакет можно не только путем сканирования, но и путем открытия файлов с изображениями, имеющихся на компьютере.

Сегментация документа.Второй этап работы — сегментация, разбиение страницы на блоки текста. Естественный порядок распознавания — по строкам, расположенным на странице сверху вниз и идущим от левого края до правого. Если страница содержит колонки, иллюстрации, врезки, подрисуночные подписи или таблицы, то порядок распознавания требует коррекции.

Рис. 17.2. Рабочее окно программы FineReader в процессе

распознавания отсканированного документа

Содержимое страницы разбивается на блоки, внутри каждого из которых распознавание осуществляется в естественном порядке. Блоки нумеруются, исходя из порядка включения их в документ. При автоматической сегментации (кнопка Сегментировать на панели инструментов Scan&Read) определение границ блоков осуществляется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.

Если структура страницы очень сложная, удобнее использовать ручную сегментацию или ручное редактирование результатов автоматической сегментации. Блоки отображаются в виде цветных прямоугольников с номером в левом верхнем углу. Новый блок создают протягиванием мыши по диагонали прямоугольника. Текущий блок помечается выделенной линией, а его углы — прямоугольными маркерами. С помощью этих маркеров можно изменить размер или положение блока.

Команды редактирования блоков выведены на панель Инструменты. Они позволяют:

• объединить два блока в один (Добавить часть блока);

• удалить фрагмент блока (Удалить часть блока);

• изменить положение блоков (Переместить блоки);

• изменить порядок нумерации блоков (Перенумеровать блоки);

• изменить разбиение таблицы на ячейки (Добавить вертикаль, Добавить горизонталь, Удалить линии);

Разные типы блоков обрабатываются программой по-разному. Чтобы изменить тип блока, надо щелкнуть правой кнопкой мыши в его пределах и назначить новый тип с помощью меню Тип блока в контекстном меню. Программа FineReader поддерживает следующие типы блоков:

• текстовый (Текст) — на этапе распознавания преобразуется в текст;

• табличный (Таблица) — представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;

• изображение (Картинка) — включается в документ без изменений как графическая иллюстрация, если формат сохранения преобразованного документа допускает вставные объекты;

• лишний (Нераспознаваемый) — игнорируется;

• содержащий штрих-код (Штрих-код) — распознается как штрих-код.

Распознавание текста. Процесс распознавания текста после сегментации начинается с щелчка на кнопке Распознать и полностью автоматизирован. В ходе процесса отображается диалоговое окно Распознавание, позволяющее прервать процесс. Кроме того, в этом окне отображаются сообщения, указывающие на наличие проблем при распознавании. Проблемы обычно вызываются неверными настройками или плохим качеством распознаваемого изображения. Если же дело в каких-то шрифтовых особенностях распознаваемого документа, применяют распознавание с обучением.

Распознавание с обучением. Распознавание с обучением состоит в формировании эталона, который используется в ходе распознавания в дальнейшем. Эталон настраивается так, чтобы соответствовать определенному документу или группе однотипных документов. Чтобы создать эталон, используют команду Сервис > Редактор эталонов > Новый эталон. После этого надо указать имя эталона и щелкнуть на кнопке ОК. Режим распознавания с обучением включается при настройке параметров работы программы (Сервис >Опции > Распознавание). На панели Обучение следует выбрать нужный эталон и установить флажок Распознавание с обучением.

Когда в ходе распознавания с обучением программа FineReader обнаруживает символ, который не может интерпретировать однозначно, на экран выдается диалоговое окно Ручное обучение эталона (рис. 17.3). Программа указывает элемент изображения, вызвавший сомнения, и показывает, как именно он будет интерпретирован. Если допущена ошибка, можно указать нужный символ в поле Символ или уточнить область распознавания с помощью кнопок Сдвинуть влево и Сдвинуть вправо.

Рис. 17.3. Ручное «обучение» механизма распознавания текста

Затем надо щелкнуть на кнопке Обучить. Необходимые сведения сохраняются и используются при дальнейшем анализе изображения. Если число ошибок невелико, можно продолжить распознавание в обычном режиме щелчком на кнопке Продолжать без обучения.

Редактирование документа. Когда распознавание данной страницы завершается, полученный текстовый документ отображается в окне Текст. Заключительные этапы работы позволяют отредактировать полученный текст с помощью средств, напоминающих текстовый редактор WordPad (панель для форматирования открывается при помощи команды Вид > Панели инструментов > Форматирование). Провести проверку орфографии с учетом трудностей распознавания позволяет кнопка Проверить на панели инструментов Scan&Read.

Сохранение документа. По щелчку на кнопке Сохранить на панели инструментов Scan&Read запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, в Microsoft Word) для последующей обработки.

Обработка бланков

Бланки, или формы, представляют собой особый род документов. Они используются как анкеты, бюллетени для голосования, опросные листы и состоят из постоянной части, содержащей информацию, используемую в ходе заполнения бланка, и переменной части, куда при заполнении бланка заносятся данные. В ходе обработки бланков требуется получить внесенные в него данные и представить их в виде, удобном для дальнейшей обработки. При этом часто приходится иметь дело с тысячами однотипных бланков.

Для обработки бланков используется автономное приложение FineReader Forms. Процесс работы с бланками несколько отличается от работы с обычными документами. Вначале подготавливается шаблон, который содержит все постоянные и переменные зоны бланка. Этап сегментации заменяется наложением шаблона, то есть его совмещением с постоянными элементами бланка. Это позволяет определить местонахождение переменных элементов бланка и провести их распознавание. Данные, полученные с отдельного бланка, рассматриваются как строка таблицы или как отдельная запись базы данных. Содержимое отдельного поля бланка соответствует ячейке таблицы.

Для создания шаблона требуется электронное изображение отдельного бланка, хотя бы и незаполненного. Чтобы создать шаблон, надо в приложении FineReader Forms дать команду Файл > Новый, после чего указать имя пакета форм и папку для хранения отсканированных бланков. Затем необходимо отсканировать или выбрать готовое изображение, которое будет использоваться в качестве основы шаблона.

Сам процесс создания шаблона состоит в ручной сегментации бланка. При этом кроме окна Редактор шаблонов открыто также диалоговое окно Параметры. Следует определить как блоки, охватывающие фиксированные элементы бланка, так и те, которые содержат области, подлежащие заполнению. Блоки, соответствующие постоянным элементам, используются как приводные метки. Чтобы исключить такой блок из процесса распознавания, следует щелкнуть на нем правой кнопкой мыши и выбрать в контекстном меню команду Тип блока > Статический текст.

Параметры блока задают на вкладке Блок диалогового окна Параметры. Для каждого распознаваемого блока надо установить флажок Экспортируемый блок, а также указать имя поля базы данных. Информация из этого блока будет заноситься в указанное поле. После того как все нужные блоки созданы и настроены, следует щелкнуть на кнопке Закрыть на панели инструментов. При этом производится проверка, обеспечивают ли заданные блоки возможность однозначного наложения шаблона на бланк.

В результате сканирования заполненного бланка, наложения шаблона и распознавания, полученные данные представляются в виде формы, содержащей названия полей и данные, полученные при распознавании. Сохранение данных производят в формате, ориентированном на последующую обработку средствами электронных таблиц или баз данных, например, в виде электронной таблицы Excel (файл .XLS).

Дата добавления: 2016-09-26; просмотров: 4924; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Похожие статьи:

poznayka.org


Смотрите также