Как разобрать почерк человека программа


Распознавание рукописного текста. Какие программы в этом помогут?

Иногда перед владельцем персонального компьютера возникает довольно сложная по своим особенностям задача – перевести рукописный текст в цифровой формат. Конечно, можно выполнить эту работу и вручную. Однако такой метод актуален только при условии, что объем незначительный. Но что же делать пользователю, если у него на руках целый масштабный фолиант? Существует ли оперативное распознавание рукописного текста?

Конечно же, современные компьютерные технологии уже далеко ушли от того уровня, который закрепился несколько лет назад. Умельцы каждый день создают десятки новых программ, которые способствуют облегчению выполнения разного рода задач. При этом такие утилиты могут распространяться как платно, так и совершенно безвозмездно. Разница будет заключаться в надежности скачиваемого файла, а также возможности устранения каких-либо возникающих сложностей и неполадок через техническую продержку данного программного обеспечения. Распознавание рукописного текста на сегодняшний день не представляет собой особой проблемы. С этой задачей легко справляются сразу несколько удобных утилит.

Наиболее известной и популярной является программа для распознавания рукописного текста под названием Fine Reader. Для того чтобы пользователь смог её применить, ему понадобится сканер. К слову сказать, этот прибор пригодится в любом случае, какую бы утилиту вы не выбрали. Ведь для того чтобы программа могла начать работу, ей нужна какая-то исходная информация о тексте. Наиболее простым способом является создание скана. Хотя некоторые программы способны осуществлять распознавание рукописного текста и при наличии обычной цифровой фотографии любого формата, предварительно загруженной в компьютер. Помните, чем лучше будет качество (разрешение) снимка, тем более качественно утилита выполнит свою работу. Fine Reader вполне можно найти в интернете и скачать без каких-либо финансовых вложений. Работать с этой программой довольно просто, так как она имеет простой и удобный интерфейс. Однако конечный результат может иметь существенные погрешности. Это будет зависеть от качества скана, а также почерка исходника.

Другая программа распознавания рукописного текста, на которую стоит обратить свое внимание, называется Pen Reader. Она придется по вкусу владельцам планшетных ПК. Её принцип кардинально отличается от предыдущей утилиты. В данном случае вы получаете возможность просто писать на сенсорном дисплее, словно ручкой. При этом текст будет с высокой скоростью и точностью (порядка 97%) переводиться в файл стандартного расширения. Данная программа распространяется только за отдельную плату и создана специально для ОС Windows. Особенно удобно ею пользоваться студентам, которые сразу могут писать лекции в виде текстовых электронных файлов. Кроме того, Pen Reader «понимает» даже самый сложный почерк.

Распознавание рукописного текста может быть осуществлено и такой утилитой, как Cunei Form. Она работает на большинстве операционных систем, а также способна довольно четко переводить в цифровой формат журналы, газеты, слова, набранные на печатной машинке, файлы OCR и многое другое. Данная программа имеет расширенный ряд опций, с помощью которых пользователь может отрегулировать практически все настройки. Количество иностранных языков, на которых происходит распознавание рукописного текста, превышает 20 штук. При всем этом интерфейс утилиты полностью русифицирован, а сама она распространяется в сети совершенно бесплатно. Вот такие вот бескорыстные умельцы иногда встречаются на просторах всемогущего интернета. Благодаря им пользователи получают возможность без каких-либо затрат и финансовых вложений легко и просто перевести практически любую рукопись в цифровой формат.

fb.ru

Распознавание непрерывного рукописного текста в режиме off-line

Как известно, задача распознавания непрерывного рукописного текста в режиме off-line пока считается нерешённой. Мне удалось решить эту задачу теоретически и практически. Практическая часть сейчас имеет вид демонстрационной версии программы. Решение общее, оно не ограничивается какой-либо областью применения, языком или размером словаря.

О программе
Программа полностью обучаемая. Процесс обучения выглядит просто: вы пишете символы в режиме on-line, программа их обобщает и выделяет алгоритм написания. Это первый этап обучения. Второй этап происходит во время работы. Если встречается символ, общий алгоритм написания которого совпадает с одним из имеющихся в наличии, а значения некоторых свойств выходят за рамки вычисленных на первом этапе диапазонов, то диапазоны расширяются. Конечно, только после подтверждения пользователем общего результата распознавания. К слову сказать, на первом этапе достаточно от трёх до семи предъявлений символа, и алгоритм готов.
Теория
Немного о теории. Существует несколько подходов к решению указанной задачи. Их обычно делят на два вида: структурные и эталонные. Первый основан на выделении и анализе различных структурных элементов символа и их признаков, свойств. Второй предполагает сравнение распознаваемого символа с набором заданных эталонов. Эти методы не позволяют решить задачу в общем виде. Задача рукописного ввода в режиме on-line полностью и успешно решена. Это решение основано, в любом случае, на создании алгоритмов написания символов, учитывающих траекторию движения пера. То есть, последовательность смены его координат. Были предложения свести задачу распознавания в off-line режиме к распознаванию в режиме on-line. Для этого достаточно правильно считать линии с графической копии текста. Но сделать это принципиально невозможно. Можно считать отрезки линий между пересечениями, но чтобы их правильно соединить, уже нужна интерпретация. Остаётся только одно решение — восстанавливать символы в процессе интерпретации отрезков, полученных на этапе считывания с цифровой графической копии текста. Для этого нужны две составляющие: специальное представление алгоритма написания символа, позволяющее это делать, и алгоритм интерпретации отрезков, способный проанализировать все возможные варианты интерпретации.
Практика
Это удалось сделать в полной мере. Как известно, главная задача демоверсии — продемонстрировать принципиальное решение поставленной задачи. На что в этом смысле способен тот прототип, который имеется сейчас? Программа способна распознавать одно слово, написанное произвольным непрерывным почерком на белой бумаге. Для перевода в цифровой файл слово может быть либо отсканировано, либо сфотографировано веб-камерой или цифровым фотоаппаратом. В принципе, уже сделано и распознавание текста, но эта функция требует доработки. Ниже приведены примеры распознаваемых слов. Как видно, здесь не только обычное написание, но и «усложнённые» варианты: перечёркнутые слова, символы, написанные отрезками, имеющие лишние части и тому подобное. Это показывает, что в полностью готовом виде программа будет способна распознавать достаточно зашумлённые тексты.

Очевидно, что уверенно распознать можно только те символы, которые имеют все необходимые части примерно на своих местах. Если имеются недостающие или сильно искажённые части, то необходима интерпретация на уровне слов. Наличие словаря повышает процент распознавания, но не решает всех проблем. Бывают такие случаи, когда без понимания смысла фразы некоторые слова однозначно интерпретировать невозможно. Для этого нужна система искусственного интеллекта, способная понимать смысл фраз естественного языка. До недавнего времени информации о наличии таких систем на рынке не было. Сейчас уже есть: фирма ABBYY объявила о создании системы «Compreno», в которой для перевода используется смысловая интерпретация фраз на основе «модели мира», не зависимой от конкретного языка.

У меня тоже есть прототип системы ИИ, способной понимать смысл текста. Если судить по той информации о «Compreno», которая сейчас есть в СМИ, моя система функционально гораздо шире. Она обучаема, способна к обобщению информации и к активному поиску знаний в случае, когда их не хватает для выполнения поставленной задачи. Другими словами, такая система вполне способна работать личным секретарём. Но у неё есть один серьёзный недостаток по сравнению с «Compreno» — по степени общей готовности она пока не дотягивает даже до демоверсии.
Коммерция
И в конце немного о коммерческой стороне проекта. В интернете есть интервью вице-президента компании ABBYY Lingvo Арама Пахчаняна. В отношении задачи распознавания непрерывного рукописного текста в режиме off-line там сказано, по сути, что эту задачу и не надо решать. Затраты на её решение (надо полагать, очень большие) не окупятся. И, похоже, в основном потому, что непрерывное писание фирма ABBYY Lingvo практически уже сделала неактуальным. Она полностью решила проблему распознавания раздельного рукописного текста, и на все случаи жизни разработала соответствующие бланки. Возможно, это была шутка. Но всё равно, имеет смысл сказать следующее. Писать привычным непрерывным почерком удобнее и легче, чем вписывать буквы в квадратики. Если компьютер будет распознавать первое не хуже второго, то второе уйдёт в прошлое так же как перфокарты, чёрно-белые телевизоры и плёнки для фотоаппаратов. В следующем короткое видео можно увидеть программу в действии. Возможно, это будет интересно.

Заключение
И ещё один важный момент – показатели эффективности, а именно, время и процент распознавания. Конечно, в демоверсии основное внимание уделялось второму критерию. Сейчас достигнут уровень не ниже 70%. В готовом варианте этот показатель можно сформулировать так: если человек сможет прочитать текст, то и программа тоже. О времени распознавания пока можно сказать только то, что его удастся довести до приемлемых величин. Если всё пойдёт хорошо, будут ещё статьи о некоторых технических аспектах распознавания текста и об ИИ. Благодарю за внимание. ____________

Update.

Дорогие хабравчане! Спасибо всем за фидбек, нам это очень важно и полезно. В целом топик был встречен положительно, что не может не радовать. Негодующим личностям хотелось бы сказать: уважаемые, мы не ярмарочные фокусники. Мы отдаём отчёт в своих словах. Если мы написали, что в готовом продукте точность распознавания будет стремиться к 100%, значит мы в этом уверены. Эту статью можете считать анонсом, у неё не было цели подробно раскрыть все технические подробности. Однако учитывая проявленный интерес, через некоторое время будет ещё одна статья, более подробно описывающая процесс распознавания. Также будет доступная для скачивания демонстрационная версия программы. Теги:
  • распознавание текста
  • искусственный интеллект
  • 4 июля 2019 в 11:24
  • 29 июня 2019 в 15:41
  • 16 июня 2019 в 14:38

habr.com

Общие приемы при разборе почерка;

При разборе почерка необходимо самым тщательным образом изучить все знаки, буквы и росчерки. Следует обращать внимание на поля, строки, слова, буквы, закругления, углы, конечные штрихи, подчеркивания, черты, знаки препинания, знаки ударения, вопросительные, восклицательные знаки. Строки бывают прямолинейные, восходящие, прямолинейно-нисходящие, волнистые, волнисто-восходящие и волнисто-нисходящие, параболические и гиперболические.

Почерк математиков характерен тем, что буквы выходят иногда как цифры. Вообще все люди, которые творят и создают что-либо умственное, пишут не только извилистыми буквами, но даже дискантовыми и басовыми ключами.

Почерк промышленников, торговцев, купцов, финансистов, а также людей, имеющих действительное дарование, можно узнать в подписи и росчерке по их раковинным закруглениям.

Росчерк сам по себе имеет большое значение в психографологии; отсутствие росчерка служит признаком душевной простоты.

Самый важный признак для изучения почерка представляют идиоты, обнаруживая совершенно своеобразные формы как букв, так и штрихов; такой почерк бывает свойствен также людям оригинальным и причудливым, указывая на странности и сумасбродство.

Сложность росчерка имеет основательное значение, в зависимости от того, образует ли он углы или закруглен, видна ли в нем быстрота, отчетливость, определенность и ясность или запутанность, придающая ему сходство с паутиной; вертикален ли он или опускается и дает наклон влево. Характерны далее мечеобразность росчерка, его утолщенность, продолговатость, а также то, острый ли росчерк, зигзагообразный или оканчивающийся крючком.

Что же мы можем увидеть в почерке? Преобладающие положительные и отрицательные черты характера: высокомерие или кротость, чувствительность или тупость, страстность или равнодушие, силу воли или бесхарактерность, воинственность или трусость, деспотизм или податливость, искренность или лживость, щедрость или жадность, расточительность или скупость, энергичность или леность, формализм или небрежность, экспансивность или сдержанность, оптимизм или пессимизм, альтруизм или эгоизм, активность или пассивность. Положительные и отрицательные психофизические свойства: здоровье или болезнь, ум или глупость, сильный интеллект или идиотизм, талантливость или бездарность, живость или медлительность, сангвинический, флегматический, холерический или меланхолический темперамент. В почерке встречаются также признаки сочетания двух противоположных сил, но при этом одна из них оказывает господствующее влияние.

Как нужно делать психографологический разбор почерка

Пример 1

1. Общие признаки

1. Бледный почерк указывает на непоследовательность и слабость натуры.

2. Размашистый почерк — на любовь завладевать доверием других и обманывать

3. Вытянутый почерк — на развращенность, страстность.

4. Неровные строки — на плутовство

5. Связанный почерк — на способности, хитрый ум.

2. Общий взгляд на буквы Разбор букв и их признаков

1. Приподнятое Я (заглавное), оживленное, с красивым крючком. Указывает на озлобленность, хитрость, дерзость, желание фарсировать, показать себя как можно лучше.

2. Буква н строчная (в слове «не»), написанная как п и недостаточно вытянутая, как бы недоросшая, вторая буква слова — е — выше и закрывает ее. Первая палочка в букве н со вздернутым крючком.

Указывает на лживость, развращенность, способность обманывать и злоупотреблять доверием; постоянный поиск мотивов для самооправдания.

3. е простое, с красивым взмахом вправо, круглое. Указывает на способности, вкус, умение красиво говорить.

4. Буква з (в слове «знаю») безобразная и бесформенная, с острым клином наверху.

Указывает на способность пуститься на аферы для достижения своих целей.

5. Буква у (в слове «успокоение») отдельная, вытянутая, без особого крючка.

Указывает на напряженную силу, но усталость, желание отдохнуть, успокоиться и стать лучше.

6. Еще буква у (в слове «ищу») вместе с буквой щ, перекрещиваются.

Указывает на стыд и желание переменить свое имя, чтоб его не узнали.

7. Буквы в и р (в слове «вероятно») характерны своей стройностью.

Указывают на мечтательность, вкус, фантазию, живость, веселость, несмотря на пожилой возраст.

studfiles.net

Робот Bond подделает почерк любого человека - «Хакер»

Рекомендуем почитать:
  • Содержание выпуска
  • Подписка на «Хакер»

В сентябре 2014 года о себе заявила компания Maillift. Она предоставляет услуги рукописного текста для рекламщиков, которые хотят рассылать человекоподобный бумажный спам. Как показывает практика, рукописный спам потребители чаще открывают и читают. Для создания таких текстов используют машины стоимостью в десятки тысяч долларов. Они пишут и шариковой, и капиллярной ручкой. Некоторые маркетологи покупают технику, а другие заказывают сервис у сторонних компаний.

Сейчас техника роботизированного рукописного письма продвинулась ещё дальше. Она стала доступна для обычных пользователей, желающих отправить красивое письмо родственникам вместо обычного email или SMS. Для них открылся специальный сервис Bond.

В компании Bond работает 11 «рукописных» принтеров, а пользователям предлагают отправить сообщение прямо из мобильного приложения.

Клиенту дают выбрать один из вариантов почерка, в том числе почерки известных людей, как инженера и изобретателя Николы Теслы.

Самая уникальная опция — анализ почерка самого клиента и автоматическое воспроизведение его особенностей.

На самом деле технология управления письмом более сложная, чем может показаться. Нельзя просто воспроизводить один и тот же шрифт, это будет неправдоподобно. Поэтому принтер варьирует силу нажатия и начертания букв, чтобы выглядеть как можно более похожим на человека.

При анализе почерка клиента программа повторяет начертания символов, угол наклона букв, учитывает расстояние между словами и другие характеристики.

Для анализа ей нужно «скормить» несколько абзацев рукописного текста в отсканированном виде с разрешением 300 dpi или лучше.

Разумеется, услуги Bond не бесплатны. Стартап берёт от $1,49 до $2,99 за каждое письмо, в зависимости от объёма заказа (без учёта стоимости марок).

xakep.ru

Создаём шрифт, имитирующий ваш рукописный почерк

Учащимся старших классов и студентам ВУЗов, зачастую, делая домашнюю работу, приходится выполнять большое количество письменных упражнений. Например, наш преподаватель по обществознанию каждый урок задает нам ДЗ, заключающееся в том, чтобы мы нашли материал в библиотеке или Интернете, и написали его от руки (только за это можно получить оценку «отлично»), даже если найденный материал будет верным, но распечатанный на компьютере, выше четвёрки не жди… Исходя из всего вышесказанного, я пришёл к выводу: нужно сделать шрифт для компьютера, дублирующий мой почерк. На мой взгляд, сделал я его успешно. Родная мать не отличит, где я писал от руки, а где напечатал компьютер. Многим моим знакомым понравилась эта затея, и они стали расспрашивать меня, как я это всё сделал. И чтобы каждому по сто раз не объяснять, я решил написать эту статью – план выполнения работы с подробными комментариями. Итак, в этой статье я расскажу вам, как сделать шрифт, имитирующий ваш почерк. Для работы нам потребуются: 1) листы чистой бумаги в формате А4; 2) чёрная гелевая ручка; 3) принтер; 4) сканер; 5) программа High-Logic FontCreator (предлагаю скачать с официального сайта программы).

Для скачивания нажмите на предлагаемую ссылку.

1 шаг

Возьмите альбомный лист бумаги и напишите на нём все буквы русского алфавита (строчные и заглавные), цифры от нуля до девяти и знаки препинания: точка, запятая, точка с запятой, двоеточие, кавычки, тире, скобки и т.д. Если кому нужно, можете добавить другие символы, которые вам пригодятся при письме, такие как @, №, $, #, ^, %, * и др. Пишите красиво, выводите каждую буковку, чтобы потом вся Ваша работа не пошла насмарку.

2 шаг

Лист, с написанными буквами, отсканируйте. И тем людям, которым удалось вписать все символы на одну страницу, в итоге получат одну большую картинку.

3 шаг

Затем открываем программу FontCreator от производителя High-Logic. Её окно выглядит так.

File — New…

В появившемся окне нужно ввести название вашего будущего шрифта.

Кликаем «OK» — появляется след. окно. В этом окне откройте картинку с вашими буквами. Выделите буковку «А», скопируйте её и вернитесь в FontCreator, откройте ячейку с буквой «F» и вставьте туда свою букву. Красные пунктирные линии можно передвигать, расставьте их так, как показано на следующем рисунке.

Буква должна стоять на линии (Baseline) и НЕ должна вылезать за верхнюю горизонтальную линию (WinAscent), а также НЕ должна вылезать за нижнюю горизонтальную линию (WinDescent), иначе она будет обрезана. Вертикальная левая линия должна стоять на том месте, где буква начинается, а вертикальная правая линия – где буква заканчивается. Если буква вылезет за вертикальные линии, то при печатании будет наложение одной буквы на другую, это тоже нам не подходит. Сейчас объясню, почему букву «А» мы вставили в ячейку с буквой «F». Данная программа предназначена для создания шрифтов, использующая латинские буквы. Нам же напротив нужно изготовить шрифт для русских букв. Поэтому сделанный нами РУССКИЙ шрифт получится на ЛАТИНСКОЙ раскладке. Для того чтобы было удобнее, будем вставлять русские буквы в ячейки с латинскими буквами, в соответствии с клавиатурой.

В ячейку с буквой «Q» вставим букву «Й» В ячейку с буквой «W» вставим букву «Ц» В ячейку с буквой «E» вставим букву «У» В ячейку с буквой «R» вставим букву «К» В ячейку с буквой «T» вставим букву «Е» В ячейку с буквой «Y» вставим букву «Н» И так далее… После того, как расставите все буквы по ячейкам, у вас получится вот такая картина.

Теперь можно протестировать, получившийся шрифт. Сделать это можно, нажав клавишу «F5», или, зайдя в «Font — Test...»

Если вас всё устраивает, сохраняете получившийся шрифт и помещаете в папку «C:\WINDOWS\Fonts». Шрифт устанавливается, и теперь вы можете выбрать его, например, в Microsoft Word и печатать им текст. Ниже представлен текст, напечатанный моим шрифтом.

Сам шрифт

Теги:
  • шрифт
  • дизайн
  • Microsoft Word

habr.com

Abbyy FineReader научился распознавать почерк врачей

Компания Abbyy добавила в Abbyy FineReader новые эталоны, позволяющие распознавать медицинский почерк. Благодаря дополнительному модулю MedText пользователям FineReader не придется больше самостоятельно расшифровывать выписанные врачами рецепты или направления на лечение: достаточно отсканировать бумажную версию документа и распознать ее с помощью программы, сообщили CNews в Abbyy.

«Пользователи давно просят нас добавить возможность распознавания медицинского почерка в программу Abbyy FineReader. И это понятно, ведь все мы знаем, как непросто порой бывает разобрать текст, написанный врачом, — отметил Иван Бодягин, директор департамента продуктов для распознавания текстов компании Abbyy. — В 12-ой версии FineReader мы значительно улучшили распознавание сложного арабского языка, и использованные при этом подходы помогли нам в работе с почерком врачей».Арабская письменность выглядит для людей, не знающих язык, как сложная последовательность связанных элементов: зачастую визуально довольно сложно выделить в словах отдельные буквы. Поэтому для распознавания арабского языка традиционно применяется подход, при котором распознаются не отдельные символы, а слова целиком. Схожие проблемы обычно возникают и при попытке разобрать почерк врачей, поэтому опыт распознавания языков со сложной письменностью был полезен при создании Abbyy FineReader MedText, пояснили в компании.

Система распознавания медицинских текстов основана на вероятностных графических моделях (PGM), байесовских сетях (BN) и скрытых марковских моделях (HMM). Abbyy FineReader распознает почерк врача большими блоками. В наиболее сложных случаях программа обрабатывает целые строки как один объект распознавания, превращая изображение в граф вероятностных состояний, из которых потом кристаллизуется осмысленный текст.

При создании модуля MedText компания Abbyy впервые применила новую разработку — метод детектирования внутренней логики письма. С его помощью можно определить, какие из завитушек в строке соответствуют реальным буквам, а какие были добавлены врачом для красоты.

Кроме того, компания разработала систему расшифровки врачебных сокращений. Вклад в ее создание сделали практически все сотрудники Abbyy, а также пользователи программ компании, когда-либо бравшие больничный или получавшие от врачей рецепты. Все их справки и направления были тщательно проанализированы лингвистами. «Благодаря этой работе система расшифровки врачебных сокращений, применяемая в Abbyy FineReader, позволяет не только перевести рецепт в читаемый текст, но и объясняет пользователю, что же все-таки имел в виду врач», — указали в Abbyy.

Сейчас Abbyy работает над мобильной версией Abbyy FineReader MedText, чтобы пользователи могли распознавать выписанные рецепты сразу после выхода из кабинета врача.

Источник: CNews

10pix.ru


Смотрите также