Оптично разпознаване на символи

OCR системите изискват калибриране за работа с определен шрифт; в по-ранните версии програмирането изискваше изображение на всеки символ; програмата можеше да работи само с един шрифт наведнъж. В момента най-широко разпространени са така наречените „интелигентни“ системи, които разпознават повечето шрифтове с висока степен на точност. Някои OCR системи могат да възстановят оригинално форматиране на текст, включително изображения, колони и други нетекстови компоненти.

Съдържание

През 1929 г. Густав Таушек получава патент за OCR метод в Германия, следван от Пол У. Хендел с патент за своя метод в САЩ през 1933 г. През 1935 г. Таушек също получава патент на САЩ за вашия метод. Машината Tauschek е механично устройство, което използва шаблони и фотодетектор.

Първата търговска система е инсталирана в Reeders Digest през 1955 г. Втора система беше продадена на Standard Oil за четене на кредитни карти за обработка на чекове. Други системи, доставени от компанията на Шепърд, бяха продадени в края на 50-те години, включително скенер на страници за ВВС на САЩ, предназначен за четене и писане на съобщения на машинопис. По-късно IBM лицензира да използва патентите на Shepard.

През 1978 г. Kurzweil Computer Products започва да продава търговска версия на компютърна програма за оптично разпознаване на символи. Две години по-късно Курцвейл продаде компанията си на Xerox Corporation, която се интересуваше от по-нататъшна комерсиализация на OCR системи. Kurzweil Computer Products стана дъщерно дружество на Xerox, известно като Skansoft.

През 1993 г. беше пусната технологията за разпознаване на текст на руската компания ABBYY. На негова основа са създадени редица корпоративни решения и програми за масови потребители. По-специално програмата за OCR ABBYY FineReader, приложения за разпознаване на текстова информация от мобилни устройства, системата за поточно предаване на документи и въвеждане на данни ABBYY FlexiCapture. Технологиите за разпознаване на текст ABBYY OCR са лицензирани от международни ИТ компании като Fujitsu, Panasonic, Xerox, Samsung [3], EMC и други.