Легко представить, с какими трудностями встречаются те, кто обрабатывает результаты переписи населения, итоги голосования с помощью бумажных бюллетеней, заполняемые ежегодно налоговые декларации, экзаменационные листы и многое другое. Главная проблема автоматического ввода для считывания таких документов состоит в создании высокоточного "интеллектуального" классификатора, основанного на распознавании одиночных рукописных символов. Все существующие подходы к построению такого классификатора не идеальны.
Примером построения системы распознавания служит так называемый признаковый классификатор. Он использует набор вычисляемых по представленному тем или иным способом изображению признаков и решающее правило классификации (по известным математическим формулам).
Сотрудники Института радиотехники и электроники РАН разработали новую систему признаков, вычисляемую по векторному изображению. Вначале изображение символа представляется как набор векторов, которые моделируют его в виде статической траектории движения пишущего инструмента. На откорректированное изображение накладывается сетка из шести полос. Попадание в одну или несколько из этих полос, а также в один из девяти образованных полосами квадратов определяет положения точек, вершин, концов цепей, число пересечений в вертикальном и горизонтальном направлениях и др. - все то, чем можно описать изображение рукописного символа (количество признаков достигает 224). Эти данные подвергаются математической обработке и затем сравниваются с эталонными (полученными усреднением) результатами. Авторы реферируемой статьи считают, что решающую роль в распознавании рукописи играет выбор оптимального набора признаков, а предложенная система дает улучшенные результаты по сравнению с другими системами признаков.
Ю. ГУЛЯЕВ, В. ТЕРЕЩЕНКО, Т. ХАЛЕВИНА, Д. ЯН. Метод распознавания рукописных символов, основанный на новой системе признаков, вычисленных по векторному изображению. "Доклады Академии наук" том 389, № 3, 2003, стр. 314-317.