Project

General

Profile

Overview

O reconhecimento de cadeias numéricas manuscritas tem sido objeto de estudo em vários centros de pesquisa em reconhecimento de padrões e imagens, graças ao número potencial de aplicações, tais como: a leitura do CEP em envelopes postais, o processamento da quantia numérica em cheques bancários, dentre outras. O grande desafio quando o objetivo é reconhecer uma cadeia de dígitos está na separação de dígitos conectados. Pesquisas recentes têm mostrado que a conexão entre dígitos adjacentes ainda é o principal entrave para os métodos de reconhecimento de cadeias numéricas manuscritas propostos na literatura, sejam estes baseados em segmentação implícita ou explícita. Dentre os problemas encontrados nessa área temos o uso demasiado de heurísticas nos métodos de segmentação e a não existência de um protocolo experimental que permita comparar os resultados de cada método com o que chamaríamos de "segmentação ideal". Este projeto tem por objetivo avaliar os principais e mais recentes métodos de segmentação de dígitos conectados utilizando uma base de imagens de dígitos conectados criada especialmente para este propósito, bem como, utilizar o conhecimento adquirido nesse estudo para propor um novo método de segmentação. Este terá como base classificadores treinados em "segmentação ideal" e com o objetivo de reduzir a utilização de heurísticas. Resultados Esperados 1) Uma base de dados de dígitos conectados, a qual será disponibilizada à comunidade científica para auxiliar na construção e avaliação de novos algoritmos de segmentação de caracteres manuscritos. 2) Um novo algoritmo de segmentação baseado em aprendizagem e reconhecimento de padrões. 3) Do ponto de vista da geração de conhecimento, a realização do projeto proporcionará um maior entendimento dos algoritmos de segmentação, o que implicará em uma contribuição efetiva para o desenvolvimento da área de reconhecimento da escrita manuscrita. Projeto apoiado pelo CNPq #476275/2004-0 (Edital Universal 19/2004.