ALFA SCAN
PLUS CON OCR
NOTA:
Las fotos con recuadro en azul pueden ser ampliadas para ver detalles.
Situando el ratón encima de la foto durante unos instantes, podrás ver
una pequeña descripción y lo que ocupa la ampliación.
| El software de reconoci- |
| miento óptico
de caracteres |
| es uno de los más
solicitados |
| por diseñadores,
editores, |
| publicistas y todos
aquellos |
| que desean unir texto
e imá- |
| genes |
| |
|
En alguna ocasión
hemos tenido la oportunidad de probrar un escaner de mano. La experiencia
no parece espectacular, hasta que se encuentra una utilidad práctica
evidente, en nuestro caso pasar gráficos, dibujos o fotos al
ordenador, para que posteriormente el maquetista pueda diseñar
la revista. Pero gracias al software de reconocimiento óptico
de caracteres, OCR, hemos podido dar una aplicación más
eficaz al escaner de mano, introducir textos sin necesidad de teclearlos.
Y sinceramente, funciona.
MIGRAPH OCR VERSION ALFA DATA
Este scaner
de mano es de fácil manejo y muy ergonómico. Su resolución de 400
dpi y 256 niveles de grises, lo hacen apto para autoedición, retoque
de fotos y otros trabajos con Amiga. |
La compañía
Migraph, especialista en la realización de este tipo de programas,
ha creado una versión específica de su OCR, para Amiga;
más concretamente para los modelos AlfaScan de la compañía
Alfa Data.
Este programa,
sencillo de utilizar y con una potencia insospechada, facilita el desarrollo
de toda la labor de introducción de textos, paso a programas
de tratamiento de textos, corrección, etc. Por supuesto, no es
perfecto.
En nuestra
prueba con letras manuscritas, el texto interpretado contenía
varias faltas garrafales, una vez en el ordenador. Sin embargo, con
letra manuscrita, pero de imprenta, el resultado era más satisfactorio.
Por último,
un texto pasado a máquina, sacado e un periódico, libro
u otra publicación, proporciona un material más que válido
para ser reconocido y posteriormente tratado con el Amiga.
La idea principal
del OCR es convertir una imagen escaneada en texto editable. Por tanto,
el primer requisito es poder tratar documentos que provengan de imágenes
escaneadas.
El OCR de Migraph
es totalmente compatible con los escaner de Alfa Data y sus documentos
escaneados. Además, puede trabajar con documentos guardados en
formatos IFF, TIFF o IMG (formato especial de Atari).
ALFASCAN PLUS
El escaner
de Alfa Data con el que hemos probado el programa, es el más
alto de la gama y único recomendable para este tipo de trabajos
de calidad, tanto con textos como con imágenes. Por supuesto
hablando siempre de escaner de mano. El AlfaScan Plus tiene una resolución
de 400 dpi (puntos por pulgada). El programa tiene un selector de resolución
desde 100 hasta 400 dpi, también un conmutador entre pulgadas
y centímetros, y por último, opción entre trabajar
con documentos en vertical (retratos) u horizontales o apaisados.
|
La
capacidad para aprender a leer y reconocer nuevos esti-
los y tipos de letra, junto con la sencillez de manejo,
facili-
tan las tareas de introducción y procesamiento posterior
de
todo tipo de textos.
|
|
Una de las
características principales del AlfaScan Plus es el potente software
que le acompaña. Además del típico programa para
escanear, tiene otro "Merge It", que pertmie unir las diferentes
pasadas que se realizan para escanear un original más grande
que la superficie de reconocimiento óptico. Es decir, que por
muy grande que sea el dibujo o fotografía original, se puede
escanear por partes y unir los trozos en un solo documento. Aunque este
proceso parezca complicado, es muy sencillo en la práctica, incluso
para usuarios noveles. Además, tanto el manual del escaner como
del programa OCR, aconsejan al usuario sobre las formas y condiciones
correctas de trabajo, para obtener la máxima calidad, tanto con
gráficos como con textos.
APRENDER A LEER
Una de las
cualidades del programa creado por Migraph, es la capacidad para aprender
a leer y reconocer nuevos estilos y tipos de letra. Para el reconocimiento
de caracteres se utiliza la recnología Omnifont, lo más
actual en este campo, que identifica los diferentes caracteres mediante
la unión de parches matemáticos estándar. Es decir,
objetos o partes de letras que el programa tiene almacenados en forma
matemática, y que luego combina hasta acertar en la identificación
de una letra real del abecedario.
Entre las fuentes
de letras soportadas directamente por el programa, podemos encontrar
las conocidas Helvética, Times, Couries, Bookman, Letter Gothic,
Prestige, etc.
El programa
permite analizar un documentos en forma interactiva o automática.
En la forma interactiva se van mostrando las letras que el programa
no puede reconocer como tales, dando al usuario la oportunidad de confirmar
o cambiar la opción. También se puede ir enseñando
al programa mientras se corrige el documento. En esta opción
se va creando un diccionario que posteriormente será utilizado
por el programa OCR, con documentos similares. El manual recomienda
crear diccionarios diferentes para los distintos tipos de documentos
con los que se trabaje habitualmente. Por ejemplo, formularios, apuntes
de clase, cartas, etc.
El proceso
de aprendizaje del Migraph OCR es muy bueno. Si se pone cuidado en ese
modo, los resultados son excelentes. Entre otras opciones, se puede
encargar al OCR que cargue automáticamente nuestro editor de
textos preferido, en cuanto acabe el proceso de conversión, permitiendo
también salvar las preferencias del editor, el fichero de texto
y el diccionario.
Entre las herramientas
que aporta el programa, destacar el marcaje de areas con rectángulos
o poliedros, para definir los textos a analizar. Con lo cual, se puede
distinguir entre textos y gráficos. Para las zonas irregulares,
se pueden utilizar varios rectángulos o poliedros, que luego
el programa combina adecuadamente.
El orden lógico
de análisis es el dado por el usaurio en la creación de
áreas, por lo que se deben definir cuidadosamente en el caso
de encolumnados múltiples, por ejemplo. La flexibilidad del programa
permite, en cualquier caso, reordenar las áreas, redimensionar
los rectángulos, etc.
Para la visualización
correcta, el zoom incorporado muestra la pantalla en formato de hoja
completa, tamaño real o 100% y 200%.
LEXICO AMERICANO Y EUROPEO
El scanner se
presenta junto con los programas de mezcla y escaneo, y una regla
guía. |
La eñe,
nuestra famosa "ñ", no está integrada en los
diferentes léxicos soportados directamente por el OCR. Por supuesto
se puede y se debe crear un diccionario español con este y otros
caracteres, es la primera tarea a realizar. Pero los fabricantes/programadores
pensaron más en el reconocimiento de espaciado proporcional con
juegos de caracteres americanos o europeos, léxico inglés,
francés, alemán y holandés, etc. Por otro lado,
se trabaja bien con caracteres itálicos, aunque algo más
lento.
El tamaño
ideal (cuerpo de las letras) está entre los 9 y 18 puntos. Aunque
escaneando con el AlfaScan Plus a 400 dpi, se puede trabajar con tamaños
inferiores, aunque con cierta dificultad y dependiendo de la calidad
del original, lógicamente.
CONCLUSION
Para terminar,
comentar que el producto en conjunto es excelente. El trabajo con ambos
por separado es útil y recomendable en cuanto a la relación
precio prestaciones. Para cualquier usuario que desee integrar gráficos
de una forma sencilla y barata y con calidad de 400 dpi, el AlfaScan
Plus es una solución ideal.
Por otra parte
y para quienes necesiten procesar muchos textos, el OCR que acompaña
a este escaner o se puede adquirir por separado, es un programa útil,
rápido y de fácil manejo.
Distribuidor:
C.I.B. S.L.
|