ALFA SCAN PLUS CON OCR
NOTA: Las fotos con recuadro en azul pueden ser ampliadas para ver detalles. Situando el ratón encima de la foto durante unos instantes, podrás ver una pequeña descripción y lo que ocupa la ampliación.
| El software de reconoci- |
| miento óptico de caracteres |
| es uno de los más solicitados |
| por diseñadores, editores, |
| publicistas y todos aquellos |
| que desean unir texto e imá- |
| genes |
| |
|
En alguna ocasión hemos tenido la oportunidad de probar un escáner de mano. La experiencia no parece espectacular, hasta que se encuentra una utilidad práctica evidente, en nuestro caso pasar gráficos, dibujos o fotos al ordenador, para que posteriormente el maquetista pueda diseñar la revista. Pero gracias al software de reconocimiento óptico de caracteres, OCR, hemos podido dar una aplicación más eficaz al escáner de mano, introducir textos sin necesidad de teclearlos. Y sinceramente, funciona.
MIGRAPH OCR VERSION ALFA DATA
Este escáner de mano es de fácil manejo y muy ergonómico. Su resolución de 400 dpi y 256 niveles de grises, lo hacen apto para autoedición, retoque de fotos y otros trabajos con Amiga. |
La compañía Migraph, especialista en la realización de este tipo de programas, ha creado una versión específica de su OCR, para Amiga; más concretamente para los modelos AlfaScan de la compañía Alfa Data.
Este programa, sencillo de utilizar y con una potencia insospechada, facilita el desarrollo de toda la labor de introducción de textos, paso a programas de tratamiento de textos, corrección, etc. Por supuesto, no es perfecto.
En nuestra prueba con letras manuscritas, el texto interpretado contenía varias faltas garrafales, una vez en el ordenador. Sin embargo, con letra manuscrita, pero de imprenta, el resultado era más satisfactorio.
Por último, un texto pasado a máquina, sacado e un periódico, libro u otra publicación, proporciona un material más que válido para ser reconocido y posteriormente tratado con el Amiga.
La idea principal del OCR es convertir una imagen escaneada en texto editable. Por tanto, el primer requisito es poder tratar documentos que provengan de imágenes escaneadas.
El OCR de Migraph es totalmente compatible con los escáner de Alfa Data y sus documentos escaneados. Además, puede trabajar con documentos guardados en formatos IFF, TIFF o IMG (formato especial de Atari).
ALFASCAN PLUS
El escáner de Alfa Data con el que hemos probado el programa, es el más alto de la gama y único recomendable para este tipo de trabajos de calidad, tanto con textos como con imágenes. Por supuesto hablando siempre de escáner de mano. El AlfaScan Plus tiene una resolución de 400 dpi (puntos por pulgada). El programa tiene un selector de resolución desde 100 hasta 400 dpi, también un conmutador entre pulgadas y centímetros, y por último, opción entre trabajar con documentos en vertical (retratos) u horizontales o apaisados.
La capacidad para aprender a leer y reconocer nuevos esti-
los y tipos de letra, junto con la sencillez de manejo, facili-
tan las tareas de introducción y procesamiento posterior de
todo tipo de textos. |
|
Una de las características principales del AlfaScan Plus es el potente software que le acompaña. Además del típico programa para escanear, tiene otro "Merge It", que permite unir las diferentes pasadas que se realizan para escanear un original más grande que la superficie de reconocimiento óptico. Es decir, que por muy grande que sea el dibujo o fotografía original, se puede escanear por partes y unir los trozos en un solo documento. Aunque este proceso parezca complicado, es muy sencillo en la práctica, incluso para usuarios noveles. Además, tanto el manual del escáner como del programa OCR, aconsejan al usuario sobre las formas y condiciones correctas de trabajo, para obtener la máxima calidad, tanto con gráficos como con textos.
APRENDER A LEER
Una de las cualidades del programa creado por Migraph, es la capacidad para aprender a leer y reconocer nuevos estilos y tipos de letra. Para el reconocimiento de caracteres se utiliza la tecnología Omnifont, lo más actual en este campo, que identifica los diferentes caracteres mediante la unión de parches matemáticos estándar. Es decir, objetos o partes de letras que el programa tiene almacenados en forma matemática, y que luego combina hasta acertar en la identificación de una letra real del abecedario.
Entre las fuentes de letras soportadas directamente por el programa, podemos encontrar las conocidas Helvética, Times, Courier, Bookman, Letter Gothic, Prestige, etc.
El programa permite analizar un documentos en forma interactiva o automática. En la forma interactiva se van mostrando las letras que el programa no puede reconocer como tales, dando al usuario la oportunidad de confirmar o cambiar la opción. También se puede ir enseñando al programa mientras se corrige el documento. En esta opción se va creando un diccionario que posteriormente será utilizado por el programa OCR, con documentos similares. El manual recomienda crear diccionarios diferentes para los distintos tipos de documentos con los que se trabaje habitualmente. Por ejemplo, formularios, apuntes de clase, cartas, etc.
El proceso de aprendizaje del Migraph OCR es muy bueno. Si se pone cuidado en ese modo, los resultados son excelentes. Entre otras opciones, se puede encargar al OCR que cargue automáticamente nuestro editor de textos preferido, en cuanto acabe el proceso de conversión, permitiendo también salvar las preferencias del editor, el fichero de texto y el diccionario.
Entre las herramientas que aporta el programa, destacar el marcaje de areas con rectángulos o poliedros, para definir los textos a analizar. Con lo cual, se puede distinguir entre textos y gráficos. Para las zonas irregulares, se pueden utilizar varios rectángulos o poliedros, que luego el programa combina adecuadamente.
El orden lógico de análisis es el dado por el usuario en la creación de áreas, por lo que se deben definir cuidadosamente en el caso de encolumnados múltiples, por ejemplo. La flexibilidad del programa permite, en cualquier caso, reordenar las áreas, redimensionar los rectángulos, etc.
Para la visualización correcta, el zoom incorporado muestra la pantalla en formato de hoja completa, tamaño real o 100% y 200%.
LÉXICO AMERICANO Y EUROPEO
El scanner se presenta junto con los programas de mezcla y escaneo, y una regla guía. |
La eñe, nuestra famosa "ñ", no está integrada en los diferentes léxicos soportados directamente por el OCR. Por supuesto se puede y se debe crear un diccionario español con este y otros caracteres, es la primera tarea a realizar. Pero los fabricantes/programadores pensaron más en el reconocimiento de espaciado proporcional con juegos de caracteres americanos o europeos, léxico inglés, francés, alemán y holandés, etc. Por otro lado, se trabaja bien con caracteres itálicos, aunque algo más lento.
El tamaño ideal (cuerpo de las letras) está entre los 9 y 18 puntos. Aunque escaneando con el AlfaScan Plus a 400 dpi, se puede trabajar con tamaños inferiores, aunque con cierta dificultad y dependiendo de la calidad del original, lógicamente.
CONCLUSIÓN
Para terminar, comentar que el producto en conjunto es excelente. El trabajo con ambos por separado es útil y recomendable en cuanto a la relación precio prestaciones. Para cualquier usuario que desee integrar gráficos de una forma sencilla y barata y con calidad de 400 dpi, el AlfaScan Plus es una solución ideal.
Por otra parte y para quienes necesiten procesar muchos textos, el OCR que acompaña a este escáner o se puede adquirir por separado, es un programa útil, rápido y de fácil manejo.
Distribuidor: C.I.B. S.L. |