11.08.2019

Abbyy Fine



Hay una categoría de programas que son fundamentales para el día a día: los programas de reconocimiento óptico de carácteres (OCR, por sus siglas en inglés). Para los que no los conocen, este tipo de programas cumplen la noble tarea de pasar a formato editable archivos de imagen (por ejemplo, un acta de directorio que nos llegó en papel y la escaneamos para luego pasarla a Word) o archivos PDF, que son los que más dolores de cabeza nos dan.
Abbyy Fine Reader 12, el más destacado de todos los programas de OCRnos convertirá instantáneamente una imagen o un PDF a Word, pero si el resultado no es muy bueno porque el documento original es complejo, nos permitirá decidir por nosotros mismos cómo reconocer o leer el documento original antes de convertirlo al formato editable.



En esta nota, veremos en cinco pasos cómo sacarle el máximo provecho a la herramienta, pero primero aprenderemos rápido cómo hacer una conversión simple; es decir, si tengo un archivo PDF o de imagen sin demasiadas complicaciones, uso el Abbyy Fine Reader 12 para convertirlo a Microsoft Word.
Este proceso es relativamente sencillo: primero, abrimos el programa y, cuando nos aparezca el cuadro de las diferentes tareas que podemos hacer con el FineReader, seleccionamos Archivo de imagen o PDF a Microsoft Word (antes, debemos asegurarnos de elegir el idioma correcto del documento para que el reconocimiento sea más exacto). Después, elegimos el archivo que queremos convertir a Word y listo. Esperamos unos instantes, y el programa generará directamente un archivo de Word que podemos guardar y usar.
Muy bien. Ya conocemos los conceptos básicos. Ahora supongamos que el archivo de imagen (o PDF) que tenemos que convertir es una imagen compleja con texto mezclado. Algo así como esto:
Cuando hagamos el procedimiento básico, es muy posible que el Word final que hayamos generado con la herramienta no esté en buenas condiciones para trabajar. Por esto es que necesitamos meter un poco de mano en la herramienta para generar un archivo editable que nos permita traducir sin problemas. Veamos, entonces, los cinco pasos para usar Abbyy Fine Reader 12 de la manera más efectiva.
1. Abrimos el programa y nos aparecerá el cuadro de tareas del que hablamos antes. Como ya se aclaró, lo más importante antes de empezar es elegir el idioma el documento. La versión más económica del Abbyy FR (la versión En español) permite reconocer textos en francés, inglés, español, alemán, italiano y portugués. Una vez elegido el idioma, hacemos clic en Archivo de imagen o PDF a Microsoft Word. Acto seguido, seleccionamos el archivo que queremos convertir.
2. De manera automática, el programa intentará reconocer el archivo que le cargamos y nos generará un archivo de Microsoft Word. En este caso, como la imagen es muy compleja, el resultado no será bueno. Nos quedarán palabras sin reconocer y marcadas como imágenes, y seguramente el formato no será el más apropiado. Como el archivo de Word no nos sirve, lo cerramos y volvemos al Abbyy FR.
3. De regreso en el programa, veremos que la pantalla del programa tiene dos divisiones principales: IMAGEN y TEXTO. En la división IMAGEN, vemos cómo el programa hizo al reconocimiento del archivo que le cargamos. En la división TEXTO, vemos cuál es el resultado de ese reconocimiento (e incluso podemos editar el texto antes de convertirlo a Word). Como podemos notar en esta captura, en la división IMAGEN vemos algunos cuadros rojos y otros verdes. Ese es el reconocimiento óptico de carácteres que hizo el programa. A lo que está de color rojo lo reconoció como imagen; a lo que está de color verde, como texto. También podrían aparecernos cuadros de color azul; estos son elementos que el programa reconoce como tabla.
Como el reconocimiento que nos hizo el programa no nos sirvió, vamos a eliminar todo el trabajo hecho por el FineReader y a hacerlo nosotros mismos. Para eso, hacemos clic con el botón derecho del mouse sobre cualquier parte de la vista IMAGEN y seleccionamos Eliminar todas las áreas y el texto.
Al hacer esto, veremos que a la derecha nos aparecerá la leyenda «Página no reconocida». Ahora nos toca meter mano a nosotros.
4. Lo que tendremos que hacer en esta parte es indicarle al programa qué elementos de la imagen son texto y qué elementos deben ser reconocidos como imagen. En este caso, como tenemos una mezcla bastante común de texto e imagen, lo que nos convendrá hacer es seleccionar todo como imagen para asegurarnos de no perdernos de ninguna línea ni nada en particular y luego seleccionaremos una por una las palabras dentro de la imagen como texto.
Para seleccionar en la imagen partes de reconocimiento como texto y otras como imagen, usaremos la barra que se ubica a la izquierda de la vista de IMAGEN:
Simplemente, hacemos clic en el elemento que queremos usar y luego vamos dibujando cuadros en el texto que queremos reconocer. Lo que yo hice a continuación fue primero seleccionar el botón de Imagen y marcar a toda la imagen con un recuadro rojo. Luego, seleccioné el botón de texto e hice un recuadro en cada una de las partes que tiene texto.
Si en un lugar de una imagen única hubiéramos cargado un PDF con varias páginas, debemos ir página por página del PDF repitiendo los puntos 3 y 4 de esta explicación antes de pasar al punto 5.
5. Luego de que le indicamos al programa cómo queremos que reconozca el texto que le cargamos, vamos a pedirle que lo haga. Haremos clic en el botón Leer que se encuentra en la barra superior del programa.
Una vez leídas todas las páginas del documento, terminaremos pidiéndole al programa que convierta el archivo en un documento de Word. Para esto, haremos clic en el botón Enviar que se encuentra al lado del botón Leer que acabamos de usar. El Abbyy Fine Reader generará así un archivo de Word.
Si todo salió bien, el programa nos generará un archivo de Word perfectamente editable. Si el resultado sigue sin gustarnos, podemos cerrar el archivo de Word y volver al Abbyy Fine Reader para volver a cambiarle la forma en la que queremos que reconozca el archivo que le cargamos. Si bien parece un software simple, el programa tiene muchas opciones que son interesantes para explorar: por ejemplo, podemos cargar más de un documento en la etapa de reconocimiento y generar un único archivo de Word a partir de varias imágenes o varios documentos PDF. También, si quisiéramos, podemos enviar a Word solo una página de un documento largo. Para hacerlo, abrimos el documento en cuestión en el Abbyy FR y en la parte de edición buscamos la página que queremos convertir a Word, hacemos clic con el botón derecho sobre ella y seleccionamos Enviar páginas seleccionadas a > Microsoft Word.
Es muy importante recordar que los archivos PDF fueron creados previamente con algún programa de diseño como el Adobe InDesign. Por lo tanto, si bien el Abbyy FineReader nos puede ayudar mucho a generar un documento traducible, el resultado final no quedará exactamente igual al PDF de origen dado que, para conseguir eso, tendríamos que tener el archivo desde el cual se generó el PDF. Asimismo, no debemos olvidarnos de que la tarea de conversión de PDF a Word suele llevar un tiempo considerable si el documento original no es muy sencillo. Por eso, siempre recomiendo cobrar este proceso aparte de la traducción y, si es posible, solicitarle a un diseñador gráfico con experiencia en DTP o maquetación que nos realice la conversión a Word, sobre todo si el PDF es muy largo.

No hay comentarios: