Hay
una categoría de programas que son fundamentales para el día a día: los programas de reconocimiento óptico de carácteres (OCR,
por sus siglas en inglés). Para los que no los conocen, este tipo de programas
cumplen la noble tarea de pasar a formato editable archivos de imagen (por
ejemplo, un acta de directorio que nos llegó en papel y la escaneamos para
luego pasarla a Word) o archivos PDF, que son los
que más dolores de cabeza nos dan.
Abbyy Fine Reader 12, el más destacado de todos los programas de OCR, nos convertirá instantáneamente una imagen o
un PDF a Word, pero si el resultado no es muy bueno porque el
documento original es complejo, nos permitirá decidir por nosotros mismos cómo
reconocer o leer el documento original antes de convertirlo al formato editable.
En esta nota,
veremos en cinco pasos cómo sacarle el máximo provecho a la herramienta, pero
primero aprenderemos rápido cómo hacer una conversión simple; es decir, si
tengo un archivo PDF o de imagen sin demasiadas
complicaciones, uso el Abbyy Fine Reader 12 para
convertirlo a Microsoft Word.
Este proceso es
relativamente sencillo: primero, abrimos el programa y, cuando nos aparezca el
cuadro de las diferentes tareas que podemos hacer con el FineReader,
seleccionamos Archivo de imagen o PDF a Microsoft Word (antes,
debemos asegurarnos de elegir el idioma correcto del documento para que el
reconocimiento sea más exacto). Después, elegimos el archivo que queremos
convertir a Word y listo. Esperamos unos instantes, y
el programa generará directamente un archivo de Word que podemos
guardar y usar.
Muy bien. Ya
conocemos los conceptos básicos. Ahora supongamos que el archivo de imagen (o PDF)
que tenemos que convertir es una imagen compleja con texto mezclado. Algo así
como esto:
Cuando hagamos el
procedimiento básico, es muy posible que el Word final que hayamos
generado con la herramienta no esté en buenas condiciones para trabajar. Por
esto es que necesitamos meter un poco de mano en la herramienta para generar un
archivo editable que nos permita traducir sin problemas. Veamos, entonces, los
cinco pasos para usar Abbyy Fine Reader 12 de
la manera más efectiva.
1. Abrimos el
programa y nos aparecerá el cuadro de tareas del que hablamos antes. Como ya se
aclaró, lo más importante antes de empezar es elegir el idioma el documento. La
versión más económica del Abbyy FR (la versión En
español) permite reconocer textos en francés, inglés, español,
alemán, italiano y portugués. Una vez elegido el idioma, hacemos clic en Archivo
de imagen o PDF a Microsoft Word. Acto seguido, seleccionamos
el archivo que queremos convertir.
2. De manera
automática, el programa intentará reconocer el archivo que le cargamos y nos
generará un archivo de Microsoft Word. En este
caso, como la imagen es muy compleja, el resultado no será bueno. Nos quedarán
palabras sin reconocer y marcadas como imágenes, y seguramente el formato no
será el más apropiado. Como el archivo de Word no nos sirve, lo
cerramos y volvemos al Abbyy FR.
3. De regreso en el
programa, veremos que la pantalla del programa tiene dos divisiones
principales: IMAGEN y TEXTO. En la división IMAGEN, vemos cómo el programa hizo
al reconocimiento del archivo que le cargamos. En la división TEXTO, vemos cuál
es el resultado de ese reconocimiento (e incluso podemos editar el texto antes
de convertirlo a Word). Como podemos notar en
esta captura, en la división IMAGEN vemos algunos cuadros rojos y otros verdes.
Ese es el reconocimiento óptico de carácteres que hizo el programa. A lo que
está de color rojo lo reconoció como imagen; a lo que está de color verde, como
texto. También podrían aparecernos cuadros de color azul; estos son elementos
que el programa reconoce como tabla.
Como el reconocimiento que nos
hizo el programa no nos sirvió, vamos a eliminar todo el trabajo hecho por el FineReader y
a hacerlo nosotros mismos. Para eso, hacemos clic con el botón derecho del
mouse sobre cualquier parte de la vista IMAGEN y seleccionamos Eliminar
todas las áreas y el texto.
Al hacer esto, veremos que a
la derecha nos aparecerá la leyenda «Página no reconocida». Ahora nos toca
meter mano a nosotros.
4. Lo que tendremos
que hacer en esta parte es indicarle al programa qué elementos de la imagen son
texto y qué elementos deben ser reconocidos como imagen. En este caso, como
tenemos una mezcla bastante común de texto e imagen, lo que nos convendrá hacer
es seleccionar todo como imagen para asegurarnos de no perdernos de ninguna
línea ni nada en particular y luego seleccionaremos una por una las palabras
dentro de la imagen como texto.
Para seleccionar en
la imagen partes de reconocimiento como texto y otras como imagen, usaremos la
barra que se ubica a la izquierda de la vista de IMAGEN:
Simplemente,
hacemos clic en el elemento que queremos usar y luego vamos dibujando cuadros
en el texto que queremos reconocer. Lo que yo hice a continuación fue primero
seleccionar el botón de Imagen y marcar a toda la imagen con un recuadro rojo.
Luego, seleccioné el botón de texto e hice un recuadro en cada una de las
partes que tiene texto.
Si en un lugar de
una imagen única hubiéramos cargado un PDF con varias páginas, debemos
ir página por página del PDF repitiendo los puntos 3 y 4 de
esta explicación antes de pasar al punto 5.
5. Luego de que le
indicamos al programa cómo queremos que reconozca el texto que le cargamos,
vamos a pedirle que lo haga. Haremos clic en el botón Leer que
se encuentra en la barra superior del programa.
Una vez leídas
todas las páginas del documento, terminaremos pidiéndole al programa que
convierta el archivo en un documento de Word. Para esto, haremos
clic en el botón Enviar que se encuentra
al lado del botón Leer que acabamos de
usar. El Abbyy Fine Reader generará así un archivo
de Word.
Si todo salió bien,
el programa nos generará un archivo de Word perfectamente editable. Si el
resultado sigue sin gustarnos, podemos cerrar el archivo de Word y
volver al Abbyy Fine Reader para volver a cambiarle
la forma en la que queremos que reconozca el archivo que le cargamos. Si bien
parece un software simple, el programa tiene muchas opciones que son interesantes
para explorar: por ejemplo, podemos cargar más de un documento en la etapa de
reconocimiento y generar un único archivo de Word a partir de varias
imágenes o varios documentos PDF. También, si
quisiéramos, podemos enviar a Word solo una página de
un documento largo. Para hacerlo, abrimos el documento en cuestión en el Abbyy
FR y en la parte de edición buscamos la página que
queremos convertir a Word, hacemos clic con el
botón derecho sobre ella y seleccionamos Enviar páginas seleccionadas a > Microsoft
Word.
Es muy importante
recordar que los archivos PDF fueron creados
previamente con algún programa de diseño como el Adobe InDesign. Por lo
tanto, si bien el Abbyy FineReader nos
puede ayudar mucho a generar un documento traducible, el resultado final no
quedará exactamente igual al PDF de origen dado que,
para conseguir eso, tendríamos que tener el archivo desde el cual se generó el PDF.
Asimismo, no debemos olvidarnos de que la tarea de conversión de PDF a Word suele
llevar un tiempo considerable si el documento original no es muy sencillo. Por
eso, siempre recomiendo cobrar este proceso aparte de la traducción y, si es
posible, solicitarle a un diseñador gráfico con
experiencia en DTP o maquetación que
nos realice la conversión a Word, sobre todo si el PDF es
muy largo.










No hay comentarios:
Publicar un comentario