A pesar de los considerables avances en la parte de hardware de los modelos más recientes de los escáneres «Do It Yourself», post-procesar imágenes en lotes, armar un libro digital y un flujo de trabajo consistente sigue siendo uno de los mayores desafíos. Hay varias razones que explican esta dificultad.

La primera es obvia: no se tratan de imágenes digitalizadas a través de un mecanismo que ya tiene incorporados ciertos valores de referencia sobre el tamaño del objeto físico (como los escáneres de cama plana o incluso los que tienen alimentadores automáticos de documentos). Por el contrario, se trata de una imagen tomada con una cámara de fotos, que no tiene valores de referencia sobre el tamaño del objeto físico y que no siempre puede tomar el tamaño exacto del libro. Esto tiene especial importancia para entender algunos conceptos como «los DPI», que vamos a ver luego. Mientras tanto, lo importante es que estas imágenes van a tomar cosas que no nos interesan, como bordes de la cuna sobre la cual estamos digitalizando, etcétera.

Por otra parte, hay dificultades propias de la digitalización de libros. Los libros, aunque parezcan todos iguales, no lo son. Es obvio decir que varían en tamaño y en cantidad de páginas, pero a veces esa variación puede significar que se obtengan mejores resultados con ciertos libros que con otros.

Es por eso que estas imágenes tienen que seguir un proceso posterior a la captura para quedar convertidas en un libro. En general, hay un montón de librerías y aplicaciones que resuelven la mayor parte de los pasos que se necesitan para post-procesar imágenes y convertirlas en un libro, pero muchas de estas herramientas asumen variables que a veces no se cumplen con los escáneres Do It Yourself y requieren cierto nivel de pericia con la computadora.

Vale la pena aclarar que estos pasos en general son estándar y son también los pasos que tienen que seguir máquinas tan complejas como los escáneres Kirtas, que por cierto también utilizan cámaras de fotos para digitalizar. La diferencia, por supuesto, es que Kirtas utiliza para post-procesar un software propietario llamado LIMB y desarrollado por I2S (otros proveedores de escáneres), que cuesta una buena cantidad de euros.

En concreto, ¿cuáles son los pasos para post-procesar un libro digitalizado con cámaras de fotos?  Vamos a asumir que lo estamos haciendo con dos cámaras de fotos:

  1. renombrar las imágenes;
  2. rotar las imágenes pares e impares;
  3. alinear las páginas;
  4. recortar los márgenes del libro;
  5. pasar a blanco y negro (opcional).

Estos pasos son simplemente para que las imágenes que obtuvimos puedan servir para armar un libro digital en el formato de nuestra preferencia (PDF, DjVU, etc.), puedan funcionar con un OCR y les podamos agregar metadatos. Por supuesto, nadie presupone que todas estas operaciones se aplicarán foto por foto, sino que por lo general se establecerán unos ciertos parámetros y

¿Qué implica cada uno de estos pasos?

Renombrar las imágenes

Las páginas del libro que digitalizamos con nuestras cámaras de fotos no siguen la lógica de las páginas del libro, sino que están nombradas con el sistema interno de la cámara para ponerle nombre a los archivos. Esto quiere decir que las imágenes que obtenemos para cada cámara sigue un orden secuencial de números, en general 0001, 0002, 0003, 0004. Esto quiere decir que las cámaras izquierda y derecha tienen el mismo número para nombrar distintas imágenes, pero nosotros necesitamos poder intercalar las imágenes de ambas cámaras para armar nuestras páginas pares e impares.

renombradas
Páginas pares e impares ya renombradas
captura-de-pantalla-de-2017-01-22-135524
Imágenes aún sin remobrar (divididas en carpetas pares e impares)

Rotar las páginas pares e impares

Las cámaras están puestas en posición horizontal con respecto a la hoja, siguiendo la orientación de la cuna del escáner. Por lo tanto, para las páginas pares vamos a obtener esto:

0014
Página par

y esto para las páginas impares:

0015
Página impar

Por lo tanto, páginas pares e impares requieren distintos grados de rotación (en sentido contrario a las agujas del reloj, 90 para las pares y 270 para las impares).

Alinear las páginas

A veces las páginas del libro aparecen ligeramente torcidas, como en este caso:

0022
Página ligeramente torcida

Este paso es distinto del paso de «antideformación». En algunos casos, si el libro es demasiado ancho y tenemos problemas para que se aplane en su totalidad contra el vidrio, o bien cuando nuestra solución para digitalizar dos o tres libros es totalmente casera (por ejemplo, porque es un escáner hecho con dos cámaras de fotos y una caja de cartón), las líneas de las páginas suelen deformarse hacia la cara externa de los márgenes (o hacia afuera), como en este ejemplo:

deformacion
No se nota especialmente, pero estas páginas están deformadas hacia afuera. La forma más fácil de notarlo es en la parte superior, donde el rojo de la tapa original se nota más hacia el margen izquierdo que hacia el margen derecho.

Corregir la alineación es infinitamente más fácil que corregir la deformación. En general, lo mejor es que podamos alinear nuestras páginas de manera previa al recorte de los márgenes.

Recortar los márgenes

Como habrán visto en las imágenes previas, aparecen unos bordes negros. Esos son los bordes de la cuna (el color variará según el tipo de cuna que nos hayamos hecho, si es una cuna de cartón, de madera pintada de negro, de madera sin pintar, etcétera), y obviamente necesitamos removerlos para obtener nuestro resultado final. Sin embargo, tres dificultades aparecen inmediatamente cuando analizamos esta operación:

  1. los márgenes de corte de las páginas pares están ubicados en un lugar diferente que el los márgenes de corte de las páginas impares (algo que no es tan terrible, pero que importa);
  2. los márgenes deben ser cortados de la misma manera tanto en las páginas pares o impares (de lo contrario, tendremos que unas páginas serán más pequeñas o más grandes que otras).

Hay una tercera dificultad, vinculada a nuestros dispositivos de digitalización, y es que no siempre la hoja se mantiene estable en su lugar (porque movimos el libro o se movió en alguna operación). Para resolver este problema, lo más simple es poner cinta vinílica sobre el vidrio o el acrílico de nuestro escáner de manera tal que siga los márgenes del libro, predeterminando de esta manera que nuestra área de corte será siempre igual, y que en caso de que el libro se mueva, lo podemos volver fácilmente a la posición que nos interesa.

Pasar a blanco y negro

Algunos libros, sobre todo si el sistema de iluminación de nuestro escáner no es muy bueno, van a requerir que los pasemos a blanco y negro. Esta es una operación opcional y es de las más fáciles.

En los próximos posts vamos a ver con qué herramientas realizamos cada una de estas operaciones.