/libros escane_dos

Scanner house for fun and piracy

Este es mi primer libro escaneado desde 0, si bien ya había editado otros o pasado ocr a algunos pdf de por ahí, nunca había maquetado uno.

Scanner-1

Scanner-1

Scanner-1

En una carpeta “out” scantailor te copia el resutado de su proceso y todas las imágenes estan en formato .tif

luego como las cajas que hice a mano era un poco diferentes (por lo tanto el output de las imágenes de scantailor no eran todas iguals) con el siguiente comando las ajuste a todas a 1000px de ancho mogrify -resize 1000 *.tif

con mogrify es posible cambiarle el formato a las imágenes, yo las pasé a png para que pesen menos.

mogrify -format jpg *.tif

con imagemagick instalado use convert para crear un pdf con todas las imágenes convert *.jpg shanzhai.pdf

instale ocrmypdf para poder generar una capa con los caractéres y poder seleccionar el texto sudo dnf/apt install ocrmypdf y luego ejecuté ocrmypdf ./shanzhai.pdf ./shanzhai-ocr.pdf

Shanzhai byung-chul han : El arte de la falsificación y la deconstrucción en china

magnet de shanzhai

última edición 01 Oct 2020 by librenauta