toutes les options
bullseye  ] [  bookworm  ] [  trixie  ] [  forky  ] [  sid  ]
[ Paquet source : pdfsandwich  ]

Paquet : pdfsandwich (0.1.7-3)

Liens pour pdfsandwich

Screenshot

Ressources Debian :

Télécharger le paquet source pdfsandwich :

Responsable :

Ressources externes :

Paquets similaires :

outil pour créer des fichiers PDF « sandwich » pour la ROC (OCR)

pdfsandwich génère des fichiers PDF « sandwich » ROC (en anglais, OCR), c’est-à-dire des fichiers PDF qui ne contiennent que des images (pas de texte) qui seront traités par une reconnaissance optique de caractères, et le texte sera ajouté à chaque page de manière invisible « derrière » les images. pdfsandwich est un outil en ligne de commande qui est supposé être utile pour la reconnaissance optique de caractères de livres ou journaux numérisés.

Il est capable de reconnaitre la disposition de la page même pour du texte sur plusieurs colonnes.

Essentiellement, pdfsandwich est un script enveloppe qui appelle les exécutables suivants : convert, unpaper, gs (seulement pour le redimensionnement de psd), hocr2pdf (pour tesseract < 3.03) et tesseract.

Autres paquets associés à pdfsandwich

  • dépendances
  • recommandations
  • suggestions
  • enhances

Télécharger pdfsandwich

Télécharger pour toutes les architectures proposées
Architecture Taille du paquet Espace occupé une fois installé Fichiers
amd64 441,7 ko1 619,0 ko [liste des fichiers]
arm64 480,4 ko1 951,0 ko [liste des fichiers]
ppc64el 457,5 ko1 887,0 ko [liste des fichiers]
riscv64 456,4 ko1 703,0 ko [liste des fichiers]
s390x 445,0 ko1 891,0 ko [liste des fichiers]