toutes les options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Paquet source : pdfsandwich  ]

Paquet : pdfsandwich (0.1.7-2)

Liens pour pdfsandwich

Screenshot

Ressources Debian :

Télécharger le paquet source pdfsandwich :

Responsable :

Ressources externes :

Paquets similaires :

outil pour créer des fichiers PDF « sandwich » pour la ROC (OCR)

pdfsandwich génère des fichiers PDF « sandwich » ROC (en anglais, OCR), c’est-à-dire des fichiers PDF qui ne contiennent que des images (pas de texte) qui seront traités par une reconnaissance optique de caractères, et le texte sera ajouté à chaque page de manière invisible « derrière » les images. pdfsandwich est un outil en ligne de commande qui est supposé être utile pour la reconnaissance optique de caractères de livres ou journaux numérisés.

Il est capable de reconnaitre la disposition de la page même pour du texte sur plusieurs colonnes.

Essentiellement, pdfsandwich est un script enveloppe qui appelle les exécutables suivants : convert, unpaper, gs (seulement pour le redimensionnement de psd), hocr2pdf (pour tesseract < 3.03) et tesseract.

Autres paquets associés à pdfsandwich

  • dépendances
  • recommandations
  • suggestions
  • enhances

Télécharger pdfsandwich

Télécharger pour toutes les architectures proposées
Architecture Taille du paquet Espace occupé une fois installé Fichiers
amd64 330,3 ko1 299,0 ko [liste des fichiers]
arm64 373,1 ko1 542,0 ko [liste des fichiers]
armhf 305,3 ko869,0 ko [liste des fichiers]
i386 316,3 ko1 113,0 ko [liste des fichiers]
ppc64el 360,6 ko1 551,0 ko [liste des fichiers]
s390x 333,7 ko1 476,0 ko [liste des fichiers]