[ Источник: ocrmypdf ]
Пакет: ocrmypdf (16.3.1+dfsg1-1)
Ссылки для ocrmypdf
Ресурсы Debian:
- Сообщения об ошибках
- Developer Information
- Debian журнал изменений
- Файл авторских прав
- Отслеживание заплат Debian
Исходный код ocrmypdf:
- [ocrmypdf_16.3.1+dfsg1-1.dsc]
- [ocrmypdf_16.3.1+dfsg1.orig.tar.xz]
- [ocrmypdf_16.3.1+dfsg1-1.debian.tar.xz]
Сопровождающие:
Внешние ресурсы:
- Сайт [github.com]
Подобные пакеты:
добавление текстового слоя OCR в файлы PDF
OCRmyPDF создаёт файл PDF/A с возможностью поиска из обычного файла PDF, содержащего только изображения.
Программа использует систему оптического распознавания символов (OCR) Tesseract, поэтому возможно использовать для распознавания все языки поддерживаемые этой системой.
Основные особенности:
* Аккуратное размещение текста за изображением для копирования текста в буфер обмена * Сохранение точного разрешения оригинальных встроенных изображений * При возможности, добавление OCR-информации операцией не допускающей потерь, без перевода векторной графики в растровую * Размер файла практически не изменяется * Возможность компенсации наклона и/или очистки изображения перед распознаванием текста * Проверка входного и выходного файлов * Режим отладки для упрощения проверки результата распознавания текста * Параллельная обработка страниц при наличии более одного ядра процессора * Проверено боем на тысячах файлов PDF, комплекте тестов и непрерывной интеграцией
Другие пакеты, относящиеся к ocrmypdf
|
|
|
|
-
- dep: ghostscript (>= 9.18~dfsg~)
- interpreter for the PostScript language and for PDF
-
- dep: icc-profiles-free
- ICC color profiles for use with color profile aware software
-
- dep: python3
- интерактивный высокоуровневый объектно-ориентированный язык (версия python3 по умолчанию)
-
- dep: python3-coloredlogs
- colored terminal output for Python 3's logging module
-
- dep: python3-deprecation
- Library to handle automated deprecations
-
- dep: python3-hypothesis
- advanced Quickcheck style testing library for Python 3
-
- dep: python3-img2pdf (>= 0.3.0)
- Lossless conversion of raster images to PDF (library)
-
- dep: python3-packaging
- core utilities for python3 packages
-
- dep: python3-pdfminer (>= 20181108+dfsg-3)
- PDF parser and analyser (Python3)
-
- dep: python3-pikepdf (>= 8.14.0)
- Python library to read and write PDFs with QPDF
-
- dep: python3-pil
- библиотека для работы с растровой графикой (Python3)
-
- dep: python3-pkg-resources
- обнаружение пакетов и доступ к ресурсам через pkg_resources
-
- dep: python3-pluggy
- plugin and hook calling mechanisms for Python 3
-
- dep: python3-reportlab
- ReportLab library to create PDF documents using Python3
-
- dep: python3-rich
- render rich text, tables, progress bars, syntax highlighting, markdown and more
-
- dep: tesseract-ocr (>= 4.0.0)
- консольная утилита для распознавания текста
-
- dep: zlib1g
- библиотека сжатия
-
- rec: jbig2
- encoder for JBIG2 - command-line tool
-
- rec: pngquant
- PNG (Portable Network Graphics) image optimising utility
-
- rec: unpaper
- инструмент постобработки сканированных страниц
-
- sug: img2pdf
- Lossless conversion of raster images to PDF
-
- sug: ocrmypdf-doc
- add an OCR text layer to PDF files - documentation
-
- sug: python-watchdog
- Пакет недоступен
Загрузка ocrmypdf
Архитектура | Размер пакета | В установленном виде | Файлы |
---|---|---|---|
all | 172,4 Кб | 680,0 Кб | [список файлов] |