[ Paquet source : html-text ]
Paquet : python3-html-text (0.5.2-2)
Liens pour python3-html-text
Ressources Debian :
- Rapports de bogues
- Developer Information
- Journal des modifications Debian
- Fichier de licence
- Suivis des correctifs pour Debian
Télécharger le paquet source html-text :
Responsable :
Ressources externes :
- Page d'accueil [github.com]
Paquets similaires :
extract text from HTML.
How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?
* Text extracted with html_text does not contain inline styles, javascript, comments and other text that is not normally visible to users; * html_text normalizes whitespace, but in a way smarter than .xpath('normalize-space()), adding spaces around inline elements (which are often used as block elements in html markup), and trying to avoid adding extra spaces for punctuation; * html-text can add newlines (e.g. after headers or paragraphs), so that the output text looks more like how it is rendered in browsers.
Autres paquets associés à python3-html-text
|
|
|
|
-
- dep: python3
- langage orienté objet interactif de haut niveau – version par défaut de Python 3
-
- dep: python3-lxml
- liaison Python pour les bibliothèques libxml2 et libxslt
Télécharger python3-html-text
Architecture | Taille du paquet | Espace occupé une fois installé | Fichiers |
---|---|---|---|
all | 9,0 ko | 38,0 ko | [liste des fichiers] |