tüm seçenekler
bookworm  ] [  trixie  ] [  sid  ] [  experimental  ]
[ Kaynak: html-text  ]

Paket: python3-html-text (0.7.0-1.1)

python3-html-text için bağlantılar

Screenshot

Debian Kaynakları:

html-text Kaynak Paketini İndir:

Geliştirici:

Dış Kaynaklar:

Benzer paketler:

Deneysel paket

Uyarı: Bu paket deneysel dağıtımdan geliyor. Bu, paketin kararsız veya hatalı olabileceği hatta veri kaybına sebep olabileceği anlamına gelmektedir. Lütfen kullanmadan önce değişim günlüğüne ve muhtemel diğer belgelendirmeye danıştığınızdan emin olun.

extract text from HTML.

How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?

 * Text extracted with html_text does not contain inline styles,
   javascript, comments and other text that is not normally visible to
   users;
 * html_text normalizes whitespace, but in a way smarter than
   .xpath('normalize-space()), adding spaces around inline elements (which
   are often used as block elements in html markup), and trying to avoid
   adding extra spaces for punctuation;
 * html-text can add newlines (e.g. after headers or paragraphs), so that
   the output text looks more like how it is rendered in browsers.

python3-html-text ile İlgili Diğer Paketler

  • bağımlılıklar
  • tavsiye edilen
  • önerilen
  • enhances

python3-html-text indir

Tüm mevcut mimariler için indir
Mimari Paket Boyutu Kurulu Boyut Dosyalar
all 10,0 kB40,0 kB [dosya listesi]