すべてのオプション
bookworm  ] [  trixie  ] [  sid  ] [  experimental  ]
[ ソース: html-text  ]

パッケージ: python3-html-text (0.7.0-1.1)

python3-html-text に関するリンク

Screenshot

Debian の資源:

html-text ソースパッケージをダウンロード:

メンテナ:

外部の資源:

類似のパッケージ:

試験的な (experimental の) パッケージ

警告: このパッケージは experimental ディストリビューションのものです。つまり、おそらく不安定でバグがあり、それどころかデータの損失を起こすかもしれません。使用前には、変更履歴やその他の参照可能なドキュメントを必ず調べてください。

extract text from HTML.

How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?

 * Text extracted with html_text does not contain inline styles,
   javascript, comments and other text that is not normally visible to
   users;
 * html_text normalizes whitespace, but in a way smarter than
   .xpath('normalize-space()), adding spaces around inline elements (which
   are often used as block elements in html markup), and trying to avoid
   adding extra spaces for punctuation;
 * html-text can add newlines (e.g. after headers or paragraphs), so that
   the output text looks more like how it is rendered in browsers.

その他の python3-html-text 関連パッケージ

  • 依存
  • 推奨
  • 提案
  • enhances

python3-html-text のダウンロード

すべての利用可能アーキテクチャ向けのダウンロード
アーキテクチャ パッケージサイズ インストールサイズ ファイル
all 10.0 kB40.0 kB [ファイル一覧]