20.1. html — HyperText Markup Language のサポート¶
ソースコード: Lib/html/__init__.py
このモジュールは HTML を操作するユーティリティを定義しています。
-
html.escape(s, quote=True)¶ 文字列 s 内の
&、<、および>を HTML セーフなシーケンスに変換します。これらの文字を含む HTML を表示する必要がある場合に使用します。オプションフラグ quote が真の場合、文字 (") および (') も変換します。これは例えば<a href="...">など、引用符で括られている HTML 属性値を包含する時に役立ちます。バージョン 3.2 で追加.
-
html.unescape(s)¶ 文字列 s 中の名前や数字による参照 (e.g.
>,>,&x3e;) を全て対応するユニコード文字に変換します。この関数は HTML 5 標準規格で定められた規則を用います。対象は有効な文字参照および無効な文字参照、そしてlist of HTML 5 named character referencesです。バージョン 3.4 で追加.
html パッケージのサブモジュールは以下のとおりです:
html.parser– 許容性のあるモードを持つ HTML/XHTML パーサーhtml.entities– HTML 実体の定義
