HTML段落タグからMarkdownテキストへの変換
HTML <p>段落タグがプレーンなMarkdownテキストにどのように変換されるかを学びます。空白の処理、複数段落、段落内の改行の保持方法を解説します。
Basic Conversion
詳細な説明
HTML段落からMarkdownへの変換
HTML段落はWebコンテンツの最も基本的な構成要素です。<p> タグからMarkdownへの変換は簡単で、タグが除去されテキスト内容が保持され、段落間に空行が挿入されます。
基本的な段落変換
<p>これは最初の段落です。</p>
<p>これは2番目の段落です。</p>
変換結果:
これは最初の段落です。
これは2番目の段落です。
Markdownでは段落は1つ以上の空行で区切られます。段落内の単一の改行は新しい段落を作成しません。
インライン要素の処理
段落内に <strong>、<em>、<a> などのインライン要素が含まれている場合、それらはMarkdownの同等表現に変換されます:
<p>これは<strong>重要</strong>で<em>強調された</em>テキストです。</p>
変換結果:
これは**重要**で*強調された*テキストです。
段落内の改行
HTML <br> タグはMarkdownでは行末の2つのスペースまたはバックスラッシュに変換されます。
空白の正規化
HTMLは複数の空白文字を1つのスペースに折りたたみます。変換時にも同じ正規化が適用され、<p> タグ内の余分なスペース、タブ、改行はMarkdown生成前に折りたたまれます。
ユースケース
段落変換はHTML-to-Markdownワークフローの基盤です。CMSからの静的サイトジェネレータへのブログ記事の移行、HTMLメールのプレーンテキストへの変換、ドキュメント用のWebページからの可読コンテンツの抽出に不可欠です。