HTML段落タグからMarkdownテキストへの変換

HTML <p>段落タグがプレーンなMarkdownテキストにどのように変換されるかを学びます。空白の処理、複数段落、段落内の改行の保持方法を解説します。

Basic Conversion

詳細な説明

HTML段落からMarkdownへの変換

HTML段落はWebコンテンツの最も基本的な構成要素です。<p> タグからMarkdownへの変換は簡単で、タグが除去されテキスト内容が保持され、段落間に空行が挿入されます。

基本的な段落変換

<p>これは最初の段落です。</p>
<p>これは2番目の段落です。</p>

変換結果:

これは最初の段落です。

これは2番目の段落です。

Markdownでは段落は1つ以上の空行で区切られます。段落内の単一の改行は新しい段落を作成しません。

インライン要素の処理

段落内に <strong><em><a> などのインライン要素が含まれている場合、それらはMarkdownの同等表現に変換されます:

<p>これは<strong>重要</strong>で<em>強調された</em>テキストです。</p>

変換結果:

これは**重要**で*強調された*テキストです。

段落内の改行

HTML <br> タグはMarkdownでは行末の2つのスペースまたはバックスラッシュに変換されます。

空白の正規化

HTMLは複数の空白文字を1つのスペースに折りたたみます。変換時にも同じ正規化が適用され、<p> タグ内の余分なスペース、タブ、改行はMarkdown生成前に折りたたまれます。

ユースケース

段落変換はHTML-to-Markdownワークフローの基盤です。CMSからの静的サイトジェネレータへのブログ記事の移行、HTMLメールのプレーンテキストへの変換、ドキュメント用のWebページからの可読コンテンツの抽出に不可欠です。

試してみる — HTML to Markdown

フルツールを開く