WordPress HTMLコンテンツからクリーンなMarkdownへの変換

WordPress生成HTML(wp-blockクラス、Gutenbergブロック、ショートコード、埋め込みメディア)をクリーンなMarkdownに変換する方法。WordPress移行の実践ガイド。

Real-World HTML

詳細な説明

WordPress HTMLからMarkdownへの変換

WordPressは特定のパターンでHTMLを生成します — Gutenbergブロックラッパー、wp-block-* クラス、インラインスタイル、ショートコード、埋め込みメディアなど。クリーンなMarkdownへの変換にはこれらのパターンの理解が必要です。

Gutenbergブロックラッパー

Gutenbergブロックコメント(<!-- wp:... -->)と wp-block-* クラスは変換時に除去されます。

WordPress画像ブロック

<figure><figcaption> が処理され、画像とキャプションテキストが抽出されます。

ショートコード

[gallery][embed][contact-form] のようなWordPressショートコードにはMarkdownの同等表現がありません。通常、そのまま保持されるか、除去されるか、プレースホルダーコメントに置き換えられます。

WordPress埋め込み

埋め込みコンテンツはプレーンURLまたはMarkdownリンクに変換されます。

クラシックエディタのコンテンツ

Classic Editorからの古いWordPressコンテンツはGutenbergラッパーなしの単純なHTMLを使用しており、標準的なHTML-to-Markdownルールで変換がより簡単です。

ユースケース

WordPressはWebの40%以上を占めており、WordPressからMarkdownへの変換は最も一般的な移行シナリオの一つです。チームはパフォーマンスと開発者体験のためにWordPressから静的サイトジェネレータ(Hugo、Jekyll、Astro)に移行する際、信頼性の高いHTML-to-Markdown変換を必要とします。

試してみる — HTML to Markdown

フルツールを開く