HTML太字・斜体からMarkdown強調構文への変換
HTML <strong>、<b>、<em>、<i>タグをMarkdownの太字(**)と斜体(*)構文に変換する方法を解説。ネストされた強調、太字斜体の組み合わせ、エッジケースを含みます。
Text Formatting
詳細な説明
HTML太字・斜体からMarkdownへの変換
HTMLでは <strong> / <b> が太字、<em> / <i> が斜体に使用されます。Markdownではそれぞれダブルアスタリスク(**)とシングルアスタリスク(*)にマッピングされます。
太字変換
<strong> と <b> の両方が ** ラッパー付きの同じMarkdown出力を生成します。HTMLでは意味的に異なりますが(<strong> は重要性、<b> はプレゼンテーション的)、Markdownではこれらを区別しません。
斜体変換
<em> と <i> の両方がシングルアスタリスク * ラッパーに変換されます。
太字と斜体の組み合わせ
<p>これは<strong><em>太字かつ斜体</em></strong>テキストです。</p>
変換結果:
これは***太字かつ斜体***テキストです。
エッジケース
- 空のタグ:
<strong></strong>は出力なし(空の****にしない)。 - 空白:
<strong> テキスト </strong>— 前後のスペースはマーカーの外に移動。 - 単語内のインライン: アスタリスクが単語の途中に出現する場合のあいまいさを避けるため、一部のコンバーターは斜体にアンダースコア(
_)を使用。
ユースケース
太字と斜体の変換はほぼすべてのHTML-to-Markdown移行に必要です。CMSコンテンツ、リッチテキストエディタの出力、Webページからコピーしたhtml変換時に、Markdownが元の視覚的・意味的な強調を保持することを保証します。