U+0300–U+036Fを超える結合マーク

Combining Diacritical Marks Extended、Combining Diacritical Marks Supplementなど、結合マークの拡張Unicodeブロックを探ります。

Technical

詳細な説明

拡張結合マークブロック

主要なCombining Diacritical Marksブロック(U+0300–U+036F)がZalgoテキストで最もよく使われますが、Unicodeは追加の結合文字ブロックを定義しています。

すべての結合マークブロック

ブロック 範囲 目的
Combining Diacritical Marks U+0300–U+036F 標準的なアクセント、チルダ
Combining Diacritical Marks Extended U+1AB0–U+1AFF 中世・音声学マーク
Combining Diacritical Marks Supplement U+1DC0–U+1DFF 追加音声学マーク
Combining Diacritical Marks for Symbols U+20D0–U+20FF 数学記号
Combining Half Marks U+FE20–U+FE2F 二重ダイアクリティクス

Zalgo除去への影響

徹底的なZalgo除去正規表現はすべてのブロックをカバーすべきです:

// またはUnicodeプロパティを使用:
const COMBINING_MARKS_SAFE = /\p{Mn}/gu;

Unicodeプロパティエスケープ\p{Mn}の使用が最も将来性のあるアプローチです。

ユースケース

拡張結合マークブロックの知識は、包括的なUnicodeサニタイゼーションの構築、専門的な音声学転写を扱う言語学者、利用可能な結合文字の全範囲を使用してZalgo効果の多様性を最大化するのに重要です。

試してみる — Zalgo Text Generator

フルツールを開く