U+0300–U+036Fを超える結合マーク
Combining Diacritical Marks Extended、Combining Diacritical Marks Supplementなど、結合マークの拡張Unicodeブロックを探ります。
Technical
詳細な説明
拡張結合マークブロック
主要なCombining Diacritical Marksブロック(U+0300–U+036F)がZalgoテキストで最もよく使われますが、Unicodeは追加の結合文字ブロックを定義しています。
すべての結合マークブロック
| ブロック | 範囲 | 目的 |
|---|---|---|
| Combining Diacritical Marks | U+0300–U+036F | 標準的なアクセント、チルダ |
| Combining Diacritical Marks Extended | U+1AB0–U+1AFF | 中世・音声学マーク |
| Combining Diacritical Marks Supplement | U+1DC0–U+1DFF | 追加音声学マーク |
| Combining Diacritical Marks for Symbols | U+20D0–U+20FF | 数学記号 |
| Combining Half Marks | U+FE20–U+FE2F | 二重ダイアクリティクス |
Zalgo除去への影響
徹底的なZalgo除去正規表現はすべてのブロックをカバーすべきです:
// またはUnicodeプロパティを使用:
const COMBINING_MARKS_SAFE = /\p{Mn}/gu;
Unicodeプロパティエスケープ\p{Mn}の使用が最も将来性のあるアプローチです。
ユースケース
拡張結合マークブロックの知識は、包括的なUnicodeサニタイゼーションの構築、専門的な音声学転写を扱う言語学者、利用可能な結合文字の全範囲を使用してZalgo効果の多様性を最大化するのに重要です。