Question 1

ハングル音節 — UnicodeにおけるB韓国語文字

Accepted Answer

## UnicodeにおけるBハングル音節

韓国語のハングルは、個々の文字コンポーネント（字母）から音節ブロックがアルゴリズム的に合成される点で、書記体系の中でユニークです。Unicodeは可能な全組み合わせをカバーする11,172個の合成済み音節（U+AC00〜U+D7AF）に大きなブロックを割り当てています。

### ハングルの合成式

各音節ブロックは以下で構成されます：
- 初声（L）：19通りの値（U+1100–U+1112）
- 中声（V）：21通りの値（U+1161–U+1175）
- 終声（T）：28通りの値（なしを含む）

コードポイントは以下で計算されます：

CP = 0xAC00 + (L × 21 + V) × 28 + T

例えば、한 (han) = 0xAC00 + (18 × 21 + 0) × 28 + 4 = U+D55C

### UTF-8エンコーディング

すべての合成済みハングル音節はUTF-8で3バイトを使用します：

- 가 (ga) = U+AC00 → UTF-8: EA B0 80
- 한 (han) = U+D55C →

Question 2

When is this useful?

Accepted Answer

韓国語テキスト処理、ハングル検索やソートアルゴリズムの実装、正規化の問題（NFC vs NFD）のデバッグ、韓国語コンテンツデータベースのストレージ要件の計算に使用します。

ハングル音節 — UnicodeにおけるB韓国語文字

詳細な説明