Question 1

CJK統合漢字 — 中国語・日本語・韓国語の文字

Accepted Answer

## CJK統合漢字

CJK統合漢字ブロック（U+4E00〜U+9FFF）はUnicodeで最大のブロックの一つで、中国語、日本語（漢字）、韓国語（漢字）の書記体系で共有される20,000以上の文字を含みます。追加の拡張（Ext. A〜I）により総計は90,000漢字を超えます。

### 主要なCJKブロック

| ブロック | 範囲 | 数 | プレーン |
|-------|-------|-------|-------|
| CJK統合漢字 | U+4E00–U+9FFF | 約20,992 | BMP |
| CJK拡張A | U+3400–U+4DBF | 約6,592 | BMP |
| CJK拡張B | U+20000–U+2A6DF | 約42,720 | SIP（第2面） |
| CJK拡張C〜I | 各種 | 約50,000+ | SIP/TIP |

### UTF-8エンコーディング

メインCJKブロック（BMP）の文字はUTF-8で3バイトを使用します。例：

- 世 (世) = U+4E16 → UTF-8: E4 B8 96
- 字 (字) = U+

Question 2

When is this useful?

Accepted Answer

多言語データベースのストレージ要件の計算、CJKテキストの文字エンコーディング問題のデバッグ、中国語・日本語・韓国語コンテンツで文字列長とバイト長が大きく異なる理由の理解に使用します。

CJK統合漢字 — 中国語・日本語・韓国語の文字

詳細な説明

CJK統合漢字

主要なCJKブロック

UTF-8エンコーディング

漢字統合

実用上の影響

ユースケース

試してみる — Unicode Inspector

関連トピック

ブロック	範囲	数	プレーン
CJK統合漢字	U+4E00–U+9FFF	約20,992	BMP
CJK拡張A	U+3400–U+4DBF	約6,592	BMP
CJK拡張B	U+20000–U+2A6DF	約42,720	SIP（第2面）
CJK拡張C〜I	各種	約50,000+	SIP/TIP