Question 1

Unicode正規化のベストプラクティス

Accepted Answer

## Unicode正規化のベストプラクティス

### ルール1: 早期に正規化する

システムへの入力時点でテキストを正規化：フォーム送信ハンドラー、APIリクエスト解析、ファイルコンテンツ読み込み、データベースクエリパラメーター。

### ルール2: 1つの形式を選び一貫性を保つ

- NFC — 保存と一般使用（W3C推奨）
- NFKC — 検索インデックスとセキュリティに敏感な比較
- 同じシステムで形式を混在させない

### ルール3: 比較前に正規化する

javascript
// 良い
if (input.normalize('NFC') === stored.normalize('NFC')) { ... }

### ルール4: ハッシュ前に正規化する

正規化されていないテキストの暗号ハッシュは等価な文字列で異なります。

### ルール5: 正規化ポリシーを文書化する

### ルール6: 実際のUnicodeデータでテストする

テストケースに含める：合成済み/分解済み形式、複数マーク付き結合文字、韓国語ハングル、全角/半角文字、互換文字（合字、分数

Question 2

When is this useful?

Accepted Answer

新しいプロジェクトのUnicode処理標準を確立するエンジニアリングチーム、または既存システムの正規化問題を監査するための実践的チェックリストです。国際化アプリケーションのコードレビューやアーキテクチャ設計の議論で特に価値があります。

Unicode正規化のベストプラクティス

詳細な説明