Question 1

ASCII文字列の各エンコーディングでの長さ

Accepted Answer

## ASCII：最もシンプルなケース

純粋なASCII文字列（U+0000からU+007Fの文字）では、すべての長さ測定が一貫した予測可能な結果を返します。これがASCIIを文字列長の理解の出発点として最適にしています。

### 例の文字列

Hello, World!

### 長さの測定結果

| メトリック | 値 |
|-----------|---|
| JavaScript .length | 13 |
| コードポイント数 | 13 |
| 書記素クラスター数 | 13 |
| UTF-8バイト数 | 13 |
| UTF-16バイト数 | 26 |
| UTF-32バイト数 | 52 |

### なぜ（ほぼ）一致するのか

すべてのASCII文字はU+0080未満の単一のUnicodeコードポイントにマッピングされます。UTF-8ではこれらのコードポイントはそれぞれちょうど1バイトを必要とします。これはUTF-8がASCIIと後方互換性を持つように設計されたためです。つまり、純粋なASCIIではUTF-8バイト数=文字数です。

UTF-16では各文字が1つ

Question 2

When is this useful?

Accepted Answer

ASCII専用文字に制限された入力フィールド（ユーザー名、スラッグ、マシン識別子など）を検証する際、.lengthとUTF-8バイト数を安全に同一視できます。これはURLスラッグ、ファイル命名、プロトコルレベルの識別子で一般的です。

ASCII文字列の各エンコーディングでの長さ

詳細な説明

ASCII：最もシンプルなケース

例の文字列

長さの測定結果

なぜ（ほぼ）一致するのか

実用的な意味

ユースケース

試してみる — String Length Calculator

関連トピック

メトリック	値
JavaScript `.length`	13
コードポイント数	13
書記素クラスター数	13
UTF-8バイト数	13
UTF-16バイト数	26
UTF-32バイト数	52