Question 1

テキストのバイトサイズ計算 — UTF-8、UTF-16、ASCII

Accepted Answer

## テキストのバイトサイズ計算

テキストのバイトサイズは使用する文字エンコーディングに完全に依存します。同じ文字列でも、UTF-8、UTF-16、ASCIIのどれでエンコードされるかによって、劇的に異なるストレージ量を占有する場合があります。

### JavaScriptでのバイトサイズ計算

TextEncoder APIは正確なUTF-8バイト数を提供します：

javascript
function getByteSize(text) {
  const encoder = new TextEncoder(); // デフォルトはUTF-8
  const encoded = encoder.encode(text);
  return encoded.byteLength;
}

複数のエンコーディングの場合：

javascript
function getByteSizes(text) {
  const utf8 = new TextEncoder().encode(text).byteLength;
  const utf16 = text.length * 2

Question 2

When is this useful?

Accepted Answer

データベースのストレージ要件を計算するバックエンド開発者は、適切なカラムタイプを選択するためにバイトサイズを使用します。APIフィールドのバイト対応制限を構築するフロントエンド開発者にも必要です。ログストレージコストを見積もるDevOpsエンジニアや、特定のエンコーディングでテキストデータを処理するETLパイプラインを設計するデータエンジニアも、正確なバイトサイズ計算に依存しています。

文字	UTF-8	UTF-16	ASCII
`A` (U+0041)	1バイト	2バイト	1バイト
`é` (U+00E9)	2バイト	2バイト	N/A
`世` (U+4E16)	3バイト	2バイト	N/A
絵文字 (U+1F600)	4バイト	4バイト	N/A

テキストのバイトサイズ計算 — UTF-8、UTF-16、ASCII

詳細な説明

テキストのバイトサイズ計算

JavaScriptでのバイトサイズ計算

エンコーディングの比較

UTF-8の可変幅エンコーディング

バイトサイズが重要な理由

BOM（バイトオーダーマーク）

ユースケース

試してみる — Word Counter

関連トピック