Question 1

Unicode Inspectorはどのような情報を表示しますか？

Accepted Answer

各文字について、レンダリングされた文字、Unicodeコードポイント（U+XXXX）、UTF-8バイトシーケンス（16進数）、UTF-16コードユニット（16進数）、Unicode文字名、一般カテゴリ（文字、数字、句読点、記号、区切り文字、制御文字、その他）、Unicodeブロック名、UTF-8バイト数を表示します。サマリー統計には、文字数、コードポイント数、UTF-8バイト数、UTF-16バイト数、ユニーク文字数の合計が含まれます。

Question 2

絵文字や補助文字はどのように処理されますか？

Accepted Answer

ツールはJavaScriptのUnicode対応文字列イテレーション（Symbol.iterator）を使用して、UTF-16でサロゲートペアが必要な場合でも、テキストを個別のUnicodeコードポイントに正しく分割します。例えば、地球儀の絵文字（U+1F30D）は、4バイトのUTF-8エンコーディングと2つのUTF-16コードユニットを持つ単一の文字として表示されます。

Question 3

特定のコードポイントを検索できますか？

Accepted Answer

はい。検索バーにU+XXXX形式のコードポイント（例：アキュートアクセント付きeのU+00E9）、0xプレフィックス付き16進数値、または10進数を入力できます。文字名、カテゴリ、Unicodeブロック名でも検索できます。

Question 4

UTF-8バイトとUTF-16コードユニットの違いは何ですか？

Accepted Answer

UTF-8は文字ごとに1〜4バイトを使用します。ASCII文字は1バイト、ほとんどのヨーロッパのアクセント付き文字は2バイト、CJK漢字は3バイト、絵文字は4バイトです。UTF-16は2または4バイト（それぞれ16ビットの1または2コードユニット）を使用します。基本多言語面（U+0000〜U+FFFF）の文字は1コードユニットを使用し、U+FFFFを超える補助文字は2コードユニットのサロゲートペアを使用します。

Question 5

文字名はどの程度正確ですか？

Accepted Answer

ツールにはASCII文字、一般的な句読点、通貨記号、特殊Unicode文字（ゼロ幅スペース、BOMなど）をカバーする組み込みルックアップテーブルと、CJK、ひらがな、カタカナ、ハングル、絵文字のUnicodeブロック範囲から生成された名前が含まれています。あまり一般的でない文字には、コードポイントとブロックに基づく説明的な名前が提供されます。

Question 6

データは安全ですか？

Accepted Answer

はい。文字解析にはJavaScriptのString.prototype[Symbol.iterator]()、UTF-8バイト計算にはTextEncoder、Unicode名前検索にはバンドルされたルックアップテーブルを使用しています。サーバーへのデータ送信、外部API呼び出しはなく、テキストがブラウザタブの外に出ることはありません。

Question 7

エンコーディングの問題のデバッグに使えますか？

Accepted Answer

もちろんです。このツールは不可視文字（ゼロ幅スペース、バイトオーダーマーク、ノーブレークスペース）、文字化け（誤ってデコードされたテキスト）、データファイル内の予期しない文字の特定に最適です。UTF-8バイト表示により、文字が期待通りにエンコードされているか確認できます。

Unicode Inspector

このツールについて

使い方

Unicode Inspectorの人気の例

よくある質問

関連ツール

文字数カウンター

文字列エスケープ/アンエスケープ

テキストケース変換

ASCII/Unicode一覧表

Base64エンコード/デコード

空白文字ビジュアライザー

文字列長計算ツール

Unicode正規化ツール

ロケール文字列テスター

言語コードリファレンス