Question 1

データは安全ですか？

Accepted Answer

はい。すべてのエンコーディング検出はJavaScriptを使用してブラウザ内で完全に実行されます。データがサーバーに送信されることはありません。テキストとファイルは端末に留まります。

Question 2

貼り付けたテキストが常にUTF-8と表示されるのはなぜですか？

Accepted Answer

ブラウザのテキストエリアにテキストを貼り付けると、ブラウザが内部の文字列表現（UTF-16）に変換します。ツールがこの文字列を分析用のバイトにエンコードする際、常にUTF-8を生成するTextEncoder APIを使用します。ファイルの元のエンコーディングを検出するには、ファイルモードを使用してください。

Question 3

BOM（バイトオーダーマーク）とは何ですか？

Accepted Answer

BOMはファイルの先頭に配置される特殊なUnicode文字（U+FEFF）で、エンコーディングとバイト順序を示します。例えば、UTF-8のBOMは3バイトのシーケンス EF BB BF であり、UTF-16 LEのBOMは FF FE です。BOMが存在する場合、エンコーディングの検出は100%確実です。

Question 4

検出の精度はどの程度ですか？

Accepted Answer

検出精度はデータに依存します。BOM付きのファイルは100%の信頼度で検出されます。マルチバイト文字（アクセント付き文字、CJKなど）を含むUTF-8テキストは非常に高い精度です。短いASCIIのみの文字列はASCIIが多くのエンコーディングの有効なサブセットであるため曖昧になります。信頼度パーセンテージはヒューリスティック一致の強さを反映しています。

Question 5

ISO-8859-1とWindows-1252の違いは何ですか？

Accepted Answer

ISO-8859-1（Latin-1）とWindows-1252はともに西ヨーロッパ言語向けの1バイトエンコーディングです。バイト値0xA0-0xFFは同一ですが、0x80-0x9Fの範囲が異なります。ISO-8859-1はこれを制御文字にマッピングしますが、Windows-1252はカーリークォート、emダッシュ、ユーロ記号などの印刷可能文字にマッピングします。実際には、ISO-8859-1とラベル付けされた多くのファイルは実際にはWindows-1252です。

Question 6

大きなファイルを分析できますか？

Accepted Answer

はい。ファイルはArrayBufferとしてメモリに読み込まれ、JavaScriptで分析されます。数百メガバイトまでのファイルは問題なく動作します。非常に大きなファイルはブラウザの利用可能メモリによって制限される場合があります。16進ダンプはファイルサイズに関係なく最初の160バイトのみを表示します。

文字エンコーディング検出

このツールについて

使い方

よくある質問

関連ツール

Base64エンコード/デコード

文字列エスケープ/アンエスケープ

HTMLエンティティ変換

ハッシュ生成ツール

Unicode正規化ツール

ロケール文字列テスター