ホワイトスペース可視化
テキストを貼り付けて不可視文字を表示 — スペース、タブ、改行、ゼロ幅文字、BOMなど。
このツールについて
ホワイトスペース可視化ツールは、テキストに隠れた不可視文字を 表示する無料のブラウザベースツールです。開発者なら誰もが、 印刷不可能な文字が原因の不可解なフォーマット問題に 遇遍したことがあるでしょう — スペースとタブの混在、 間違った改行コード、Webページからコピーされたゼロ幅 スペース、ファイル先頭の予期しないバイトオーダーマーク (BOM)など。このツールはこれらすべての文字を可視化し、 問題を素早く特定・修正できます。
可視化ツールは、各種の不可視文字をそれぞれ固有の可視マーカーに 置き換えます。通常のスペースは中黒点(·)に、タブは矢印 (→)に、ラインフィードは(↵)として表示され、 キャリッジリターンは(←)として表示されます。ゼロ幅 スペース、ゼロ幅ジョイナー、ノーブレークスペース、 ソフトハイフン、BOMなどの特殊文字も明確なラベル付き マーカーで表示されます。ツール上部のトグルボタンで 各文字タイプの表示・非表示を個別に切り替えられます。
可視化に加えて、統計パネルがテキスト内の各不可視文字を カウントし、改行コードの種類(LF、CRLF、または混在)を 検出します。クロスプラットフォームのテキスト処理の デバッグに非常に役立ちます。単語数や文字数のカウントが 必要な場合はWord & Character Counterを、 テキストの大文字・小文字変換には Text Case Converterを、 文字列のエスケープ・アンエスケープには String Escape/Unescapeをご利用ください。
クリーン機能では、削除したい不可視文字の種類を選択し、 ワンクリックでクリーニングを適用できます。ゼロ幅文字、 BOMの削除や改行コードの正規化に特に便利です。
すべての処理はブラウザ内で完結します。テキストがお使いの 端末から外に出ることはなく、サーバーとのやり取り、 ログ記録、サードパーティサービスの関与はありません。 ソースコード、設定ファイル、機密文書などの機密性の高い コンテンツでも安全に使用できます。
使い方
- 左側のText Inputパネルにテキストを貼り付けるか入力します。Sampleをクリックすると、各種の不可視文字を含むサンプルテキストを読み込めます。
- 右側のVisualization Outputパネルに、不可視文字が色分けされた可視マーカーに置き換えられたテキストが即座に表示されます。
- パネル上部のトグルボタンで特定の文字タイプ(Space、Tab、LF、CRLF、NBSP、ZWSなど)の表示・非表示を切り替えます。Show AllやHide Allで一括操作も可能です。
- パネル下のLine Endingsセクションで、テキストのLF、CRLF、または混在状態を確認します。
- Character Statisticsグリッドで、テキスト内の各不可視文字タイプのカウントを確認します。
- 不要な文字を削除するには、Clean Invisible Charactersセクションまでスクロールし、削除したい文字タイプをトグルしてからCleanをクリックします。
- Copy Cleanedをクリックしてクリーニング済みテキストをクリップボードにコピーするか、Ctrl+Shift+Cで可視化出力をコピーします。
人気のホワイトスペース可視化例
よくある質問
このツールで検出できる不可視文字は何ですか?
このツールは11種類の不可視文字を検出します:通常のスペース(U+0020)、タブ(U+0009)、ラインフィードLF(U+000A)、キャリッジリターンCR(U+000D)、CRLFペア、ノーブレークスペースNBSP(U+00A0)、ゼロ幅スペースZWS(U+200B)、ゼロ幅ジョイナーZWJ(U+200D)、ゼロ幅ノンジョイナーZWNJ(U+200C)、ソフトハイフンSHY(U+00AD)、バイトオーダーマークBOM(U+FEFF)。
ファイルの混在改行コードを修正するには?
テキストをツールに貼り付け、Line Endingsセクションで混在を確認します。次にCleanセクションでCRLF(またはCR)を選択し、Cleanをクリックします。これによりすべての改行コードがLFに正規化されます。ツールは適用前に何が削除されるかを正確に表示します。
ゼロ幅スペースとは何ですか?なぜ問題になるのですか?
ゼロ幅スペース(U+200B)は、見た目の幅を持たないがテキストデータ内に存在する不可視のUnicode文字です。Webページやリッチテキストエディタからコピーされることがよくあります。文字列比較、正規表現、URL解析、コードコンパイルを壊す可能性があります。ツールは[ZWS]としてマークするので正確な位置が分かり、クリーン機能でワンクリック削除できます。
BOMとは何ですか?いつ削除すべきですか?
BOM(バイトオーダーマーク、U+FEFF)はエンコーディングのバイトオーダーを示すためにテキストファイルの先頭に置かれるUnicode文字です。UTF-16やUTF-32では有用ですが、UTF-8ファイルではシェルスクリプト、HTTPヘッダー、JSONパース、PHP出力などの問題を引き起こす可能性があります。ツールは[BOM]マーカーで表示するので、必要に応じて特定・削除できます。
コードや設定ファイルのデバッグに使えますか?
はい。このツールは特にYAML、Python、Makefile、その他のホワイトスペースに敏感なフォーマットのデバッグに役立ちます。タブとスペースの混在検出、通常のスペースに見えるが構文エラーを引き起こすノーブレークスペースの発見、文字列比較を壊す隠れたゼロ幅文字の特定ができます。
データは安全ですか?
はい。すべての処理はJavaScriptを使用してブラウザ内で完全に実行されます。データがサーバーに送信されることはありません。ツール使用中にブラウザの開発者ツールのネットワークタブで確認できます。
マーカーの色分けは何を意味しますか?
各文字タイプには固有の色があります:スペースは青、タブはシアン、改行コード(LF、CR、CRLF)は緑、ノーブレークスペースは黄、ゼロ幅文字(ZWS、ZWJ、ZWNJ)は赤、ソフトハイフンは紫、BOMはオレンジです。この色分けにより、テキストを素早くスキャンして異なる種類の不可視文字を簡単に識別できます。
関連ツール
文字数カウンター
単語数、文字数、文数、段落数のカウントと読了時間の推定、キーワード頻度分析を行います。
テキストケース変換
camelCase、PascalCase、snake_case、kebab-caseなどの命名規則間でテキストを変換します。
文字列エスケープ/アンエスケープ
JSON、JavaScript、HTML、URL、SQL、CSV形式の文字列をエスケープ・アンエスケープします。
差分ビューア
2つのテキストを行単位・文字単位の差分ハイライトで並べて比較します。
Unicode文字インスペクター
Unicode文字のコードポイント、UTF-8/UTF-16エンコーディング、文字名、カテゴリ、ブロック情報を表示します。
文字列長計算ツール
文字数、コードポイント数、書記素クラスタ数、UTF-8/UTF-16/UTF-32のバイトサイズで文字列の長さを計算します。