Unicodeの通貨記号

ドル、ユーロ、ポンド、円、ルピー、ビットコインを含むUnicode通貨記号を探ります。コードポイント、UTF-8エンコーディング、Currency Symbolsブロックを解説します。

Special Characters

詳細な説明

Unicodeの通貨記号

Unicodeは複数のブロックに散在する通貨記号を含み、U+20A0–U+20CFに専用のCurrency Symbolsブロックがあります。これらの文字はUTF-8で1バイト(ASCIIのドル記号)から3バイトの範囲です。

一般的な通貨記号

記号 コードポイント UTF-8バイト 名前
$ U+0024 24 DOLLAR SIGN
£ U+00A3 C2 A3 POUND SIGN
¥ U+00A5 C2 A5 YEN SIGN
U+20AC E2 82 AC EURO SIGN
U+20B9 E2 82 B9 INDIAN RUPEE SIGN
U+20BF E2 82 BF BITCOIN SIGN

エンコーディングサイズ

ドル記号$は基本ラテン(ASCII)の一部でUTF-8でわずか1バイトです。ポンド£と円¥記号はLatin-1 Supplementブロックにあり2バイトを使用します。他のほとんどの通貨記号はCurrency Symbolsブロック(U+20A0–U+20CF)にあり3バイトを使用します。

円と人民元の曖昧さ

コードポイントU+00A5(YEN SIGN)は日本の円(¥)と中国の人民元(元)の両方に使用されます。実際には、日本語テキストではFULLWIDTH YEN SIGN(U+FFE5)が使用され、U+00A5は両方に対応します。コンテキストが意図する通貨を決定します。

コードでの通貨記号の使用

ソフトウェアで通貨を扱う場合、データストレージにはISO 4217通貨コード(USD、EUR、JPY)を使用し、ロケール設定に基づいて表示記号をローカライズすることを推奨します。Unicode Inspectorは異なる文字エンコーディングを持つシステム間でデータを転送する際に、通貨記号が正しくエンコードされているか確認するのに役立ちます。

ユースケース

金融アプリケーションでの通貨記号エンコーディング問題のデバッグ、コピー&ペーストされた通貨記号が正しいUnicode文字であることの確認、多言語データベースストレージにおける通貨記号のバイトオーバーヘッドの理解に使用します。

試してみる — Unicode Inspector

フルツールを開く