Unicodeの通貨記号
ドル、ユーロ、ポンド、円、ルピー、ビットコインを含むUnicode通貨記号を探ります。コードポイント、UTF-8エンコーディング、Currency Symbolsブロックを解説します。
詳細な説明
Unicodeの通貨記号
Unicodeは複数のブロックに散在する通貨記号を含み、U+20A0–U+20CFに専用のCurrency Symbolsブロックがあります。これらの文字はUTF-8で1バイト(ASCIIのドル記号)から3バイトの範囲です。
一般的な通貨記号
| 記号 | コードポイント | UTF-8バイト | 名前 |
|---|---|---|---|
| $ | U+0024 | 24 | DOLLAR SIGN |
| £ | U+00A3 | C2 A3 | POUND SIGN |
| ¥ | U+00A5 | C2 A5 | YEN SIGN |
| € | U+20AC | E2 82 AC | EURO SIGN |
| ₹ | U+20B9 | E2 82 B9 | INDIAN RUPEE SIGN |
| ₿ | U+20BF | E2 82 BF | BITCOIN SIGN |
エンコーディングサイズ
ドル記号$は基本ラテン(ASCII)の一部でUTF-8でわずか1バイトです。ポンド£と円¥記号はLatin-1 Supplementブロックにあり2バイトを使用します。他のほとんどの通貨記号はCurrency Symbolsブロック(U+20A0–U+20CF)にあり3バイトを使用します。
円と人民元の曖昧さ
コードポイントU+00A5(YEN SIGN)は日本の円(¥)と中国の人民元(元)の両方に使用されます。実際には、日本語テキストではFULLWIDTH YEN SIGN(U+FFE5)が使用され、U+00A5は両方に対応します。コンテキストが意図する通貨を決定します。
コードでの通貨記号の使用
ソフトウェアで通貨を扱う場合、データストレージにはISO 4217通貨コード(USD、EUR、JPY)を使用し、ロケール設定に基づいて表示記号をローカライズすることを推奨します。Unicode Inspectorは異なる文字エンコーディングを持つシステム間でデータを転送する際に、通貨記号が正しくエンコードされているか確認するのに役立ちます。
ユースケース
金融アプリケーションでの通貨記号エンコーディング問題のデバッグ、コピー&ペーストされた通貨記号が正しいUnicode文字であることの確認、多言語データベースストレージにおける通貨記号のバイトオーバーヘッドの理解に使用します。