フィールド値内のエスケープされた引用符の処理
TSVからCSVへの変換時に、フィールド値内のダブルクォートがRFC 4180のダブルクォートエスケープ方式でどのように処理されるかを学びます。
Quoting Rules
詳細な説明
フィールド内のエスケープされた引用符
フィールド値自体にダブルクォート文字が含まれる場合、解析エラーを避けるために適切なエスケープが不可欠です。RFC 4180では、引用符で囲まれたフィールド内のダブルクォートは二重にしてエスケープすると定められています。
エスケープの仕組み
エスケーププロセスは以下のステップに従います:
- 検出: コンバーターが各フィールド内の引用符文字をスキャン
- 囲み: 引用符が見つかると、フィールド全体をダブルクォートで囲む
- エスケープ: 各内部ダブルクォートを二重ダブルクォート(
"")に置換
このコンバーターは、引用符で始まるフィールド、引用符で終わるフィールド、引用符のみを含むフィールドなど、すべてのエッジケースを正しく処理します。
ユースケース
引用符を含む製品カタログ、ユーザー生成コンテンツ、テキストデータ(インチ単位の測定値、会話、コードスニペットなど)をTSVとCSV形式間で変換する場合。