TSV/CSVでの複数行セル値の処理
セル値内に改行を含むデータをTSVとCSV間で変換。引用符フィールドがセル内の改行を保持する仕組みを解説します。
Special Characters
詳細な説明
複数行セル値
CSV/TSV解析で最も難しい側面の一つは、行間の区切りではなくフィールド値内に現れる改行文字の処理です。適切に実装されたパーサーは、行区切りの改行とフィールド値の一部である改行を区別する必要があります。
複数行フィールドのルール
- 引用符が必要: 改行文字を含むフィールドは引用符で囲む必要があります
- パーサー状態: パーサーは引用符フィールド内かどうかを追跡し、引用符内の改行は行を終了しません
- 保持: 正確な改行文字(\n、\r\n、\r)がそのままフィールド内に保持されます
ユースケース
住所データベース、顧客記録、コンテンツ管理システムのエクスポートなど、住所、説明、メモなどの複数行テキストを含むフィールドを変換する場合。