csv ファイルについて
UB3/informatics/basics/text_files_csv
このページの最終更新日: 2024/09/30広告
概要: テキストファイルとは
csvファイルとは、カンマで区切られたテキストファイルのことである。
まずは、csv をちゃんと知るために、少しテスト。
Excel で以下のリストを作成し、CSV UTF-8 (Comma delimited) として保存。Comma や改行がどう扱われるかを知るために、西さんの「好きなもの」には全角の読点、南さんでは comma + 半角スペース、北さんでは comma + 半角スペース + セル内改行を入れた。
このファイルをいったん閉じて、Excel で開くとこうなる。ほとんど同じだが、C 列の行の幅という情報が失われていることがわかる。csv はテキストファイルなので、当然である。セル内改行は保持される。
cat コマンド で中身をみると、こうなっている。
- それぞれの列が「,」で区切られている。
- 「好きなもの」の列はダブルクオーテーション " " で囲まれており、そのため , が区切り文字にならない。
- 改行コードは表示されない。
- 最後の % は何?
改行コードまでみるために、改行コードのページ にあるように、od -c file とする。
- 改行は \r \n だが、セル内改行は \n なのか?
鉄則: csv ファイルは、ダブルクリックで開いてはいけない
多くのコンピューターでは、csv ファイルをダブルクリックすると Excel で開かれるような設定になっているだろう。しかし、
問題は、Excel の余計なお世話にある。Microsoft の十八番とも言えるが、ダブルクリックで開くと、セルの内容によっては Excel が勝手に計算してしまう。
たとえば、私は 文献の整理を csv を中心に行っている のだが、読んだ日付を 2018-04-27 のように保存している。これを Excel で開くと 4/27/18 などのように表示されてしまい、さらに、このまま csv として保存すると 4/27/18 の形に置き換わる。
まず Excel を立ち上げてからインポートすればこの問題は生じないようなので、Excel で開くときはそのようにする。
広告
References
コメント欄
サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。