ネットショップ系の仕事をしていると、商品データやら在庫データやらの膨大なデータを扱う事になる訳だが、データベースに食わせる前段階で下ごしらえするのに、Excelは欠かせないツールとも言える。

しかーし、ケースバイケースだが、テキストエディタの方がExcelよりももっと柔軟に対応出来る場面も多く、結局組み合わせて作業をする事にするか、ルーチンとなる場合は、MS-AccessやFileMakerなどで作ったデータベースシステム(ツール)にいったんインポートして、処理をした後にエクスポートで再びCSV形式とすることになる。このCSVファイルをモールにアップロードして商品情報などを更新させる訳だ。システムの初期データとしてもCSVで流し込む方が効率が良くて現実的。

そんな訳で、ここんところCSVファイルの整形作業が多くなっており、どうやったら効率が上がるかなぁと考えてみたりした。以前、郵便番号データがExcelの読み込み限界を超えていて処理が出来なかった時awkを使ったのを思い出し、もうちょっと詳しく調べてみたところ、awkでスクリプトを書けばかなり柔軟な事が出来ることが判明した(本気でやればプログラミングとも言えるだろう)。正規表現ももちろん使えるしデータの整形にかなり有効なのではないかと思われる。

ネット上にも色々なノウハウは紹介されているが概念的なところから理解したいので本が欲しい。awkを学ぶのに最適な本は無いのかな?と思ったら評判の良いロングセラーな本「AWKを256倍使うための本」が見つかった。内容的に目新しさは無いらしいが要点を押させている良本として評判が高いらしい。これは買いかな。


AWKを256倍使うための本 (Ascii 256倍)AWKを256倍使うための本 (Ascii 256倍)
著者:志村 拓
ASCII(1993-08)
販売元:Amazon.co.jp
クチコミを見る
sed & awkプログラミング 改訂版sed & awkプログラミング 改訂版
著者:Dale Dougherty
オライリー・ジャパン(1997-10-01)
販売元:Amazon.co.jp
クチコミを見る
プログラミング言語AWK (新紀元社情報工学シリーズ)プログラミング言語AWK (新紀元社情報工学シリーズ)
著者:P. J. ワインバーガー
新紀元社(2004-01)
販売元:Amazon.co.jp
クチコミを見る